Monitoring

Accéder aux métriques et tableaux de bord avec Prometheus et Grafana

Siovos déploie une stack de monitoring pour vous aider à suivre la santé et les performances de votre infrastructure.

Vue d'ensemble#

La stack de monitoring se compose de deux services :

Prometheus

Collecte et stocke les métriques de vos services. Scrape automatiquement les composants Kubernetes, pods et tout service exposant un endpoint /metrics.

Grafana

Visualise les métriques via des tableaux de bord. Livré pré-configuré avec des dashboards pour Kubernetes, les nodes et les services principaux.

Accéder à Grafana#

Après le déploiement, Grafana est disponible à :

  • URL : https://grafana.{suffix}
  • Utilisateur : admin
  • Mot de passe : Défini lors du déploiement (voir Siovos Desktop)

N'oubliez pas de vous connecter au VPN et d'installer le certificat racine avant d'accéder à Grafana.

Tableaux de bord pré-installés#

Grafana est livré avec plusieurs dashboards prêts à l'emploi :

DashboardDescription
Kubernetes / ClusterSanté globale du cluster et utilisation des ressources
Kubernetes / NodesCPU, mémoire, disque, réseau par node
Kubernetes / PodsMétriques au niveau des pods et consommation des ressources
Node ExporterMétriques détaillées du système hôte

Pour accéder aux dashboards : DashboardsBrowse → Sélectionnez un dossier.

Ajouter des dashboards personnalisés#

Vous pouvez importer des dashboards additionnels depuis la bibliothèque Grafana :

  1. Trouvez un ID de dashboard sur grafana.com (ex: 1860 pour Node Exporter Full)
  2. Dans Grafana : DashboardsImport
  3. Entrez l'ID du dashboard
  4. Sélectionnez votre source de données Prometheus
  5. Cliquez sur Import

Monitorer vos applications#

Pour exposer les métriques de vos propres applications :

  1. Ajoutez un endpoint /metrics à votre app (en utilisant les bibliothèques client Prometheus)
  2. Créez une ressource ServiceMonitor pour indiquer à Prometheus de la scraper

Exemple de ServiceMonitor :

apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
  name: my-app
  namespace: my-namespace
  labels:
    release: prometheus
spec:
  selector:
    matchLabels:
      app: my-app
  endpoints:
    - port: http
      path: /metrics
      interval: 30s

Le label release: prometheus est requis pour que Prometheus découvre votre ServiceMonitor.

Alertes#

Prometheus inclut Alertmanager pour envoyer des notifications quand quelque chose ne va pas. Par défaut, les alertes sont configurées mais les canaux de notification (email, Slack, etc.) doivent être configurés manuellement.

Pour configurer les notifications d'alertes :

  1. Accédez à Alertmanager sur https://alertmanager.{suffix}
  2. Ou éditez la configuration Alertmanager via Rancher

Accéder à Prometheus directement#

Pour des requêtes avancées, vous pouvez accéder à Prometheus directement :

  • URL : https://prometheus.{suffix}

Utilisez l'onglet Graph pour exécuter des requêtes PromQL. Par exemple :

  • up - Affiche quelles cibles sont scrapées
  • container_memory_usage_bytes - Utilisation mémoire des conteneurs
  • rate(container_cpu_usage_seconds_total[5m]) - Taux d'utilisation CPU

Rétention des données#

Par défaut, Prometheus conserve les métriques pendant 15 jours. C'est configurable mais nécessite de modifier le déploiement Prometheus directement.

Prochaines étapes#

Cette page vous a-t-elle été utile ?