Monitoring

Siovos déploie une stack de monitoring pour vous aider à suivre la santé et les performances de votre infrastructure.

Vue d'ensemble#

La stack de monitoring se compose de deux services :

Prometheus

Collecte et stocke les métriques de vos services. Scrape automatiquement les composants Kubernetes, pods et tout service exposant un endpoint /metrics.

Grafana

Visualise les métriques via des tableaux de bord. Livré pré-configuré avec des dashboards pour Kubernetes, les nodes et les services principaux.

Accéder à Grafana#

Après le déploiement, Grafana est disponible à :

URL : https://grafana.{suffix}
Utilisateur : admin
Mot de passe : Défini lors du déploiement (voir Siovos Desktop)

N'oubliez pas de vous connecter au VPN et d'installer le certificat racine avant d'accéder à Grafana.

Tableaux de bord pré-installés#

Grafana est livré avec plusieurs dashboards prêts à l'emploi :

Dashboard	Description
Kubernetes / Cluster	Santé globale du cluster et utilisation des ressources
Kubernetes / Nodes	CPU, mémoire, disque, réseau par node
Kubernetes / Pods	Métriques au niveau des pods et consommation des ressources
Node Exporter	Métriques détaillées du système hôte

Pour accéder aux dashboards : Dashboards → Browse → Sélectionnez un dossier.

Ajouter des dashboards personnalisés#

Vous pouvez importer des dashboards additionnels depuis la bibliothèque Grafana :

Trouvez un ID de dashboard sur grafana.com (ex: 1860 pour Node Exporter Full)
Dans Grafana : Dashboards → Import
Entrez l'ID du dashboard
Sélectionnez votre source de données Prometheus
Cliquez sur Import

Monitorer vos applications#

Pour exposer les métriques de vos propres applications :

Ajoutez un endpoint /metrics à votre app (en utilisant les bibliothèques client Prometheus)
Créez une ressource ServiceMonitor pour indiquer à Prometheus de la scraper

Exemple de ServiceMonitor :

apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
  name: my-app
  namespace: my-namespace
  labels:
    release: prometheus
spec:
  selector:
    matchLabels:
      app: my-app
  endpoints:
    - port: http
      path: /metrics
      interval: 30s

Le label release: prometheus est requis pour que Prometheus découvre votre ServiceMonitor.

Prometheus inclut Alertmanager pour envoyer des notifications quand quelque chose ne va pas. Par défaut, les alertes sont configurées mais les canaux de notification (email, Slack, etc.) doivent être configurés manuellement.

Pour configurer les notifications d'alertes :

Accédez à Alertmanager sur https://alertmanager.{suffix}
Ou éditez la configuration Alertmanager via Rancher

Accéder à Prometheus directement#

Pour des requêtes avancées, vous pouvez accéder à Prometheus directement :

URL : https://prometheus.{suffix}

Utilisez l'onglet Graph pour exécuter des requêtes PromQL. Par exemple :

up - Affiche quelles cibles sont scrapées
container_memory_usage_bytes - Utilisation mémoire des conteneurs
rate(container_cpu_usage_seconds_total[5m]) - Taux d'utilisation CPU

Rétention des données#

Par défaut, Prometheus conserve les métriques pendant 15 jours. C'est configurable mais nécessite de modifier le déploiement Prometheus directement.

Prochaines étapes#

Présentation de l'architecture - Comprendre comment le monitoring s'intègre
Dépannage - Problèmes courants de monitoring

Vue d'ensemble#

Prometheus

Grafana

Accéder à Grafana#

Tableaux de bord pré-installés#

Ajouter des dashboards personnalisés#

Monitorer vos applications#

Alertes#

Accéder à Prometheus directement#

Rétention des données#

Prochaines étapes#

Produit

Ressources

Entreprise

Légal