Monitoring
Accéder aux métriques et tableaux de bord avec Prometheus et Grafana
Siovos déploie une stack de monitoring pour vous aider à suivre la santé et les performances de votre infrastructure.
Vue d'ensemble#
La stack de monitoring se compose de deux services :
Prometheus
Collecte et stocke les métriques de vos services. Scrape automatiquement les composants Kubernetes, pods et tout service exposant un endpoint /metrics.
Grafana
Visualise les métriques via des tableaux de bord. Livré pré-configuré avec des dashboards pour Kubernetes, les nodes et les services principaux.
Accéder à Grafana#
Après le déploiement, Grafana est disponible à :
- URL :
https://grafana.{suffix} - Utilisateur :
admin - Mot de passe : Défini lors du déploiement (voir Siovos Desktop)
N'oubliez pas de vous connecter au VPN et d'installer le certificat racine avant d'accéder à Grafana.
Tableaux de bord pré-installés#
Grafana est livré avec plusieurs dashboards prêts à l'emploi :
| Dashboard | Description |
|---|---|
| Kubernetes / Cluster | Santé globale du cluster et utilisation des ressources |
| Kubernetes / Nodes | CPU, mémoire, disque, réseau par node |
| Kubernetes / Pods | Métriques au niveau des pods et consommation des ressources |
| Node Exporter | Métriques détaillées du système hôte |
Pour accéder aux dashboards : Dashboards → Browse → Sélectionnez un dossier.
Ajouter des dashboards personnalisés#
Vous pouvez importer des dashboards additionnels depuis la bibliothèque Grafana :
- Trouvez un ID de dashboard sur grafana.com (ex:
1860pour Node Exporter Full) - Dans Grafana : Dashboards → Import
- Entrez l'ID du dashboard
- Sélectionnez votre source de données Prometheus
- Cliquez sur Import
Monitorer vos applications#
Pour exposer les métriques de vos propres applications :
- Ajoutez un endpoint
/metricsà votre app (en utilisant les bibliothèques client Prometheus) - Créez une ressource
ServiceMonitorpour indiquer à Prometheus de la scraper
Exemple de ServiceMonitor :
apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
name: my-app
namespace: my-namespace
labels:
release: prometheus
spec:
selector:
matchLabels:
app: my-app
endpoints:
- port: http
path: /metrics
interval: 30sLe label release: prometheus est requis pour que Prometheus découvre votre ServiceMonitor.
Alertes#
Prometheus inclut Alertmanager pour envoyer des notifications quand quelque chose ne va pas. Par défaut, les alertes sont configurées mais les canaux de notification (email, Slack, etc.) doivent être configurés manuellement.
Pour configurer les notifications d'alertes :
- Accédez à Alertmanager sur
https://alertmanager.{suffix} - Ou éditez la configuration Alertmanager via Rancher
Accéder à Prometheus directement#
Pour des requêtes avancées, vous pouvez accéder à Prometheus directement :
- URL :
https://prometheus.{suffix}
Utilisez l'onglet Graph pour exécuter des requêtes PromQL. Par exemple :
up- Affiche quelles cibles sont scrapéescontainer_memory_usage_bytes- Utilisation mémoire des conteneursrate(container_cpu_usage_seconds_total[5m])- Taux d'utilisation CPU
Rétention des données#
Par défaut, Prometheus conserve les métriques pendant 15 jours. C'est configurable mais nécessite de modifier le déploiement Prometheus directement.
Prochaines étapes#
- Présentation de l'architecture - Comprendre comment le monitoring s'intègre
- Dépannage - Problèmes courants de monitoring