FreelanceIT – La plateforme freelance IT Au MAROC

Un modèle déployé n'est pas un modèle terminé. Le data drift, le concept drift et la dégradation silencieuse des performances sont les ennemis invisibles du MLOps. Découvrez comment mettre en place une surveillance complète avec MLflow, Evidently AI et Grafana.

Le problème silencieux du drift

Votre modèle de scoring de crédit avait 94% d'AUC au déploiement. Six mois plus tard, il en est à 81% — et personne ne s'en est rendu compte parce qu'il n'y avait pas de monitoring. C'est le scénario classique du concept drift : la relation entre features et cible a changé dans le monde réel.

Les trois types de drift à surveiller

Data drift : la distribution des features d'entrée a changé (ex: nouveaux segments clients)
Concept drift : la relation features → target a changé (ex: comportements post-COVID)
Prediction drift : la distribution des prédictions a changé sans explication

Evidently AI pour la détection de drift

Evidently génère des rapports HTML ou JSON comparant votre dataset de référence (training) à la production récente. Il calcule automatiquement les tests statistiques appropriés (Jensen-Shannon divergence pour les distributions continues, Chi² pour les catégorielles).

MLflow pour le tracking d'expériences

Chaque réentraînement doit être tracé : hyperparamètres, métriques, artefacts, version du dataset. MLflow offre une UI simple pour comparer les runs et promouvoir un modèle en production via son Model Registry.

Stack de monitoring opérationnel

Pour les métriques système (latence p99, throughput, erreurs) : exposez un endpoint /metrics Prometheus depuis votre service de scoring, et visualisez dans Grafana. Créez des alertes sur : latence > 200ms, taux d'erreur > 1%, drift score > seuil.

MLflow, Evidently, Prometheus : monitorer vos modèles ML en production

Le problème silencieux du drift

Les trois types de drift à surveiller

Evidently AI pour la détection de drift

MLflow pour le tracking d'expériences

Stack de monitoring opérationnel