Revenir au contenu principal

Contrôle qualité des données

monitoring intelligent de la qualité pour les données et l'IA sur le lakehouse

Lakehouse Monitoring

Qu'est-ce que le monitoring de la qualité des données ?

Databricks Monitoring de la qualité des données permet aux équipes de surveiller la santé de leurs datasets sans outils ni complexité supplémentaires. Optimisée par Unity Catalog, le monitoring de la qualité des données, qui inclut la détection d'anomalies et le profilage des données (anciennement connue sous le nom de Lakehouse Monitoring), surveille automatiquement les métriques de qualité des données, les tendances statistiques et les anomalies au fil du temps. Grâce à une approche unique et unifiée permise par l'architecture lakehouse, les équipes peuvent rapidement diagnostiquer des problèmes (de données), effectuer une analyse des causes racines et maintenir la confiance dans leurs données et leurs actifs d'IA.

Fonctionnalités de monitoring de la qualité des données sur Databricks

data quality monitoring

Détection d'anomalies

Activez le monitoring évolutif de la qualité des données en un seul clic. Databricks analyse automatiquement les schémas de données historiques pour détecter les anomalies dans l'actualisation et l'exhaustivité des tables. Grâce à l'analyse intelligente, seules vos tables les plus importantes sont analysées, tandis que celles à faible impact sont ignorées. Les tables sont surveillées au fur et à mesure de leur mise à jour, garantissant ainsi des insights à jour sans nécessiter de planification manuelle.

enable quality monitoring

Profilage de données

Recevez des statistiques récapitulatives pour vos tables et suivez les tendances historiques ainsi que les changements inattendus sur l'ensemble de vos données et de vos résultats de ML, afin d'aider les équipes à mieux comprendre leurs données et de réduire la charge opérationnelle en aval. Étendez le monitoring aux applications d'IA générative et aux modèles de machine learning en profilant les tables d'inférence qui capturent les entrées et les prédictions des modèles.

Data lineage for inference_table

Analyse accélérée de la cause racine

Déboguez plus rapidement les problèmes de qualité des données et du modèle en utilisant le profilage des données, des tendances historiques et des signaux d'anomalie pour remonter à la source des problèmes. Cela aide les équipes à réduire le temps de résolution et à améliorer la fiabilité des pipelines de production.

Ressources

Blog

Databricks data quality monitoring blog graphic

e-book

A comprehensive guide to data and AI Governance

Documents

databricks documents data quality monitoring

Prêt à vous lancer ?