Direkt zum Hauptinhalt

Überwachung der Datenqualität

Intelligentes Qualitäts-Monitoring für Daten und KI auf dem Lakehouse

Lakehouse Monitoring

Was ist Datenqualitäts-Monitoring?

Databricks Data Quality Monitoring ermöglicht es Teams, den Zustand ihrer Datensätze ohne zusätzliche Tools oder Komplexität zu überwachen. Auf Basis von Unity Catalog überwacht Data Quality Monitoring, das Anomalieerkennung und Data-Profiing (früher als Lakehouse Monitoring bekannt) umfasst, automatisch Metriken zur Datenqualität, statistische Trends und Anomalien im Zeitverlauf. Mit einem einzigen, einheitlichen Ansatz, der durch die Lakehouse-Architektur ermöglicht wird, können Teams Probleme diagnostizieren, Ursachenanalysen durchführen und das Vertrauen in ihre Daten- und KI-Assets aufrechterhalten.

Funktionen zum Datenqualitäts-Monitoring auf Databricks

data quality monitoring

Erkennung von Anomalien

Aktivieren Sie skalierbares Datenqualitäts-Monitoring mit einem Klick. Databricks analysiert automatisch historische Datenmuster, um Anomalien in der Aktualität und Vollständigkeit von Tabellen zu erkennen. Mit intelligentem Scannen werden nur Ihre wichtigsten Tabellen gescannt, während Tabellen mit geringen Auswirkungen übersprungen werden. Tabellen werden bei ihrer Aktualisierung überwacht, um sicherzustellen, dass die Erkenntnisse ohne manuelle Schedule aktuell sind.

enable quality monitoring

Daten-Profiling

Erhalten Sie zusammenfassende Statistiken für Ihre Tabellen und verfolgen Sie historische Trends und unerwartete Änderungen Ihrer Daten und ML-Ausgaben. So können Teams ihre Daten besser verstehen und den nachgelagerten operativen Aufwand reduzieren. Erweitern Sie die Überwachung auf GenAI-Anwendungen und Machine-Learning-Modelle, indem Sie Profile für Inferenztabellen erstellen, die Modelleingaben und Vorhersagen erfassen.

Data lineage for inference_table

Beschleunigte Ursachenanalyse

Beheben Sie Probleme mit der Daten- und Modellqualität schneller, indem Sie Data-Profiing, historische Trends und Anomaliesignale nutzen, um Probleme bis zu ihrer Quelle zurückzuverfolgen. Dies hilft Teams, die Zeit bis zur Problemlösung zu verkürzen und die Zuverlässigkeit von Produktionspipelines zu verbessern.

Ressourcen

Blog

Databricks data quality monitoring blog graphic

E-Book

A comprehensive guide to data and AI Governance

Dokumente

databricks documents data quality monitoring

Möchten Sie loslegen?