Ir al contenido principal

Monitoreo de calidad de datos

Monitoreo de calidad inteligente para datos e IA en el lakehouse

Lakehouse Monitoring

¿Qué es el monitoreo de la calidad de los datos?

Databricks Data Quality Monitoring permite que los equipos supervisen el estado de sus conjuntos de datos sin herramientas ni complejidad adicionales. Con la tecnología de Unity Catalog, el Monitoreo de la calidad de los datos, que incluye la detección de anomalías y la elaboración de perfiles de datos (antes conocido como Monitoreo de Lakehouse), monitorea automáticamente las métricas de calidad de los datos, las tendencias estadísticas y las anomalías a lo largo del tiempo. Con un único enfoque unificado que permite la arquitectura de lakehouse, los equipos pueden diagnosticar problemas rápidamente, realizar un análisis de la causa raíz y mantener la confianza en sus datos y activos de IA.

Funciones de monitoreo de la calidad de los datos en Databricks

data quality monitoring

Detección de anomalías

Habilite el monitoreo escalable de la calidad de los datos con un solo clic. Databricks analiza automáticamente los patrones de datos históricos para detectar anomalías en la actualidad y la completitud de la tabla. Con el análisis inteligente, solo se analizan las tablas más importantes, mientras que las de bajo impacto se omiten. Las tablas se monitorean a medida que se actualizan, lo que garantiza que la información esté actualizada sin necesidad de programación manual.

enable quality monitoring

Elaboración de perfiles de datos

Reciba estadísticas de resumen para sus tablas y realice un seguimiento de las tendencias históricas y los cambios inesperados en sus datos y resultados de ML, lo que ayuda a los equipos a comprender mejor sus datos y a reducir el trabajo operativo posterior. Amplíe el monitoreo a las aplicaciones de GenAI y a los modelos de machine learning mediante la elaboración de perfiles de tablas de inferencia que capturan las entradas y predicciones del modelo.

Data lineage for inference_table

Análisis de causa raíz acelerado

Depura los problemas de calidad de los datos y del modelo más rápido usando perfiles de datos, tendencias históricas y señales de anomalías para rastrear el origen de los problemas. Esto ayuda a los equipos a reducir el tiempo de resolución y a mejorar la confiabilidad de las canalizaciones de producción.

RECURSOS

Blog

Databricks data quality monitoring blog graphic

EBOOK

A comprehensive guide to data and AI Governance

Documentos

databricks documents data quality monitoring

¿Listo para empezar?