Monitoramento da qualidade dos dados
Monitoramento de qualidade inteligente para dados e IA no lakehouse

O que é Monitoramento da Qualidade de Dados?
O Databricks Data Quality monitoramento permite que as equipes monitorem a integridade de seus datasets sem ferramentas ou complexidade adicionais. Com tecnologia do Unity Catalog, o Monitoramento da qualidade de dados, que inclui detecção de anomalias e perfil de dados (anteriormente conhecido como Lakehouse Monitoring), monitora automaticamente as métricas de qualidade de dados, as tendências estatísticas e as anomalias ao longo do tempo. Com uma abordagem única e unificada habilitada pela arquitetura lakehouse, as equipes podem diagnosticar problemas rapidamente, realizar análises de causa raiz e manter a confiança em seus dados e ativos de IA.
Recursos de Monitoramento da Qualidade de Dados no Databricks

Detecção de anomalia
Ative o monitoramento escalável da qualidade de dados com um clique. O Databricks analisa automaticamente padrões de dados históricos para detectar anomalias na atualização e na integridade das tabelas. Com a verificação inteligente, somente as tabelas mais importantes são verificadas, enquanto as de baixo impacto são ignoradas. As tabelas são monitoradas à medida que são atualizadas, garantindo que as percepções estejam sempre recentes, sem a necessidade de agendamento manual.

Perfilamento de dados
Receba estatísticas resumidas de suas tabelas e acompanhe tendências históricas e alterações inesperadas em seus dados e saídas de ML, ajudando as equipes a entender melhor seus dados e a reduzir o trabalho operacional downstream. Estenda o monitoramento para aplicações de GenAI e modelos do machine learning criando perfis de tabelas de inferência que capturam as entradas e previsões do modelo.

Análise de causa raiz acelerada
Depure problemas de qualidade de dados e do modelo mais rapidamente usando perfis de dados, tendências históricas e sinais de anomalia para rastrear os problemas até sua origem. Isso ajuda as equipes a reduzir o tempo de resolução e a melhorar a confiabilidade dos pipelines de produção.
Recursos
Blog

e-books

Documentos

