Unity Catalog è una soluzione di governance unificata per tutte le risorse di dati, inclusi file, tabelle, modelli di machine learning e dashboard, presenti nel lakehouse aziendale su qualsiasi cloud.
Governance centralizzata per dati e AI
Ricerca e scoperta di dati incorporate
Prestazioni e scalabilità
Provenienza automatizzata di tutti i carichi di lavoro
Integrazione con strumenti esistenti

How it works
Gestione e governance centralizzate del patrimonio di dati
Un modello di governance comune basato sullo standard aperto ANSI SQL consente di semplificare la governance di file, tabelle, dashboard e modelli ML su qualsiasi cloud. Le politiche di accessi possono essere definite una sola volta a livello di account e poi applicate a tutti i carichi e gli spazi di lavoro. Unity Catalog consente inoltre revisioni granulari centralizzate attraverso l'acquisizione di un registro delle operazioni svolte sui dati, aiutando a rispettare i requisiti di conformità e audit.
Gestire il controllo granulare degli accessi
L'uso di funzioni SQL standard consente di definire filtri e maschere di colonne per controllare in modo granulare l'accesso a righe e colonne. Mentre Databricks continua a sviluppare funzionalità per migliorare la scalabilità e l'integrazione, i controlli di accesso basati su attributi, che verranno introdotti a breve, consentiranno di definire politiche di accesso basate su tag personalizzati (attributi).
Esperienza di ricerca dei dati unificata e sicura
Gli utenti possono trovare, comprendere e fare riferimento a dati rilevanti su tutto il patrimonio di dati, con un'esperienza di ricerca unificata per analisti, data engineer e data scientist. La ricerca di dati in Unity Catalog è sicura per definizione, poiché i risultati delle ricerche sono limitati in base ai privilegi di accesso di ciascun utente, con un ulteriore livello di sicurezza per la privacy.
Prestazioni di query migliorate per qualsiasi volume di dati
Unity Catalog migliora le prestazioni delle query grazie alla fornitura di dati con bassa latenza e al perfezionamento automatico (auto-tuning) delle tabelle, velocizzando l'esecuzione delle query su qualsiasi volume di dati. La compattazione automatica asincrona dei dati ottimizza le dimensioni dei file e riduce automaticamente la latenza di input/output (I/O) in background.
Provenienza dei dati automatizzata in tempo reale
Ottieni visibilità a 360 gradi sui flussi di dati in ingresso nel lakehouse, con provenienza automatizzata in tempo reale per tutti i carichi di lavoro in SQL, Python, Scala e R. Esegui velocemente controlli di qualità dei dati e analisi complete dell'impatto delle modifiche ai dati, e correggi eventuali errori nelle pipeline di dati. Sfrutta i vantaggi della provenienza dei dati su tabelle, colonne, notebook, flussi di lavoro e dashboard. I grafici della provenienza in Unity Catalog tengono conto dei privilegi, limitando l'accesso in base alle autorizzazioni di ciascun utente. La provenienza può essere recuperata anche attraverso API REST per supportare integrazioni con altri cataloghi.
Condivisione dei dati protetta fra diverse organizzazioni
Unity Catalog supporta in modo nativo Delta Sharing, il primo protocollo aperto al mondo per la condivisione sicura di dati, che consente di condividere facilmente dati esistenti nei formati Delta Lake e Apache Parquet con qualsiasi piattaforma di calcolo. I consumatori non devono operare necessariamente sulla piattaforma Databricks o sullo stesso cloud, e nemmeno su un cloud. I dati possono essere condivisi direttamente, senza bisogno di replicarli o copiarli su altri sistemi. Le integrazioni native con Power BI, Tableau, Spark, pandas e Java consentono ai destinatari di consumare dati condivisi direttamente dai loro strumenti preferiti. L'utilizzo dei dati condivisi può essere gestito, governato, revisionato e tracciato centralmente su un'unica piattaforma.
