Unity Catalog è una soluzione di governance unificata per tutte le risorse di dati, inclusi file, tabelle, modelli di machine learning e dashboard, presenti nel lakehouse aziendale su qualsiasi cloud.

Governance centralizzata per dati e AI
Un modello di governance comune basato su ANSI SQL consente di gestire centralmente file, tabelle, dashboard e modelli ML su qualsiasi cloud.

Ricerca e scoperta di dati incorporate
Gli utenti possono ricercare, comprendere e fare riferimento ai dati presenti in tutta l'organizzazione, aumentando la produttività.

Prestazioni e scalabilità
Le prestazioni delle query vengono migliorate grazie alla fornitura di dati con bassa latenza e al perfezionamento automatico (auto-tuning) delle tabelle.

Provenienza automatizzata di tutti i carichi di lavoro
Crea una vista unificata e trasparente dell'intero ecosistema di dati, con la provenienza automatizzata e dettagliata di tutti i carichi di lavoro in SQL, R, Python, Scala e per tutti i tipi di risorse: tabelle, notebook, flussi di lavoro e dashboard.

Integrazione con strumenti esistenti
Predisponi la governance di dati e AI per il futuro, con la flessibilità di poter sfruttare le soluzioni esistenti di catalogazione e governance dei dati.
Come funziona

Gestione e governance centralizzate del patrimonio di dati
Un modello di governance comune basato sullo standard aperto ANSI SQL consente di semplificare la governance di file, tabelle, dashboard e modelli ML su qualsiasi cloud. Le politiche di accessi possono essere definite una sola volta a livello di account e poi applicate a tutti i carichi e gli spazi di lavoro. Unity Catalog consente inoltre revisioni granulari centralizzate attraverso l'acquisizione di un registro delle operazioni svolte sui dati, aiutando a rispettare i requisiti di conformità e audit.

Gestire il controllo granulare degli accessi
L'uso di funzioni SQL standard consente di definire filtri e maschere di colonne per controllare in modo granulare l'accesso a righe e colonne. Mentre Databricks continua a sviluppare funzionalità per migliorare la scalabilità e l'integrazione, i controlli di accesso basati su attributi, che verranno introdotti a breve, consentiranno di definire politiche di accesso basate su tag personalizzati (attributi).

Esperienza di ricerca dei dati unificata e sicura
Gli utenti possono trovare, comprendere e fare riferimento a dati rilevanti su tutto il patrimonio di dati, con un'esperienza di ricerca unificata per analisti, data engineer e data scientist. La ricerca di dati in Unity Catalog è sicura per definizione, poiché i risultati delle ricerche sono limitati in base ai privilegi di accesso di ciascun utente, con un ulteriore livello di sicurezza per la privacy.

Prestazioni di query migliorate per qualsiasi volume di dati
Unity Catalog migliora le prestazioni delle query grazie alla fornitura di dati con bassa latenza e al perfezionamento automatico (auto-tuning) delle tabelle, velocizzando l'esecuzione delle query su qualsiasi volume di dati. La compattazione automatica asincrona dei dati ottimizza le dimensioni dei file e riduce automaticamente la latenza di input/output (I/O) in background.

Provenienza dei dati automatizzata in tempo reale
Ottieni visibilità a 360 gradi sui flussi di dati in ingresso nel lakehouse, con provenienza automatizzata in tempo reale per tutti i carichi di lavoro in SQL, Python, Scala e R. Esegui velocemente controlli di qualità dei dati e analisi complete dell'impatto delle modifiche ai dati, e correggi eventuali errori nelle pipeline di dati. Sfrutta i vantaggi della provenienza dei dati su tabelle, colonne, notebook, flussi di lavoro e dashboard. I grafici della provenienza in Unity Catalog tengono conto dei privilegi, limitando l'accesso in base alle autorizzazioni di ciascun utente. La provenienza può essere recuperata anche attraverso API REST per supportare integrazioni con altri cataloghi.

Condivisione dei dati protetta fra diverse organizzazioni
Unity Catalog supporta in modo nativo Delta Sharing, il primo protocollo aperto al mondo per la condivisione sicura di dati, che consente di condividere facilmente dati esistenti nei formati Delta Lake e Apache Parquet con qualsiasi piattaforma di calcolo. I consumatori non devono operare necessariamente sulla piattaforma Databricks o sullo stesso cloud, e nemmeno su un cloud. I dati possono essere condivisi direttamente, senza bisogno di replicarli o copiarli su altri sistemi. Le integrazioni native con Power BI, Tableau, Spark, pandas e Java consentono ai destinatari di consumare dati condivisi direttamente dai loro strumenti preferiti. L'utilizzo dei dati condivisi può essere gestito, governato, revisionato e tracciato centralmente su un'unica piattaforma.
Integrazioni perfette con gli strumenti esistenti
Unity Catalog funziona con i cataloghi di dati, i sistemi di archiviazione dei dati e le soluzioni di governance esistenti in modo da poter sfruttare gli investimenti esistenti e creare un modello di governance a prova di futuro senza costosi costi di migrazione.
Stoccaggio dati e cloud
Partner di governance e catalogazione dei dati
Clientela

“Unity Catalog ci ha aiutato a semplificare la gestione dei dati e i controlli di accesso in tutta l'azienda. Il team di gestione dei dati di Compass ha portato a bordo in piena sicurezza oltre 100 sorgenti di dati, ha migrato tutti gli spazi di lavoro su Unity Catalog e ha creato un livello Gold a cui tutte le figure interessate possono accedere, attingendo a informazioni approfondite su clienti, utilizzo, ricavi e altro ancora: un'unica fonte della verità con controlli di accesso completi per tutta l'azienda.”

“Unity Catalog ha semplificato notevolmente l'implementazione del controllo degli accessi per ruoli, consentendoci di proteggere i dati a livello di catalogo, database, tabella e colonna. Offriamo il livello di accesso adeguato a ogni utente e possiamo gestire e proteggere l'accesso ai dati nel rispetto delle nostre rigorose politiche di conformità e riservatezza.”

“Unity Catalog ha consentito a Milliman di mettere a disposizione di tutti i suoi utenti il suo patrimonio di dati in continua espansione, semplificando la gestione degli accessi e riducendo la complessità dello storage. Grazie a Unity Catalog, Milliman può rispettare rigorosi standard sanitari, esplorare i dati in modo collaborativo e ridurre la complessità dello storage. Con Unity Catalog possiamo dimensionare velocemente il sistema in base alle esigenze dei nostri clienti.”

“Unity Catalog ci consente di costruire una piattaforma di prossima generazione che sfrutta tutto il potenziale di veicoli definiti da software, che si evolvono e migliorano accumulando chilometri, migliorando l'esperienza di guida dei clienti e massimizzando i benefici ambientali della mobilità elettrica. Abbiamo centralizzato il data catalog e la gestione degli accessi per diversi team e spazi di lavoro, aprendoci opportunità di collaborazione e innovazione senza precedenti."

“Unity Catalog ha rappresentato una vera e propria svolta. I nostri analisti possono accedere a tabelle esterne AWS in tempo reale negli spazi di lavoro di Databricks e unirle con tabelle Delta Lake. In questo modo possiamo avere i vantaggi in termini di prestazioni di Databricks SQL senza dover migrare le tabelle Glue. Con Unity Catalog, diversi team possono collaborare senza spostare i dati da un posto all'altro.”