Unity Catalog

Governance unificata per tutto il patrimonio di dati e AI

Registrati per l'anteprima pubblicaContact us

Unity Catalog è una soluzione di governance unificata per tutte le risorse di dati, inclusi file, tabelle e modelli di machine learning, presenti nel lakehouse aziendale su qualsiasi cloud.

Governance centralizzata per dati e AI

Un modello di governance comune basato su ANSI SQL consente di gestire centralmente file, tabelle, dashboard e modelli ML su qualsiasi cloud.

Ricerca e scoperta di dati incorporate

Gli utenti possono ricercare, comprendere e fare riferimento ai dati presenti in tutta l'organizzazione, aumentando la produttività.

Prestazioni e scalabilità

Le prestazioni delle query vengono migliorate grazie alla fornitura di dati con bassa latenza e al perfezionamento automatico (auto-tuning) delle tabelle.

Provenienza automatizzata di tutti i carichi di lavoro

Crea una vista unificata e trasparente dell'intero ecosistema di dati, con la provenienza automatizzata e dettagliata di tutti i carichi di lavoro in SQL, R, Python, Scala e per tutti i tipi di risorse: tabelle, notebook, flussi di lavoro e dashboard.

Integrazione con strumenti esistenti

Predisponi la governance di dati e AI per il futuro, con la flessibilità di poter sfruttare le soluzioni esistenti di catalogazione e governance dei dati.
immagine sfondo

How it works

Gestione e governance centralizzate del patrimonio di dati

Un modello di governance comune basato sullo standard aperto ANSI SQL consente di semplificare la governance di file, tabelle, dashboard e modelli ML su qualsiasi cloud. Le politiche di accessi possono essere definite una sola volta a livello di account e poi applicate a tutti i carichi e gli spazi di lavoro. Unity Catalog consente inoltre revisioni granulari centralizzate attraverso l'acquisizione di un registro delle operazioni svolte sui dati, aiutando a rispettare i requisiti di conformità e audit.

Controllo granulare degli accessi con grande facilità

L'uso di funzioni SQL standard consente di definire filtri e maschere di colonne per controllare in modo granulare l'accesso a righe e colonne. Grazie ai controlli di accesso basati su attributi si possono definire politiche di accesso basate su tag personalizzati (attributi), semplificando ulteriormente la stewardship dei dati.

Esperienza di ricerca dei dati unificata e sicura

Gli utenti possono trovare, comprendere e fare riferimento a dati rilevanti su tutto il patrimonio di dati, con un'esperienza di ricerca unificata per analisti, data engineer e data scientist. La ricerca di dati in Unity Catalog è sicura per definizione, poiché i risultati delle ricerche sono limitati in base ai privilegi di accesso di ciascun utente, con un ulteriore livello di sicurezza per la privacy.

Prestazioni di query migliorate per qualsiasi volume di dati

Unity Catalog migliora le prestazioni delle query grazie alla fornitura di dati con bassa latenza e al perfezionamento automatico (auto-tuning) delle tabelle, velocizzando l'esecuzione delle query su qualsiasi volume di dati. La compattazione automatica asincrona dei dati ottimizza le dimensioni dei file e riduce automaticamente la latenza di input/output (I/O) in background.

Provenienza dei dati automatizzata in tempo reale

Ottieni visibilità a 360 gradi sui flussi di dati in ingresso nel lakehouse, con provenienza automatizzata in tempo reale per tutti i carichi di lavoro in SQL, Python, Scala e R. Esegui velocemente controlli di qualità dei dati e analisi complete dell'impatto delle modifiche ai dati, e correggi eventuali errori nelle pipeline di dati. Sfrutta i vantaggi della provenienza dei dati su tabelle, colonne, notebook, flussi di lavoro e dashboard. I grafici della provenienza in Unity Catalog tengono conto dei privilegi, limitando l'accesso in base alle autorizzazioni di ciascun utente. La provenienza può essere recuperata anche attraverso API REST per supportare integrazioni con altri cataloghi.

Condivisione dei dati protetta fra diverse organizzazioni

Unity Catalog supporta in modo nativo Delta Sharing, il primo protocollo aperto al mondo per la condivisione sicura di dati, che consente di condividere facilmente dati esistenti nei formati Delta Lake e Apache Parquet con qualsiasi piattaforma di calcolo. I consumatori non devono operare necessariamente sulla piattaforma Databricks o sullo stesso cloud, e nemmeno su un cloud. I dati possono essere condivisi direttamente, senza bisogno di replicarli o copiarli su altri sistemi. Le integrazioni native con Power BI, Tableau, Spark, pandas e Java consentono ai destinatari di consumare dati condivisi direttamente dai loro strumenti preferiti. L'utilizzo dei dati condivisi può essere gestito, governato, revisionato e tracciato centralmente su un'unica piattaforma.

immagine sfondo

Integrazioni dirette con strumenti esistenti

Unity Catalog si integra con le soluzioni di data catalog, data storage e governance già presenti in azienda, consentendo di sfruttare gli investimenti realizzati e costruire un modello di governance a lungo termine senza costi di migrazione elevati.

Stoccaggio dati e cloud

Partner di governance e catalogazione dei dati

Clienti


logo grafica grammarly
“Unity Catalog ha semplificato notevolmente l'implementazione del controllo degli accessi per ruoli, consentendoci di proteggere i dati a livello di catalogo, database, tabella e colonna. Offriamo il livello di accesso adeguato a ogni utente e possiamo gestire e proteggere l'accesso ai dati nel rispetto delle nostre rigorose politiche di conformità e riservatezza.”
— Chris Locklin, Engineering Manager of Data Platforms, Grammarly

logo grafica milliman
“Unity Catalog ha consentito a Milliman di mettere a disposizione di tutti i suoi utenti il suo patrimonio di dati in continua espansione, semplificando la gestione degli accessi e riducendo la complessità dello storage. Grazie a Unity Catalog, Milliman può rispettare rigorosi standard sanitari, esplorare i dati in modo collaborativo e ridurre la complessità dello storage. Con Unity Catalog possiamo dimensionare velocemente il sistema in base alle esigenze dei nostri clienti.”
— Dan McCurley, Cloud Solutions Architect, Milliman

logo grafica warner bros
“Unity Catalog ha rappresentato una vera e propria svolta. I nostri analisti possono accedere a tabelle esterne AWS in tempo reale negli spazi di lavoro di Databricks e unirle con tabelle Delta Lake. In questo modo possiamo avere i vantaggi in termini di prestazioni di Databricks SQL senza dover migrare le tabelle Glue. Con Unity Catalog, diversi team possono collaborare senza spostare i dati da un posto all'altro.”
— Rajat Gupta, Engineering Manager, Warner Bros. Discovery

Registrati per l'anteprima pubblica

Pronti per cominciare?