Oggi siamo entusiasti di annunciare che Lakehouse Federation in Unity Catalog è ora disponibile a livello generale (GA) su AWS, Azure e GCP! Lakehouse Federation ti consente di scoprire, interrogare e governare tutti i tuoi dati in un unico posto. Con questa release GA, puoi aspettarti una maggiore stabilità, sicurezza e prontezza aziendale per i tuoi carichi di lavoro federati.
In questo post del blog, esamineremo le funzionalità GA di Lakehouse Federation, esploreremo come sta potenziando l'analisi agile nelle aziende leader a livello mondiale e discuteremo cosa ci riserva il futuro.
Le organizzazioni di tutto il mondo, indipendentemente dalle dimensioni o dal settore, sfruttano i dati e l'IA per promuovere l'innovazione. Tuttavia, per ragioni storiche, organizzative o tecnologiche, i dati rimangono spesso dispersi su più sistemi operativi e analitici. Questa frammentazione porta a diverse sfide:
Lakehouse Federation affronta questi punti critici e semplifica l'esposizione, l'interrogazione e la governance dei sistemi di dati isolati come estensione del proprio lakehouse. Con queste nuove funzionalità, puoi:
Oltre 5.000 clienti Databricks stanno sfruttando Lakehouse Federation per unificare i propri patrimoni di dati, garantendo una scoperta e una governance dei dati coerenti.

"Lakehouse Federation ci ha permesso di combinare tutte le nostre risorse di dati tra più data warehouse e database sotto Unity Catalog, semplificando la scoperta dei dati e la gestione degli accessi. Questo sblocca una varietà di casi d'uso, inclusi ingestion e query ad hoc, rendendo le nostre analisi più facili che mai." — Alexander Booth, Assistant Director of Research presso i Texas Rangers
Siamo entusiasti di annunciare la disponibilità generale per i connettori MySQL, PostgreSQL, Amazon Redshift, Snowflake, Azure SQL Database, SQL Server e Azure Synapse.
Questa release segna un traguardo importante in diverse aree:
"Lakehouse Federation ci ha aiutato a consolidare il nostro panorama dati con una governance coerente in un unico posto e a generare significativi guadagni di efficienza operativa. Le informazioni sui dati e la qualità sono ora integrate in modo fluido, permettendoci di concentrarci sull'offrire ai nostri clienti le migliori informazioni per massimizzare il valore dei loro investimenti pubblicitari." — Bob Wuisman, Global Head of Production presso Ebiquity plc.
Scopri, governa e accedi ai dati da Hive Metastore (HMS) e AWS Glue con Lakehouse Federation. Con Catalog Federation, sarai in grado di montare facilmente qualsiasi HMS esterno (o Databricks interno) come catalogo esterno in Unity Catalog.
Per gli utenti di Databricks HMS (interno), questo è un modo semplice e diretto per iniziare con Unity Catalog e beneficiare delle funzionalità di governance unificata fornite da Unity Catalog.
Per gli utenti di HMS esterni e AWS Glue, fornisce un modo strettamente integrato per accedere ai dati del metastore esterno direttamente da Unity Catalog senza modificare i flussi di lavoro.
Catalog Federation è attualmente in Private Preview.
Espandere l'elenco delle origini dati supportate per Lakehouse Federation rimane una priorità assoluta nella nostra missione di aiutare i clienti a unificare i propri patrimoni di dati. Siamo entusiasti di annunciare che i connettori Google BigQuery, che completano il supporto per la federazione dei data warehouse tra i tre principali provider cloud, e Salesforce Data Cloud sono ora in Public Preview.
I connettori Oracle e Teradata saranno disponibili presto in anteprima.
Per offrire un'esperienza di query più rapida sui data warehouse, che tendono a contenere tabelle più grandi, stiamo aggiungendo funzionalità per trasferimenti dati automatici ad alto throughput.
In futuro, a partire dai connettori Amazon Redshift & Snowflake, potrai eseguire query e materializzare tabelle dai data warehouse rapidamente. Dietro le quinte, Lakehouse Federation sfrutterà API più veloci/bulk (ad es. offload su object storage o staging location in parallelo) e recupererà questi risultati in parallelo (nessun collo di bottiglia del driver). Tutto senza alcun intervento dell'utente!

Infine, la condivisione dei dati di Lakehouse Federation diventerà molto più semplice. L'integrazione imminente di Delta Sharing consentirà ai clienti di condividere tabelle federate esternamente senza che i destinatari debbano accedere a Databricks o al sistema dati sottostante. Ciò semplificherà la condivisione dei dati eliminando la necessità di copie ridondanti tra sistemi diversi.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
