Hoje, temos o prazer de anunciar que a Lakehouse Federation no Unity Catalog está agora em Disponibilidade Geral (GA) nas nuvens AWS, Azure e GCP! A Lakehouse Federation permite que você descubra, consulte e governe todos os seus dados em um só lugar. Com este lançamento GA, você pode esperar estabilidade, segurança e prontidão empresarial aprimoradas para suas cargas de trabalho federadas.
Neste post, abordamos as funcionalidades GA da Lakehouse Federation, exploramos como ela está impulsionando análises ágeis nas principais empresas do mundo e discutimos os próximos passos.
Organizações em todo o mundo, independentemente do tamanho ou setor, estão aproveitando dados e IA para impulsionar a inovação. No entanto, por razões históricas, organizacionais ou tecnológicas, os dados muitas vezes permanecem dispersos em vários sistemas operacionais e analíticos. Essa fragmentação leva a vários desafios:
A Lakehouse Federation aborda esses pontos críticos e simplifica a forma como as organizações expõem, consultam e governam sistemas de dados isolados como uma extensão de seu lakehouse. Com essas novas funcionalidades, você pode:
Mais de 5.000 clientes Databricks estão aproveitando a Lakehouse Federation para unificar seus patrimônios de dados, garantindo descoberta e governança de dados consistentes.

"A Lakehouse Federation nos permitiu combinar todos os nossos ativos de dados em vários data warehouses e bancos de dados sob o Unity Catalog, simplificando a descoberta e o gerenciamento de acesso aos dados. Isso desbloqueia uma variedade de casos de uso, incluindo ingestão e consultas ad hoc, tornando nossas análises mais fáceis do que nunca." — Alexander Booth, Assistant Director of Research com o Texas Rangers
Temos o prazer de anunciar a Disponibilidade Geral para os conectores MySQL, PostgreSQL, Amazon Redshift, Snowflake, Azure SQL Database, SQL Server e Azure Synapse.
Este lançamento marca um marco importante em algumas áreas:
"A Lakehouse Federation nos ajudou a consolidar nosso cenário de dados com governança consistente em um só lugar e a gerar ganhos significativos de eficiência operacional. Os insights e a qualidade dos dados agora estão perfeitamente integrados, permitindo-nos focar em fornecer aos nossos clientes os melhores insights para maximizar o valor de seus investimentos em publicidade." — Bob Wuisman, Global Head of Production na Ebiquity plc.
Descubra, governe e acesse dados do Hive Metastore (HMS) e AWS Glue com a Lakehouse Federation. Com a Federação de Catálogo, você poderá montar facilmente qualquer HMS externo (ou interno do Databricks) como um catálogo estrangeiro no Unity Catalog.
Para usuários do Databricks HMS (interno), esta é uma maneira simples e direta de começar com o Unity Catalog e se beneficiar das funcionalidades de governança unificada fornecidas pelo Unity Catalog.
Para usuários de HMS externo e AWS Glue, ele fornece uma maneira integrada de acessar dados externos do metastore diretamente do Unity Catalog sem alterar seus fluxos de trabalho.
A Federação de Catálogo está atualmente em Private Preview.
Expandir a lista de fontes de dados suportadas para a Lakehouse Federation continua sendo uma prioridade em nossa missão de ajudar os clientes a unificar seus patrimônios de dados. Temos o prazer de anunciar que os conectores Google BigQuery, completando o suporte de federação de Data Warehouse em todos os três principais provedores de nuvem, e Salesforce Data Cloud agora estão em Public Preview.
Os conectores Oracle e Teradata estarão disponíveis em breve para preview.
Para proporcionar uma experiência de consulta mais rápida em data warehouses, que tendem a conter tabelas maiores, estamos adicionando recursos para transferências automáticas de dados de alto rendimento.
No futuro, começando com os conectores Amazon Redshift & Snowflake, você poderá consultar e materializar tabelas de data warehouses rapidamente. Por baixo dos panos, o Lakehouse Federation aproveitará APIs mais rápidas/em lote (por exemplo, descarregar para armazenamento de objetos ou local de staging em paralelo) e buscará esses resultados em paralelo (sem gargalo no driver). Tudo isso sem qualquer intervenção do usuário!

Por fim, o compartilhamento de dados do Lakehouse Federation se tornará muito mais fácil. A integração futura com o Delta Sharing permitirá que os clientes compartilhem tabelas federadas externamente sem que os destinatários precisem de acesso ao Databricks ou ao sistema de dados subjacente. Isso simplificará o compartilhamento de dados, eliminando a necessidade de cópias redundantes em diferentes sistemas.
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
