Um ano depois de abrirmos o código aberto do Unity Catalog (UC), os resultados são claros: abertura não é apenas um princípio, está funcionando na prática.
Desde então, centenas de empresas adotaram o Unity Catalog como sua base para governança aberta e interoperável no Delta Lake, Apache Iceberg e em todos os principais engines no stack de dados moderno. O que começou como um compromisso com padrões abertos evoluiu para um ecossistema próspero de APIs abertas, integrações de parceiros e impacto para o cliente em grande escala.
Hoje, o Unity Catalog se destaca como o catálogo aberto mais adotado para dados e AI. As equipes de dados não precisam mais fazer escolhas difíceis entre desempenho, interoperabilidade e governança; elas podem ter tudo.
Em 2024, abrimos o código do UC e lançamos as UC Open APIs para aprimorar a interoperabilidade com ferramentas externas. Essas APIs facilitam para que qualquer engine se conecte com segurança ao Unity Catalog, leia ou grave tabelas Delta e Iceberg e aplique a governança automaticamente por meio de fornecimento de credenciais e políticas de acesso centralizadas.
Um ano depois, o ecossistema fala por si só:
Esse impulso prova que a interoperabilidade escala melhor quando a abertura e a governança trabalham juntas.
O Unity Catalog oferece suporte de primeira classe para Delta e Iceberg em governança, acesso e desempenho. Através das UC Open APIs e da Iceberg REST Catalog API, as organizações podem conectar com segurança qualquer engine por meio da leitura, escrita e criação de tabelas, enquanto aderem a políticas de acesso unificadas.
O Unity Catalog simplifica o acesso externo:
Leve a governança um o passo adiante aproveitando as Tabelas Gerenciadas do UC, onde a abertura encontra o desempenho. Essas tabelas otimizadas para Databricks usam Predictive Optimization e Liquid Clustering para entregar consultas até 20x mais rápidas e custos de armazenamento 50% menores, enquanto permanecem totalmente abertas e acessíveis por meio de APIs padrão. As tabelas gerenciadas representam o novo padrão: governança centralizada, formatos abertos e desempenho inteligente — tudo em um.
No último ano, as APIs Abertas do UC ajudaram centenas de organizações a quebrar silos de formato, unificar a governança e ampliar a interoperabilidade em todas as partes de seu stack.
PepsiCo: Governança de dados unificada em analítica multi-engine
A PepsiCo executa um ecossistema de analítica diversificado com vários mecanismos de compute, como o Spark no Kubernetes. Historicamente, esses engines precisavam contornar o UC e se conectar a tabelas externas por meio de acesso baseado em caminho. Com as UC Open APIs, a PepsiCo agora pode adotar tabelas gerenciadas e permitir que engines externos acessem os dados por meio de uma governança única e centralizada, sem exigir soluções alternativas no nível do armazenamento.
Com as APIs Abertas do Unity Catalog, capacitamos nossas equipes a usar suas ferramentas preferidas, mantendo a governança e a consistência dos dados. Podemos aproveitar os benefícios das tabelas gerenciadas dentro de uma plataforma de dados e AI verdadeiramente interoperável que funciona em vários engines de compute.— Sudipta Das, Diretor de Operações de Dados Empresariais
Coinbase: query de gráfico em escala com fornecimento de credenciais
A Coinbase utiliza o PuppyGraph para processar terabytes de dados diariamente. As UC Open APIs e o fornecimento de credenciais eliminam a necessidade de pipelines de ETL, permitindo que a Coinbase query tabelas Delta e Iceberg diretamente enquanto aplica políticas e captura logs de auditoria.
Usando as APIs abertas do Unity Catalog, o PuppyGraph consegue query mais de 2 TB de dados diariamente com credenciais temporárias, analisando dependências de serviço em escala, tudo isso enquanto mantém a governança centralizada no UC.— Eric Sun, Head da Plataforma de Dados na Coinbase
Parcerias de ecossistema
O Unity Catalog está no centro de um ecossistema crescente de parceiros, ampliando a governança para além do Databricks:
A Starburst compartilha a visão da Databricks de abertura e interoperabilidade em todo o ecossistema de dados. Com a integração com o Databricks Unity Catalog, permitimos que os clientes criem uma única fonte da verdade para todos os seus dados, com governança centralizada e a flexibilidade para usar as ferramentas de sua escolha.— Justin Borgman, CEO, Starburst Data
O Unity Catalog continua a evoluir como a camada de governança mais aberta e interoperável para o lakehouse. Veja o que vem a seguir:
As Unity Catalog Open APIs estão disponíveis para clientes Delta e Iceberg. Você pode começar:
Comece a construir com as UC Open APIs hoje mesmo e veja como a interoperabilidade e a governança unificada podem ser fáceis. Para começar a usar o Unity Catalog, siga os guias para AWS, Azure e GCP.
(This blog post has been translated using AI-powered tools) Original Post
Produto
June 11, 2024/11 min de leitura

