As mais recentes inovações da Databricks que tornam o compartilhamento aberto e a colaboração mais fáceis do que nunca — em qualquer nuvem, qualquer formato e com qualquer parceiro
por Akram Chetibi, Zaheera Valani, Harish Gaur, Darshana Sivakumar, Tia Chang e Tao Tao
O Delta Sharing evoluiu para OpenSharing, o primeiro protocolo aberto e neutro de fornecedor para compartilhar com segurança ativos de AI, incluindo habilidades de agente, modelos de AI e dados não estruturados. Leia o anúncio.
Na Databricks, nosso objetivo é tornar os dados e a AI acessíveis a todos, não apenas dentro de uma única organização, mas além das fronteiras organizacionais. Três componentes da Plataforma Databricks são essenciais para viabilizar o compartilhamento e a colaboração. Primeiro, nosso protocolo aberto Delta Sharing permite que os clientes compartilhem com segurança dados e ativos de AI entre nuvens e plataformas, eliminando silos e impulsionando a inovação. Segundo, o Databricks Marketplace funciona como uma plataforma aberta para todas as suas necessidades de dados e AI, contando com parceiros líderes que fornecem dados e ativos de AI nativamente no Databricks. Por fim, as Databricks Clean Rooms permitem a colaboração focada na privacidade para empresas em qualquer plataforma de nuvem.

No Data + AI Summit 2025, estamos avançando na forma como as organizações compartilham e colaboram em dados e AI. Com novos recursos e um ecossistema de parceiros expandido, estamos facilitando o compartilhamento seguro de ativos e o trabalho entre plataformas. Aqui está o que há de novo e por que isso é importante no Delta Sharing, Clean Rooms e Marketplace.
O Delta Sharing permite o compartilhamento seguro de dados entre plataformas, independentemente de nuvem, plataforma ou região. Estamos expandindo os recursos de compartilhamento de dados com novos recursos que suportam casos de uso mais amplos e reduzem a complexidade da troca de dados entre diferentes ecossistemas.
As organizações hoje costumam trabalhar com múltiplos formatos de tabela — mais comumente Delta Lake e Apache Iceberg. A Databricks oferece o suporte de ponta a ponta mais abrangente para compartilhamento de dados, não importa qual formato você use.
Com o Delta Sharing, agora você tem interoperabilidade total com o Iceberg:

Esses recursos tornam o Delta Sharing o protocolo aberto de maior alcance para compartilhamento de dados, eliminando a necessidade de duplicação de dados ou conversão de arquivos. Se você tiver interesse em testar esse recurso, inscreva-se para o Private Preview aqui.
Os provedores de dados querem manter uma única cópia de seus dados em um formato aberto — mas também querem que os clientes externos os acessem facilmente ao vivo, diretamente da fonte. Essa abordagem geralmente criava complexidade relacionada a regras de firewall e configurações de rede. O novo Delta Sharing Network Gateway elimina esse fardo. Os provedores de dados agora podem compartilhar com os destinatários com o mínimo de configuração de rede manual. Ele suporta tanto o armazenamento gerenciado pelo cliente (por exemplo, ADLS e S3) quanto o armazenamento padrão do Databricks. Se você tiver interesse em testar esse recurso, inscreva-se para o Private Preview.

O compartilhamento de tabelas de streaming e visões materializadas (MV/ST), que anteriormente estava em Public Preview, estará geralmente disponível nas próximas semanas. Isso permite que os provedores de dados criem e compartilhem com eficiência visões dos dados voltadas para o cliente usando Materialized Views e Streaming Tables.

O suporte ao ABAC (Attribute-Based Access Control) do Delta Sharing permite que os provedores apliquem com segurança políticas refinadas de acesso a dados ao compartilhar informações, garantindo que dados confidenciais sejam protegidos e, ao mesmo tempo, permitindo uma ampla colaboração de dados. Os destinatários também podem usar o ABAC nas tabelas recebidas, permitindo que governem o acesso a dados externos dentro de sua própria organização. O Beta para este recurso estará disponível nos próximos meses.

Temos o prazer de apresentar a disponibilidade geral (GA) da OIDC Token Federation para segurança aprimorada do Delta Sharing. Os provedores de dados podem compartilhar dados com segurança com usuários que não utilizam o Databricks em qualquer plataforma de computação e que preferem se autenticar usando um provedor de identidade (IdP) personalizado, como Azure Entra ID ou Okta.
Desenvolvido pelo Delta Sharing, as Databricks Clean Rooms permitem que as empresas colaborem com segurança com parceiros e clientes, sem expor dados brutos. No DAIS 2025, estamos apresentando três atualizações importantes:
Resolução de identidade focada na privacidade: ao unir ativos de dados distintos, os clientes geralmente precisam converter dados de PII em um identificador compartilhado comum para garantir que entidades relacionadas em diferentes conjuntos de dados possam ser vinculadas, mesmo sem correspondências exatas. Ao permitir que a resolução de identidade ocorra diretamente nas Databricks Clean Rooms, as organizações podem colaborar com segurança sem a necessidade de expor dados pessoais brutos a provedores de identidade terceiros.

Agora disponível no Google Cloud (GA): os clientes agora podem implantar Clean Rooms no GCP, permitindo a colaboração segura com parceiros na AWS, Azure e outras plataformas. Isso apoia nossa abordagem de colaboração em "qualquer nuvem, qualquer plataforma", sem exigir a movimentação de dados.
Colaboração entre múltiplas partes: as Clean Rooms agora oferecem suporte a múltiplos colaboradores em uma única sala. Anteriormente, cada clean room era efetivamente limitada a apenas duas partes; agora você pode convidar até 9 outras organizações (ou seja, 10 no total). Esses colaboradores podem estar em diferentes nuvens, regiões ou plataformas de dados, mas trabalham juntos em um ambiente centralizado. Isso viabiliza a colaboração em "qualquer escala, qualquer nível de confiança" e oferece suporte a colaborações de muitos para muitos com controles de acesso refinados e orquestração.
Execute seus próprios Notebooks: As Clean Rooms agora oferecem suporte a autoexecuções seguras, permitindo que colaboradores carreguem e executem seus próprios notebooks pela primeira vez, apenas com a aprovação explícita de outros participantes da clean room. Anteriormente, os notebooks só podiam ser executados pela outra parte, com a aprovação implícita ao clicar no botão de execução.
Leia este blog para obter mais informações e demonstrações detalhadas.

A Databricks está ampliando o alcance de seu ecossistema aberto ao receber parceiros para criar soluções de compartilhamento de dados, expandindo as parcerias "Built on" existentes para novos recursos e avançando em parcerias tecnológicas que ajudam clientes conjuntos a compartilhar dados de forma integrada entre plataformas.

No Data and AI Summit 2025, temos o orgulho de destacar vários novos parceiros que estão se juntando a esse ecossistema em crescimento:
Na Databricks, continuamos comprometidos em estabelecer o padrão para a colaboração de dados aberta, permitindo que as organizações compartilhem qualquer ativo com qualquer pessoa em qualquer plataforma. À medida que continuamos a inovar com o Delta Sharing, as Clean Rooms e o Databricks Marketplace, nossa meta é tornar mais fácil do que nunca colaborar em dados de forma segura e em escala.
Estamos entusiasmados para que você explore esses novos recursos e veja como eles podem transformar a maneira como sua organização colabora em dados.
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.