Ir para o conteúdo principal
Anúncios

Novidades em Compartilhamento de Dados e Colaboração – Verão de 2025

As mais recentes inovações da Databricks que tornam o compartilhamento aberto e a colaboração mais fáceis do que nunca — em qualquer nuvem, qualquer formato e com qualquer parceiro

por Akram Chetibi, Zaheera Valani, Harish Gaur, Darshana Sivakumar, Tia Chang e Tao Tao

  • Inovações do Delta Sharing: Delta Sharing para clientes Iceberg, Delta Sharing Network Gateway e Delta Sharing com ABAC.
  • Expansão do ecossistema do Marketplace e Delta Sharing com parceiros de dados líderes, incluindo SAP, S&P Global, Magnite, IAS, Moody’s, SambaTV e Crunchbase.
  • Aprimoramentos do Clean Rooms: resolução de identidade centrada na privacidade, suporte para colaborações multipartidárias e controles avançados de aprovações.

O Delta Sharing evoluiu para OpenSharing, o primeiro protocolo aberto e neutro de fornecedor para compartilhar com segurança ativos de AI, incluindo habilidades de agente, modelos de AI e dados não estruturados. Leia o anúncio.

Na Databricks, nosso objetivo é tornar os dados e a AI acessíveis a todos, não apenas dentro de uma única organização, mas além das fronteiras organizacionais. Três componentes da Plataforma Databricks são essenciais para viabilizar o compartilhamento e a colaboração. Primeiro, nosso protocolo aberto Delta Sharing permite que os clientes compartilhem com segurança dados e ativos de AI entre nuvens e plataformas, eliminando silos e impulsionando a inovação. Segundo, o Databricks Marketplace funciona como uma plataforma aberta para todas as suas necessidades de dados e AI, contando com parceiros líderes que fornecem dados e ativos de AI nativamente no Databricks. Por fim, as Databricks Clean Rooms permitem a colaboração focada na privacidade para empresas em qualquer plataforma de nuvem.

Compartilhamento de dados e colaboração no Databricks
">

No Data + AI Summit 2025, estamos avançando na forma como as organizações compartilham e colaboram em dados e AI. Com novos recursos e um ecossistema de parceiros expandido, estamos facilitando o compartilhamento seguro de ativos e o trabalho entre plataformas. Aqui está o que há de novo e por que isso é importante no Delta Sharing, Clean Rooms e Marketplace.

Inovações do Delta Sharing para interoperabilidade e simplificação

O Delta Sharing permite o compartilhamento seguro de dados entre plataformas, independentemente de nuvem, plataforma ou região. Estamos expandindo os recursos de compartilhamento de dados com novos recursos que suportam casos de uso mais amplos e reduzem a complexidade da troca de dados entre diferentes ecossistemas.

Colaboração de dados externos com Apache Iceberg™ e Delta Sharing

As organizações hoje costumam trabalhar com múltiplos formatos de tabela — mais comumente Delta Lake e Apache Iceberg. A Databricks oferece o suporte de ponta a ponta mais abrangente para compartilhamento de dados, não importa qual formato você use.

Com o Delta Sharing, agora você tem interoperabilidade total com o Iceberg:

  • Compartilhamento entre plataformas para qualquer mecanismo compatível com Iceberg, permitindo que os provedores de dados alcancem seus clientes em plataformas como AWS ou Snowflake.
  • Os provedores de dados agora podem usar o Delta Sharing para compartilhar tabelas Iceberg assim como qualquer outro ativo do UC, tanto dentro do Databricks quanto fora dele (Public Preview)
Colaboração de dados externos com Apache Iceberg™ e Delta Sharing
">

Esses recursos tornam o Delta Sharing o protocolo aberto de maior alcance para compartilhamento de dados, eliminando a necessidade de duplicação de dados ou conversão de arquivos. Se você tiver interesse em testar esse recurso, inscreva-se para o Private Preview aqui.

Delta Sharing Network Gateway: compartilhamento de Lakehouse aberto com configuração de rede simplificada

Os provedores de dados querem manter uma única cópia de seus dados em um formato aberto — mas também querem que os clientes externos os acessem facilmente ao vivo, diretamente da fonte. Essa abordagem geralmente criava complexidade relacionada a regras de firewall e configurações de rede. O novo Delta Sharing Network Gateway elimina esse fardo. Os provedores de dados agora podem compartilhar com os destinatários com o mínimo de configuração de rede manual. Ele suporta tanto o armazenamento gerenciado pelo cliente (por exemplo, ADLS e S3) quanto o armazenamento padrão do Databricks. Se você tiver interesse em testar esse recurso, inscreva-se para o Private Preview.

Delta Sharing Network Gateway
">

Delta Sharing com o menor TCO: Streaming Tables e Materialized Views

O compartilhamento de tabelas de streaming e visões materializadas (MV/ST), que anteriormente estava em Public Preview, estará geralmente disponível nas próximas semanas. Isso permite que os provedores de dados criem e compartilhem com eficiência visões dos dados voltadas para o cliente usando Materialized Views e Streaming Tables.

Compartilhamento de MV/ST
">

Governança refinada de compartilhamentos usando controles de acesso baseados em atributos

O suporte ao ABAC (Attribute-Based Access Control) do Delta Sharing permite que os provedores apliquem com segurança políticas refinadas de acesso a dados ao compartilhar informações, garantindo que dados confidenciais sejam protegidos e, ao mesmo tempo, permitindo uma ampla colaboração de dados. Os destinatários também podem usar o ABAC nas tabelas recebidas, permitindo que governem o acesso a dados externos dentro de sua própria organização. O Beta para este recurso estará disponível nos próximos meses.

Delta Sharing com ABAC
">

OIDC Token Federation

Temos o prazer de apresentar a disponibilidade geral (GA) da OIDC Token Federation para segurança aprimorada do Delta Sharing. Os provedores de dados podem compartilhar dados com segurança com usuários que não utilizam o Databricks em qualquer plataforma de computação e que preferem se autenticar usando um provedor de identidade (IdP) personalizado, como Azure Entra ID ou Okta.

Clean Rooms: colaboração focada na privacidade, agora no GCP e com recursos expandidos

Desenvolvido pelo Delta Sharing, as Databricks Clean Rooms permitem que as empresas colaborem com segurança com parceiros e clientes, sem expor dados brutos. No DAIS 2025, estamos apresentando três atualizações importantes:

Resolução de identidade focada na privacidade: ao unir ativos de dados distintos, os clientes geralmente precisam converter dados de PII em um identificador compartilhado comum para garantir que entidades relacionadas em diferentes conjuntos de dados possam ser vinculadas, mesmo sem correspondências exatas. Ao permitir que a resolução de identidade ocorra diretamente nas Databricks Clean Rooms, as organizações podem colaborar com segurança sem a necessidade de expor dados pessoais brutos a provedores de identidade terceiros.

Resolução de identidade em Clean Rooms
">

Agora disponível no Google Cloud (GA): os clientes agora podem implantar Clean Rooms no GCP, permitindo a colaboração segura com parceiros na AWS, Azure e outras plataformas. Isso apoia nossa abordagem de colaboração em "qualquer nuvem, qualquer plataforma", sem exigir a movimentação de dados.

Colaboração entre múltiplas partes: as Clean Rooms agora oferecem suporte a múltiplos colaboradores em uma única sala. Anteriormente, cada clean room era efetivamente limitada a apenas duas partes; agora você pode convidar até 9 outras organizações (ou seja, 10 no total). Esses colaboradores podem estar em diferentes nuvens, regiões ou plataformas de dados, mas trabalham juntos em um ambiente centralizado. Isso viabiliza a colaboração em "qualquer escala, qualquer nível de confiança" e oferece suporte a colaborações de muitos para muitos com controles de acesso refinados e orquestração.

Execute seus próprios Notebooks: As Clean Rooms agora oferecem suporte a autoexecuções seguras, permitindo que colaboradores carreguem e executem seus próprios notebooks pela primeira vez, apenas com a aprovação explícita de outros participantes da clean room. Anteriormente, os notebooks só podiam ser executados pela outra parte, com a aprovação implícita ao clicar no botão de execução.

Leia este blog para obter mais informações e demonstrações detalhadas.

Colaboração multiparte, suporte a GCP e execução de seus próprios Notebooks em ação
">

Expansão do Databricks Marketplace e do ecossistema de compartilhamento

A Databricks está ampliando o alcance de seu ecossistema aberto ao receber parceiros para criar soluções de compartilhamento de dados, expandindo as parcerias "Built on" existentes para novos recursos e avançando em parcerias tecnológicas que ajudam clientes conjuntos a compartilhar dados de forma integrada entre plataformas.

Novos parceiros de Marketplace e compartilhamento
">

No Data and AI Summit 2025, temos o orgulho de destacar vários novos parceiros que estão se juntando a esse ecossistema em crescimento:

  • SAP (em breve): Os clientes podem acessar dados corporativos do Business Data Cloud (BDC) da SAP diretamente no Databricks, sem ferramentas de ETL de terceiros. Essa integração usa o Delta Sharing para fornecer acesso a dados em tempo real sem replicação de dados, reduzindo tempo e custos.
  • S&P Global Market Intelligence: A S&P Global Market Intelligence agora oferece seus conjuntos de dados do Capital IQ Pro no Databricks Marketplace via Delta Sharing. Os usuários podem acessar dados financeiros, estimativas, dados de ESG e muito mais — de forma instantânea, segura e sem movimentação de dados.
  • FactSet: Uma fonte confiável de inteligência financeira, a FactSet traz dados econômicos, de mercado e de nível de empresa de alta qualidade para o Databricks Marketplace, permitindo que profissionais de investimento e risco acelerem o tempo até a obtenção de insights em diversos casos de uso.
  • IAS (em breve): A Integral Ad Science (IAS) agora oferece conjuntos de dados de qualidade de mídia no Databricks Marketplace via Delta Sharing. Os usuários do Databricks podem aproveitar os insights da IAS para obter melhor direcionamento, otimização e desempenho, sem duplicar ou mover dados.
  • Infor Nexus: A Infor Nexus agora oferece conjuntos de dados de rede de negócios de cadeia de suprimentos por meio do Delta Sharing, permitindo que as empresas combinem dados corporativos e de rede para alinhar melhor o planejamento e as operações com as realidades atuais.
  • Magnite (em breve): A Magnite, a maior plataforma independente de anúncios sell-side do mundo, agora oferece ativação de publicidade no Databricks Marketplace via Delta Sharing, permitindo que editores e anunciantes compartilhem, ativem e meçam dados com segurança em todas as telas.
  • Crunchbase: A Crunchbase fornece inteligência preditiva e dados históricos sobre empresas privadas, oferecendo a investidores, analistas e negociadores a vantagem de sair na frente para descobrir e agir sobre oportunidades no mercado privado.
  • SambaTV (em breve): A Samba TV, líder global em inteligência de mídia baseada em AI, agora está disponível no Databricks Marketplace por meio do Delta Sharing, facilitando para marcas, agências e editores o acesso a insights em tempo real, direcionamento de público e ferramentas de medição alimentadas por dados primários de TV e web — ajudando-os a alcançar e engajar públicos em todas as telas com precisão.

O futuro da colaboração de dados

Na Databricks, continuamos comprometidos em estabelecer o padrão para a colaboração de dados aberta, permitindo que as organizações compartilhem qualquer ativo com qualquer pessoa em qualquer plataforma. À medida que continuamos a inovar com o Delta Sharing, as Clean Rooms e o Databricks Marketplace, nossa meta é tornar mais fácil do que nunca colaborar em dados de forma segura e em escala.

O que vem a seguir?

Estamos entusiasmados para que você explore esses novos recursos e veja como eles podem transformar a maneira como sua organização colabora em dados.

(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

Receba os posts mais recentes na sua caixa de entrada

Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.