Ir para o conteúdo principal

O que há de novo com Databricks Clean Rooms

Clean Rooms agora suporta colaborações multi-partes em todas as nuvens com novas aprovações avançadas de privacidade

What’s New with Databricks Clean Rooms

Published: June 9, 2025

Plataforma7 min de leitura

Summary

  • Parceiros de identidade líderes usando Clean Rooms para resolução de identidade segura para a privacidade
  • Databricks Clean Rooms agora GA no GCP, permitindo colaborações cross-cloud sem interrupções
  • Colaborações multi-partes agora estão GA com aprovações de privacidade avançadas

Databricks Clean Rooms permite que clientes e parceiros analisem seus dados combinados, sem revelar dados brutos sensíveis uns aos outros. Desde o lançamento GA na AWS e Azure em fevereiro de 2025, vimos muitos clientes adotando clean rooms em Publicidade, Serviços Financeiros, Saúde e muitas outras indústrias. Neste post do blog, destacamos como os principais parceiros de identidade estão aproveitando os clean rooms para resolução de identidade segura para a privacidade, bem como novas funcionalidades de colaboração e privacidade que os clientes solicitaram.

Figure 1: Databricks Clean Rooms

Resolução de Identidade em Clean Rooms

Estamos animados para apresentar um avanço na resolução de identidade: resolução de identidade segura e nativa da nuvem em Salas Limpas Databricks. Esta inovação capacita parceiros e profissionais de marketing a combinar e enriquecer conjuntos de dados de forma confiante e segura usando identificadores comuns - tudo sem expor PII bruto ou mover dados para fora da plataforma.

Para habilitar essa capacidade, estamos entusiasmados em nos associar a líderes do setor, incluindo Epsilon, Deloitte, LiveRamp, e Acxiom. Juntos, estamos facilitando para as organizações unificar registros fragmentados, conectar dados relacionados e desbloquear insights mais ricos - tudo dentro de um ambiente centrado na privacidade.

Figure 2: Identity Resolution in Databricks Clean Rooms

Considere uma marca de comércio eletrônico colaborando com um grande provedor de identidade para resolver emails de clientes criptografados, dados postais e pontos de contato do dispositivo, para uma identidade baseada em pessoa ou domicílio. Com essa nova capacidade, ambas as partes podem trazer dados para um clean room e realizar a resolução de identidade no local - de forma segura e eficiente.

Essa abordagem marca uma nova era na colaboração de dados: uma onde os dados sensíveis nunca saem da plataforma, a correspondência de identidade acontece de forma contínua e os insights são gerados sem comprometer. A Databricks tem orgulho de impulsionar essa mudança, oferecendo um ambiente escalável que redefine o que é possível para a colaboração e resolução de identidade em clean rooms.

Clean Rooms na Google Cloud Platform (GCP)

Clean Rooms agora está geralmente disponível no Google Cloud, permitindo colaborações cross-cloud com total flexibilidade. A partir de hoje, os clientes criam um ambiente central de clean room no GCP e colaboram com parceiros em AWS, Azure, ou qualquer outra plataforma de dados. Isso está alinhado com a nossa filosofia de "Qualquer nuvem, qualquer plataforma": "Colabore em um ambiente centrado na privacidade entre nuvens, regiões e plataformas de dados sem a necessidade de movimentação de dados".

Clean Rooms na AWS, Azure e agora no GCP
Figure 3: Create Clean Rooms in AWS, Azure and now GCP

Por exemplo, um grande varejista no GCP e uma marca de consumo na AWS, procurando se associar e analisar a eficácia de seus esforços conjuntos de marketing. O varejista agora pode criar uma sala limpa no GCP e convidar a marca para contribuir de forma segura com suas métricas de engajamento a partir dos dados recentes da campanha. Ao combinar isso com os dados de compra do cliente do varejista, ambas as partes podem identificar tendências de forma colaborativa e medir o impacto das promoções - sem nunca compartilhar ou expor seus dados brutos um ao outro.

Outros provedores de clean room limitam você a colaborar em sua nuvem ou plataforma. Com Databricks Clean Rooms, você evita silos de nuvem e bloqueio de fornecedor e os dados permanecem no local via Delta Sharing, e você compartilha apenas saídas anonimizadas.

Colaboração Multi-Partes

Clean Rooms agora suporta múltiplos colaboradores em uma única sala. Anteriormente, cada clean room era efetivamente apenas para duas partes; agora você pode convidar até 9 outras organizações (ou seja, 10 no total). Esses colaboradores podem estar em diferentes nuvens, regiões ou plataformas de dados, mas trabalham juntos em um ambiente central. Isso possibilita "Qualquer escala, qualquer nível de confiança" e suporta colaborações de muitos para muitos com controles de acesso refinados e orquestração.

Suporte à Colaboração Multi-Partes
Figure 4: Multi-Party Collaboration Support

Considere um cenário de marketing de varejo: um varejista, sua marca de publicidade e uma empresa de pesquisa de mercado querem construir um modelo combinado de insights do cliente. Todas as três partes trazem dados e código proprietários. Com clean rooms multi-partes, o varejista pode convidar ambos os parceiros para um clean room, compartilhar as tabelas necessárias e executar análises conjuntas. Por exemplo, os dados de comércio eletrônico do varejista, os dados do cliente da marca e os dados da pesquisa do pesquisador podem ser unidos e analisados juntos, sem que nenhuma das partes veja as tabelas brutas umas das outras.

Ao habilitar a colaboração multi-partes com governança refinada, você desbloqueia insights mais ricos que requerem mais de duas organizações.

Aprovações de Privacidade Flexíveis

Clean Rooms agora suporta execuções autônomas seguras, permitindo que os colaboradores façam upload e executem seus próprios notebooks com aprovação explícita de outros participantes do clean room. Anteriormente, os notebooks só podiam ser executados pela outra parte, com aprovação implícita ao clicar no botão de execução.

Figure 5: Flexible Privacy Approvals

Por exemplo, o Hospital A quer executar um notebook que calcula estatísticas conjuntas em dados de pacientes compartilhados. Agora eles podem fazer o upload e executar esse notebook eles mesmos - mas somente após o Hospital B aprovar explicitamente o código. Isso equilibra flexibilidade com governança: os dados nunca se movem sem consentimento, o código nunca é executado sem revisão e a saída sempre fica com o executor. Para os clientes, isso significa iteração mais rápida, mais autonomia e total rastreabilidade - tudo dentro de um ambiente de colaboração confiável.

A governança de código é crítica na colaboração de dados. Esses recursos de aprovação garantem que nenhum código é executado sem consentimento. Você obtém um registro de auditoria de quem aprovou o quê (sem mais consultas surpresa) e reduz o risco de código malicioso ou errôneo.

Passo a Passo: Juntando Tudo

Vamos passar por um exemplo de alto nível usando todas as três características:

  1. Crie o Clean Room (no GCP): O líder da plataforma de dados (vamos chamá-lo de Alex) configura um novo clean room no Google Cloud. Ela convida dois colaboradores compartilhando seus identificadores (parceiros AWS e Azure)
  2. Adicionar Dados: Cada parte adiciona tabelas ao clean room. Por exemplo, os conjuntos de dados AWS, GCP e Azure são todos carregados na sala limpa. Agora há três colaboradores nesta sala - Alex e dois convidados. Todos os três podem ver os metadados compartilhados, mas nenhum pode ver os dados brutos dos outros.
  3. Adicionar Notebooks: Alex faz upload de notebooks de análise (por exemplo, scripts Python para ML, SQL para joins). Todas as partes devem explicitamente aprovar o notebook antes que Alex possa executá-lo.
  4. Executar a Análise: Alex agora inicia a execução do notebook. Como está aprovado, o cluster de clean room sem servidor executa o código. A execução produz tabelas de saída (resultados temporários somente leitura) no Catálogo Unity. Por exemplo, uma tabela de segmento de cliente unida é gerada para que o executor do notebook possa extrair insights agregados.
  5. Revisar e Iterar: Alex visualiza as saídas agregadas. Se uma nova análise for necessária, eles repetem, adicionando ou atualizando notebooks sob a mesma governança.

Esta demonstração mostra como parceiros cross-cloud (no GCP, AWS e Azure) podem colaborar em um único clean room compartilhado. Destaca a colaboração multi-partes, o compartilhamento de dados contínuo via Delta Sharing e a capacidade dos parceiros fazerem upload e executarem seus próprios notebooks, com aprovações explícitas. O resultado: análise conjunta segura e auditável entre nuvens e organizações, sem exposição de dados brutos.

O que vem a seguir?

As Salas Limpas Databricks continuam evoluindo, mas o valor central permanece: tornar a colaboração de dados possível sem comprometer a privacidade, o desempenho ou a flexibilidade da plataforma. Convidamos você a explorar essas novas capacidades e compartilhar feedback. Pronto para se aprofundar? Confira as seguintes sessões para aprender mais sobre Salas Limpas no Data and AI Summit, de 9 a 12 de junho de 2025, em San Francisco

 

(This blog post has been translated using AI-powered tools) Original Post

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada