Databricks Clean Rooms permite que clientes e parceiros analisem seus dados combinados, sem revelar dados brutos sensíveis uns aos outros. Desde o lançamento GA na AWS e Azure em fevereiro de 2025, vimos muitos clientes adotando clean rooms em Publicidade, Serviços Financeiros, Saúde e muitas outras indústrias. Neste post do blog, destacamos como os principais parceiros de identidade estão aproveitando os clean rooms para resolução de identidade segura para a privacidade, bem como novas funcionalidades de colaboração e privacidade que os clientes solicitaram.
Estamos animados para apresentar um avanço na resolução de identidade: resolução de identidade segura e nativa da nuvem em Salas Limpas Databricks. Esta inovação capacita parceiros e profissionais de marketing a combinar e enriquecer conjuntos de dados de forma confiante e segura usando identificadores comuns - tudo sem expor PII bruto ou mover dados para fora da plataforma.
Para habilitar essa capacidade, estamos entusiasmados em nos associar a líderes do setor, incluindo Epsilon, Deloitte, LiveRamp, e Acxiom. Juntos, estamos facilitando para as organizações unificar registros fragmentados, conectar dados relacionados e desbloquear insights mais ricos - tudo dentro de um ambiente centrado na privacidade.
Considere uma marca de comércio eletrônico colaborando com um grande provedor de identidade para resolver emails de clientes criptografados, dados postais e pontos de contato do dispositivo, para uma identidade baseada em pessoa ou domicílio. Com essa nova capacidade, ambas as partes podem trazer dados para um clean room e realizar a resolução de identidade no local - de forma segura e eficiente.
Essa abordagem marca uma nova era na colaboração de dados: uma onde os dados sensíveis nunca saem da plataforma, a correspondência de identidade acontece de forma contínua e os insights são gerados sem comprometer. A Databricks tem orgulho de impulsionar essa mudança, oferecendo um ambiente escalável que redefine o que é possível para a colaboração e resolução de identidade em clean rooms.
Clean Rooms agora está geralmente disponível no Google Cloud, permitindo colaborações cross-cloud com total flexibilidade. A partir de hoje, os clientes criam um ambiente central de clean room no GCP e colaboram com parceiros em AWS, Azure, ou qualquer outra plataforma de dados. Isso está alinhado com a nossa filosofia de "Qualquer nuvem, qualquer plataforma": "Colabore em um ambiente centrado na privacidade entre nuvens, regiões e plataformas de dados sem a necessidade de movimentação de dados".
Por exemplo, um grande varejista no GCP e uma marca de consumo na AWS, procurando se associar e analisar a eficácia de seus esforços conjuntos de marketing. O varejista agora pode criar uma sala limpa no GCP e convidar a marca para contribuir de forma segura com suas métricas de engajamento a partir dos dados recentes da campanha. Ao combinar isso com os dados de compra do cliente do varejista, ambas as partes podem identificar tendências de forma colaborativa e medir o impacto das promoções - sem nunca compartilhar ou expor seus dados brutos um ao outro.
Outros provedores de clean room limitam você a colaborar em sua nuvem ou plataforma. Com Databricks Clean Rooms, você evita silos de nuvem e bloqueio de fornecedor e os dados permanecem no local via Delta Sharing, e você compartilha apenas saídas anonimizadas.
Clean Rooms agora suporta múltiplos colaboradores em uma única sala. Anteriormente, cada clean room era efetivamente apenas para duas partes; agora você pode convidar até 9 outras organizações (ou seja, 10 no total). Esses colaboradores podem estar em diferentes nuvens, regiões ou plataformas de dados, mas trabalham juntos em um ambiente central. Isso possibilita "Qualquer escala, qualquer nível de confiança" e suporta colaborações de muitos para muitos com controles de acesso refinados e orquestração.
Considere um cenário de marketing de varejo: um varejista, sua marca de publicidade e uma empresa de pesquisa de mercado querem construir um modelo combinado de insights do cliente. Todas as três partes trazem dados e código proprietários. Com clean rooms multi-partes, o varejista pode convidar ambos os parceiros para um clean room, compartilhar as tabelas necessárias e executar análises conjuntas. Por exemplo, os dados de comércio eletrônico do varejista, os dados do cliente da marca e os dados da pesquisa do pesquisador podem ser unidos e analisados juntos, sem que nenhuma das partes veja as tabelas brutas umas das outras.
Ao habilitar a colaboração multi-partes com governança refinada, você desbloqueia insights mais ricos que requerem mais de duas organizações.
Clean Rooms agora suporta execuções autônomas seguras, permitindo que os colaboradores façam upload e executem seus próprios notebooks com aprovação explícita de outros participantes do clean room. Anteriormente, os notebooks só podiam ser executados pela outra parte, com aprovação implícita ao clicar no botão de execução.
Por exemplo, o Hospital A quer executar um notebook que calcula estatísticas conjuntas em dados de pacientes compartilhados. Agora eles podem fazer o upload e executar esse notebook eles mesmos - mas somente após o Hospital B aprovar explicitamente o código. Isso equilibra flexibilidade com governança: os dados nunca se movem sem consentimento, o código nunca é executado sem revisão e a saída sempre fica com o executor. Para os clientes, isso significa iteração mais rápida, mais autonomia e total rastreabilidade - tudo dentro de um ambiente de colaboração confiável.
A governança de código é crítica na colaboração de dados. Esses recursos de aprovação garantem que nenhum código é executado sem consentimento. Você obtém um registro de auditoria de quem aprovou o quê (sem mais consultas surpresa) e reduz o risco de código malicioso ou errôneo.
Vamos passar por um exemplo de alto nível usando todas as três características:
Esta demonstração mostra como parceiros cross-cloud (no GCP, AWS e Azure) podem colaborar em um único clean room compartilhado. Destaca a colaboração multi-partes, o compartilhamento de dados contínuo via Delta Sharing e a capacidade dos parceiros fazerem upload e executarem seus próprios notebooks, com aprovações explícitas. O resultado: análise conjunta segura e auditável entre nuvens e organizações, sem exposição de dados brutos.
As Salas Limpas Databricks continuam evoluindo, mas o valor central permanece: tornar a colaboração de dados possível sem comprometer a privacidade, o desempenho ou a flexibilidade da plataforma. Convidamos você a explorar essas novas capacidades e compartilhar feedback. Pronto para se aprofundar? Confira as seguintes sessões para aprender mais sobre Salas Limpas no Data and AI Summit, de 9 a 12 de junho de 2025, em San Francisco
(This blog post has been translated using AI-powered tools) Original Post