Ir para o conteúdo principal

As 10 perguntas mais frequentes sobre o Delta Sharing, respondidas - Parte 1

Receba respostas para suas 10 principais perguntas sobre o Delta Sharing, o protocolo de compartilhamento aberto mais amplamente adotado

top 10 delta sharing questions answered part 1 og image

Published: October 30, 2025

Produto9 min de leitura

Summary

  • O Delta Sharing permite compartilhar dados ao vivo e ativos de AI sem copiar arquivos, eliminando a duplicação e garantindo que os destinatários sempre tenham as informações mais recentes.
  • Você pode compartilhar tabelas, views, streams, notebooks, modelos, etc., e qualquer pessoa pode extrair os dados com ferramentas de uso diário como Python, Spark, Power BI.
  • Está crescendo rapidamente (300% YoY) e 40% de seus compartilhamentos ativos são com usuários fora do ecossistema da Databricks, o que comprova que ele funciona como um protocolo de compartilhamento de dados aberto e multiplataforma.

Delta Sharing está ganhando um impulso incrível, com um crescimento de 300% ano a ano em compartilhamentos ativos. Isso não é apenas uma transferência de arquivos única; representa uma colaboração contínua e sustentada que prova que um valor real está sendo trocado.

Um key fator nesse crescimento é a filosofia aberta da plataforma. O Delta Sharing permite que os clientes compartilhem qualquer ativo de dados e AI, com qualquer pessoa, sem nenhum atrito.  40% dos compartilhamentos ativos do Delta Sharing são com destinatários fora do ecossistema Databricks. Isso demonstra que o Delta Sharing está impulsionando um ecossistema de colaboração aberto que abrange diferentes plataformas e clouds.

Neste post, reunimos as 10 principais perguntas que as pessoas fazem sobre o Delta Compartilhamento. Continue lendo para ter uma visão geral, entender por que ele é diferente, quais são os casos de uso mais comuns e do que você precisa para começar.

1. O que é o Delta Sharing?

Delta Sharing é o protocolo aberto mais usado para o compartilhamento de dados seguro. Ele permite que as organizações troquem dados em tempo real e ativos de AI entre plataformas e clouds.

2. O que torna o Delta Sharing diferente?

A maioria das ferramentas de compartilhamento força você a copiar dados para um novo destino, criando silos de dados obsoletos e expandindo sua superfície de ataque. O Delta Sharing permite que você leia dados em tempo real na origem, então não é preciso mover ou duplicar nada.

Segundo, como o Delta Sharing é de código aberto, ele não está vinculado a um único ecossistema. Você pode compartilhar do seu lakehouse Databricks ou de outro lugar, e os destinatários podem consumir os dados independentemente de usarem o Databricks ou não.

Finalmente, os destinatários se conectam por meio de conectores abertos e padrão: Python, Apache Spark, Java, Power BI e outros, para ler as tabelas compartilhadas que você autoriza.

Em conjunto, o Delta Sharing oferece colaboração independente de plataforma para dados e AI entre equipes, ferramentas e clouds. Você consegue trabalhar sem lock-in, sem cópias e sem lacunas de governança.

3. O Delta Sharing funciona com o Iceberg? Se eu usar o Apache Iceberg, como posso aproveitar o Delta Sharing?

Sim, o Delta Sharing é totalmente compatível com o Apache Iceberg. Ao escolher o Delta Sharing, você obtém o melhor dos dois mundos: acesso ao mais amplo ecossistema de colaboração com o Apache Iceberg funcionando perfeitamente como sua fonte de dados e destino, enquanto aproveita todo o poder do Delta Sharing.

O Delta Sharing torna o compartilhamento um primitivo de primeira classe no Iceberg. Com recursos exclusivos, como a federação de tokens OIDC, que permite que destinatários abertos se autentiquem com IdPs personalizados, e o Network Gateway, que simplifica e escala a configuração de rede, os clientes desbloqueiam a interoperabilidade total entre formatos de tabela.

Tabelas gerenciadas no Unity Catalog agora podem ser compartilhadas com clientes Iceberg como Snowflake, Trino e Spark. Além disso, tabelas Iceberg externas gerenciadas por catálogos como Hive Metastore ou AWS Glue podem ser federadas no Unity Catalog e então compartilhadas pelo mesmo protocolo. Em ambos os casos, você registro as tabelas no Unity Catalog, cria um compartilhamento e adiciona os destinatários relevantes dentro ou fora do Databricks. Isso garante que os usuários do Iceberg possam colaborar com os clientes da Databricks usando dados governados e em tempo real, sem movê-los ou duplicá-los.

4. Posso usar o Delta Sharing para compartilhar dados com usuários que não são clientes do Databricks?

Sim, você pode compartilhar dados com todos os seus destinatários, independentemente de usarem o Databricks ou qualquer outra plataforma. O Delta Sharing é um protocolo aberto que funciona tanto para o compartilhamento Databricks-to-Databricks quanto para o Open Sharing. O Delta Sharing oferece conectores abertos que os destinatários podem usar em qualquer plataforma, incluindo um conector do Apache Spark, um conector do Pandas, um conector do Iceberg Rest Catalog, bem como conectores para Power BI, Tableau e Excel. O compartilhamento aberto permite que você compartilhe não apenas tabelas, mas também views, partições e feeds de dados de alterações, permitindo que você otimize sua experiência de compartilhamento de dados mesmo ao compartilhar externamente.

5. Por que usar o Delta Sharing? Quais problemas ele resolve?

Analisamos como milhares de clientes estão usando o Delta Sharing e descobrimos quatro maneiras principais pelas quais ele realmente faz a diferença para os negócios deles.

Caso de usoDescriçãoExemplo de Cliente/Parceiro
Compartilhamento internoQuebrando os silos de dados dentro de uma empresa, entre unidades de negócios e clouds.Mercedes-Benz o utiliza para criar um data mesh unificado para suas equipes globais.
Compartilhamento peer-to-peerColaborar com segurança com parceiros, fornecedores e clientes.Procore oferece aos clientes acesso direto a dados críticos de projetos para analítica.
Licenciamento de dados de terceirosLicenciando e integrando dados externos e modelos de AI.S&P Global disponibiliza seus datasets de inteligência de mercado no Databricks Marketplace
Compartilhamento de aplicativos SaaSConectando-se a dados bloqueados em várias aplicações SaaS.Oracle Autonomous Database— junto com o Oracle Fusion Data Intelligence — agora pode compartilhar dados de forma segura e perfeita com o Databricks e outras plataformas

6. Se eu já compartilho dados usando SFTP, S3, Dropbox ou email, por que eu precisaria do Delta Sharing?

Se você ainda compartilha dados por SFTP, S3, Dropbox ou email, você está expondo sua organização a riscos e ineficiências desnecessários. Veja o que aconteceu com a Finastra, onde invasores exploraram uma fraqueza do SFTP, roubando aproximadamente 400 GB de dados confidenciais.

Esses truques antiquados podem até funcionar, mas são ultrapassados e frágeis. Você acaba copiando arquivos inteiros, lidando com senhas ou keys estáticas que nunca expiram e criando inúmeras cópias dessincronizadas que abrem grandes brechas de segurança e compliance. O Delta Sharing substitui tudo isso por uma abordagem moderna, segura e auditável. Você pode compartilhar apenas as tabelas, linhas ou colunas específicas de que alguém precisa (e modelos de AI também), e a pessoa que acessa os dados sempre vê a versão mais recente, porque não há nenhuma cópia extra circulando.

A segurança também é mais rigorosa. Em vez de distribuir senhas estáticas ou chaves de acesso, o Delta Sharing distribui tokens de curta duração e pode se conectar ao sistema de identidade que você já usa, para que você nunca precise gerenciar um conjunto separado de credenciais. Toda vez que alguém acessa os dados, a ação é registrada no Unity Catalog, o que torna a auditoria e a compliance muito mais fáceis.

Se você leva a sério a proteção de dados confidenciais e a simplificação da colaboração, o Delta Sharing não é algo "bom de se ter"; é o requisito básico para a troca segura de dados atualmente.

Confira Como a Kythera Labs, um parceiro Built-On da Databricks, economiza mais de US$ 2 milhões por ano usando o Delta Sharing

7. Que tipos de ativos posso compartilhar usando o Delta Sharing?

Você pode compartilhar quase qualquer tipo de dado ou ativo de AI com o Delta Sharing, e essa abrangência é bastante única. Isso inclui tabelas (e partições de tabela), tabelas de transmissão, tabelas Iceberg gerenciadas, esquemas e tabelas estrangeiros, views (incluindo views dinâmicas para filtragem de linhas/colunas), visualizações materializadas, volumes, Notebooks e modelos de AI. Se você compartilhar um esquema (banco de dados) inteiro, tudo o que há nele (tabelas, views, volumes, modelos) será compartilhado imediatamente, e quaisquer novos ativos adicionados posteriormente também ficarão disponíveis para os destinatários. Todos esses ativos estão vinculados a um único metastore do Unity Catalog, mantendo o compartilhamento limpo e organizado.

8. Como o Delta Sharing mantém os dados seguros quando um provedor os compartilha com um destinatário?

O Delta Compartilhamento usa uma abordagem de confiança zero e baseada em tokens. Quando alguém solicita dados, o servidor de compartilhamento verifica o Unity Catalog e, em seguida, entrega um token somente leitura de curta duração ou um URL pré-assinado que aponta diretamente para o armazenamento — assim, nenhuma senha permanente jamais sai do provedor. Todo o tráfego é envolvido pela criptografia TLS, e cada solicitação é Logs para auditoria. No compartilhamento de Databricks para Databricks, o handshake é tratado automaticamente; usuários externos podem se autenticar com arquivos de credenciais simples ou federação OIDC, mas o mesmo modelo de tokens temporário, criptografado e totalmente auditado se aplica. Isso garante que apenas as pessoas certas possam ver os dados certos, e apenas por um tempo limitado. Leia Como o Delta Sharing Permite a Colaboração Segura de Ponta a Ponta para um aprofundamento.

9. Parece bom. Quais são as implicações de custo de usar o Delta Sharing?

Começar a usar o Delta Compartilhamento não custa nada — não há cobrança para configurar ou compartilhar um conjunto de dados ou modelo de AI. Você só recebe uma cobrança quando alguém realmente query os dados e, mesmo assim, as taxas são divididas em três partes claras.

Primeiro, o custo de compute (o poder de processamento necessário para a execução da query) geralmente é pago pela pessoa que faz a query, embora o proprietário dos dados possa optar por cobri-lo se isso fizer mais sentido.

Segundo, há o custo de egresso pela movimentação de dados para fora da cloud do provedor; o novo modo R2 (agora em GA) oferece até mesmo uma opção de “egresso zero”, para que você possa evitar essa cobrança completamente.

Terceiro, o custo de armazenamento só importa se você decidir manter uma cópia replicada — o acesso ao vivo e em tempo real não requer espaço extra.

Aqui está um exemplo de compartilhamento de Databricks para Databricks: imagine que um fornecedor na AWS compartilha uma view materializada com um varejista no Azure. Quando os dados são compartilhados, o fornecedor paga o egresso pelos dados que saem da AWS, e quando o varejista executa uma query nos dados compartilhados, o varejista paga pelo compute da query.

10. Do que eu preciso para começar a usar o Delta Sharing?

Os requisitos dependem se você está compartilhando com um destinatário Databricks ou com um destinatário que não usa o Databricks.

O compartilhamento externo deve estar ativado, e as organizações devem acompanhar a governança e os possíveis custos de saída entre clouds.

Tudo pronto para começar?

Fique atento para a próxima série de perguntas, onde exploraremos tópicos como segurança, como o Delta Sharing potencializa produtos como Clean Rooms e Databricks Marketplace e outros recursos avançados.

 

(This blog post has been translated using AI-powered tools) Original Post

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada