Ir para o conteúdo principal

Data Sharing

Experimente o Databricks gratuitamente

O que é compartilhamento de dados?

O compartilhamento de dados é a capacidade de disponibilizar os mesmos dados para vários usuários. Atualmente, a quantidade de dados cada vez maior se tornou um ativo estratégico crítico para qualquer empresa. Compartilhar dados dentro e fora da organização é uma tecnologia fundamental que cria novas oportunidades de negócio. Além de usar dados externos, você pode compartilhá-los para ​​colaborar com parceiros, estabelecer novas parcerias e monetizar seus dados para gerar novos fluxos de receita.

Soluções tradicionais de compartilhamento de dados

Exemplos de tecnologias que permitem soluções desenvolvidas internamente incluem SFTP (SSH File Transfer Protocol) e armazenamento de objetos em nuvem. No entanto, o SFTP não se adapta bem a um grande número de clientes e só pode disponibilizar arquivos transferidos para um servidor FTP. O uso de URLs assinados de armazenamento de objetos para compartilhamento de dados pode estender a largura de banda dos serviços de armazenamento de objetos em nuvem, mas só é aplicável a determinados provedores de nuvem.

Soluções de compartilhamento de dados comerciais/de fonte fechada

Há soluções de compartilhamento de dados incorporadas aos produtos dos provedores, como Oracle, AWS Redshift e Snowflake. Essas soluções permitem compartilhar tabelas em vez de arquivos e são convenientes para uso no produto. No entanto, não são abertas e não podem compartilhar dados com diferentes plataformas.

Soluções modernas e de código aberto para compartilhamento de dados

As soluções baseadas em código aberto não têm a dependência do provedor que as soluções comerciais têm. Elas oferecem muitos benefícios, incluindo integrações com frameworks populares de processamento de dados de código aberto desenvolvidos pela comunidade. Além disso, os protocolos abertos facilitam a integração de clientes comerciais, como ferramentas de BI.

Delta Sharing

O Delta Sharing é o primeiro protocolo aberto do mundo para compartilhamento seguro de dados. Compartilhe dados facilmente dentro e fora da sua organização, independentemente da plataforma de computação usada.

  • Compartilhe dados em tempo real diretamente: compartilhe facilmente dados em tempo real existentes no Delta Lake sem copiá-los para outros sistemas.
  • Compatível com uma variedade de clientes: os destinatários dos dados podem acessar diretamente o Delta Sharing do Pandas, Apache Spark™, Rust e outros sistemas sem precisar pré-implantar uma plataforma de compute específica, reduzindo o atrito no envio de dados aos usuários.
  • Segurança e governança: ​​o Delta Sharing facilita o gerenciamento, o acompanhamento e a auditoria do acesso a conjuntos de dados compartilhados.
  • Escalabilidade: aproveite sistemas de armazenamento em nuvem, como S3, ADLS e GCS, para compartilhar grandes conjuntos de dados de maneira confiável e eficiente.

Delta Sharing no Databricks

Os usuários da Databricks podem integrar nativamente o Delta Sharing ao Unity Catalog. Isso proporciona uma experiência simplificada para compartilhar dados dentro e fora das organizações. Os administradores podem gerenciar o compartilhamento de dados e auditar centralmente todos os acessos usando o novo comando SQL CREATE SHARE ou as APIs REST. Além disso, os destinatários dos dados podem usar os dados de qualquer plataforma na nuvem.

 

Delta Sharing no Databricks

 

Delta Sharing: um ecossistema aberto

O ecossistema de parceiros comerciais e de código aberto do Delta Sharing está crescendo a cada dia. Compartilhe dados facilmente entre qualquer usuário, independentemente da localização.

 

Delta Sharing: um ecossistema aberto

 

Saiba mais sobre o compartilhamento de dados no Databricks

Inscreva-se para obter acesso prévio ao Delta Sharing do Databricks e receber informações sobre as atualizações.

Recursos adicionais

Voltar ao glossário