ARMAZENAMENTO LAKEHOUSE

Construído para armazenamento de dados aberto e inteligente

Escolha o local e o formato de armazenamento, com total controle e portabilidade dos seus dados.

Experimente gratuitamente Assista à demonstração

EQUIPES DE MELHOR DESEMPENHO USAM A INTELIGÊNCIA DE DADOS

Seu guia compacto para analítica moderna

Seu guia essencial para fornecer analítica moderno e confiável para AI na Databricks Platform

Leia o artigo

Benefícios

Armazenamento Lakehouse flexível e rápido

Elimine as dores de cabeça com a gestão de dados com formatos de tabela abertos, governança centralizada e otimizações automáticas de dados.

Formatos compatíveis

Uma única cópia dos dados de origem no Delta Lake ou Apache Iceberg™ que pode ser acessada por qualquer motor.

Governança unificada

Um único catálogo para descoberta e governança de dados, abrangendo seus dados e ativos de IA.

Desempenho impulsionado por IA

Modelos alimentados por IA otimizam e mantêm dados de forma autônoma para velocidade e baixo custo.

Recursos

Seus dados, do seu jeito

Escolha o local de armazenamento e o formato aberto que funciona para você. Mantenha seus dados portáteis, sem bloqueio de fornecedor.

Desempenho de leitura e escrita de primeira classe para tabelas Delta Lake e Apache Iceberg™, pronto para uso, com otimizações de armazenamento não disponíveis em qualquer outro lakehouse.

Mais sobre tabelas gerenciadas

Acesse tabelas gerenciadas por catálogos externos como Glue, HMS e Snowflake Horizon e aproveite recursos avançados do Catálogo Unity, como controles de acesso refinados.

Mais sobre tabelas estrangeiras

Unity Catalog architecture with client connections

As APIs de Catálogo REST Unity e Iceberg desbloqueiam todo o ecossistema lakehouse, abrangendo formatos e motores.

Mais sobre o uso de sistemas externos

Unity Catalog architecture with connected clients

Mais recursos

Transações ACID

Atomicidade, consistência, isolamento e garantias de durabilidade fornecidas por protocolos de formato de tabela aberta.

Saiba mais

Otimização preditiva

Otimizações de tabela impulsionadas por AI com base em seus dados e padrões de uso que mantêm suas tabelas ajustadas automaticamente.

Saiba mais

Liquid Clustering

Disposição de dados pronta para uso e autoajustável que escala com seus dados, sem a necessidade de partições.

Saiba mais

Alterar Feed de Dados

Rastreie as alterações no nível da linha entre as versões de uma tabela Delta.

Saiba mais

Viagem no Tempo

Informações históricas sobre tabelas permitem que você audite operações, reverta uma tabela ou consulte uma tabela em um ponto específico no tempo.

Saiba mais

Streaming estruturado

Integração com o Apache Spark™ Structured Streaming, um motor de processamento quase em tempo real que oferece tolerância a falhas de ponta a ponta com garantias de processamento exatamente uma vez.

Saiba mais

Casos de uso

Para todas as suas cargas de trabalho de análise e IA

Construa e gerencie pipelines de dados confiáveis

Sua frase principal opcional aparece aqui, exibida um pouco maior.

As tabelas gerenciadas atuam como tabelas de lote e como fonte e destino de streaming. A ingestão de dados de streaming, o preenchimento histórico em batch e as queries interativas funcionam sem nenhum esforço extra, integrando-se diretamente ao Spark Structured Streaming.

Saiba mais

Explore as demonstrações do Delta Lake

Veja todas as demonstrações

Tutorial

Delta Lake

Demo

Lendo Tabelas do Catálogo Unity no Snowflake

Tour do produto

Delta Lake 3.0: UniForm e Clustering Líquido

Tutorial

Pipeline CDC com Delta

Produtos relacionados

Descubra, governe e compartilhe seus dados e ativos de IA

Saiba mais sobre como a Databricks Data Intelligence Platform capacita suas equipes de dados em todas as suas cargas de trabalho de dados e IA.

Unity Catalog

A única solução de governança unificada e aberta do setor para dados e IA, integrada à Databricks Data Intelligence Platform.

Delta Sharing

A primeira abordagem de código aberto para compartilhamento de dados entre dados, análises e IA. Compartilhe dados ao vivo de forma segura entre plataformas, nuvens e regiões.