Ir para o conteúdo principal

SQL no Databricks Lakehouse em 2025

Mais rápido, mais inteligente e livre de manutenção

DBSQL performance OG

Published: December 17, 2025

Produto8 min de leitura

Summary

  • Analítica mais rápida sem ajustes: O DBSQL adicionou outro aumento automático de velocidade este ano, melhorando o desempenho do painel e da query sem nenhum gerenciamento de índice ou parâmetro.
  • AI incorporada diretamente nos fluxos de trabalho do SQL: Novas funções de AI permitem que os analistas usem LLMs e processem documentos em SQL, reduzindo as transferências e acelerando a geração de percepções.
  • SQL aberto e melhor controle de custos: Os recursos expandidos de SQL em conformidade com ANSI simplificam as migrações de warehouses legados, enquanto as novas ferramentas de monitoramento de custos oferecem às equipes uma visibilidade mais clara dos gastos.

Os data warehouses tradicionais são lentos, caros e dependem de sistemas proprietários. Eles exigem ajustes constantes e criam atrito para as equipes de analítica que precisam de velocidade e escala, além de atrasar as decisões nas equipes de finanças, operações e do produto. O Databricks SQL (DBSQL) remove esses limites. Ele é, em média, 5x mais rápido, funciona com execução serverless e segue padrões abertos. Essa inteligência de desempenho default não está restrita a planos premium. 

Mais de 60% das empresas da Fortune 500 usam o DBSQL para analítica e BI na Databricks Data Intelligence Platform. 

Em 2025, o DBSQL continuou a oferecer funcionalidades que aprimoraram o desempenho, a AI, o gerenciamento de custos e os recursos de SQL aberto. Este resumo destaca as atualizações que causaram o maior impacto para as equipes de dados este ano.

desempenho que melhora automaticamente

Consultas mais rápidas sem ajuste

Desde 2022, o DBSQL Serverless proporcionou uma melhora de desempenho média de 5x. Dashboards que antes levavam 10 segundos agora carregam em cerca de 2 segundos, sem exigir gerenciamento de índices ou ajuste manual. 

Em 2025, o desempenho melhorou novamente:

Melhorias de desempenho para o DBSQL

Como o Databricks é desenvolvido na Plataforma de Inteligência de Dados, essa inteligência está disponível para todos os clientes por padrão, sem ficar restrita a planos premium ou às ofertas mais caras.

Melhor visibilidade com o Query Profile

Para ajudar as equipes a entender os padrões de desempenho, a view atualizada do Query Profile agora inclui:

  • Um resumo visual das métricas de leitura e gravação
  • Um painel de “Principais operadores” para identificar as partes mais custosas de uma query
  • Navegação mais clara pelo gráfico de execução
  • Filtros para você se concentrar em métricas específicas
Melhorias na UX do perfil da query

Isso ajuda as equipes a diagnosticar dashboards lentos e modelos complexos com mais rapidez, sem depender de suposições.

AI integrada diretamente aos fluxos de trabalho SQL

AI agora faz parte da analítica do dia a dia. Em 2025, o DBSQL introduziu funções de AI nativas para que os analistas possam usar modelos de linguagem grandes diretamente no SQL. Alguns dos novos recursos incluem:

  • ai_query para resumo, classificação, extração e análise de sentimento
  • ai_parse_document, atualmente em versão beta, converte PDFs e outros documentos não estruturados em tabelas

Essas funções são executadas em modelos hospedados no Databricks, como Meta Llama e OpenAI GPT OSS, ou em modelos personalizados que você fornece. Eles são otimizados para escala e até 3x mais rápidos que as abordagens alternativas.

As equipes agora podem resumir tíquetes de suporte, extrair campos de contratos ou analisar o feedback dos clientes diretamente nas query de relatórios. Os analistas permanecem no SQL. Os fluxos de trabalho ficam mais rápidos. Chega de alternar entre ferramentas ou programar em Python.

AI throughput

Gerenciamento de desempenho automatizado com o Predictive Optimization

À medida que os dados aumentam e as cargas de trabalho mudam, o desempenho costuma diminuir com o tempo. A Predictive Optimization resolve esse problema diretamente.

Em 2025, o Gerenciamento Automático de Estatísticas ficou disponível para o público geral. Ele elimina a necessidade da execução de comandos ANALYZE ou gerenciar Jobs manualmente.

Agora, as otimizações preditivas são automáticas: 

  • Coleta estatísticas de otimização após o carregamento de dados
  • Seleciona dados pulando os índices
  • Melhora continuamente os planos de execução ao longo do tempo
throughput de estatísticas automatizadas com DBSQL

Isso reduz a sobrecarga operacional e evita o drift gradual de desempenho com o qual muitos warehouses lidam.

Recursos de SQL aberto que simplificam as migrações

Para muitos clientes, os procedimentos armazenados, as transações e as construções SQL proprietárias são a parte mais difícil de abandonar os warehouses legados. Mas muitas empresas querem migrar de sistemas legados como Oracle, Teradata e SQL Server por motivos de TCO e inovação. O DBSQL continuou seu investimento em recursos SQL abertos e compatíveis com o padrão ANSI para reduzir o esforço de migração e aumentar a portabilidade.

Os novos recursos incluem:

  • Procedimentos armazenados (Pré-visualização pública) com governança do Unity Catalog
  • SQL Scripting (Disponibilidade geral) para loops e condicionais em SQL
  • Recursive CTEs (disponibilidade geral) para querys hierárquicas
  • Agrupamentos (pré-visualização pública) para classificação e comparação com reconhecimento de idioma
  • Tabelas Temporárias (Preview Público para todos os clientes em janeiro) para eliminar o trabalho de gerenciar tabelas intermediárias ou de acompanhamento de dados residuais

Esses recursos seguem os padrões abertos de SQL e estão disponíveis no Apache Spark. Eles facilitam as migrações e reduzem a dependência de construções proprietárias.

O DBSQL também adicionou o SQL Espacial com tipos de geometria e geografia. Mais de 80 funções, como ST_Distance e ST_Contains, suportam análises geoespaciais em grande escala diretamente no SQL.

Gerenciamento de custos para workloads em grande escala

Com o aumento da adoção do SQL, as equipes têm dificuldade para explicar o aumento dos gastos em warehouses, dashboards e ferramentas. O DBSQL introduziu novas ferramentas que ajudam as equipes a monitorar e controlar os gastos no nível de warehouse, dashboard e usuário.

As principais atualizações incluem:

  • Painel de uso da conta para identificar o aumento dos custos
  • Tags e Orçamentos para acompanhar os gastos por equipe
  • System Tables para análise detalhada no nível da query
  • Dashboard de Monitoramento de Custos Granular e Materialized views (Prévia privada) para alertas e acompanhamento de drivers de custo

Esses recursos facilitam a compreensão de quais queries, painéis ou ferramentas impulsionam o consumo.

   

Monitoramento de Warehouse e controle de acesso

À medida que mais equipes passam a usar o DBSQL, os administradores precisam monitorar a simultaneidade e a integridade do warehouse sem conceder privilégios excessivos aos usuários. O DBSQL também adicionou novos recursos de governança e observabilidade:

  • Contagem de queries concluídas (GA) para mostrar quantas queries são concluídas em uma janela de tempo, ajudando a identificar padrões de simultaneidade
  • PermissõesCAN VIEW para que os administradores possam conceder acesso somente de leitura ao monitoramento sem dar direitos de execução
Gráfico de contagem de queries concluídas

Essas atualizações facilitam a execução de analítica segura e confiável em escala.

O resultado

O DBSQL continuou a melhorar em 2025. Agora ele oferece desempenho serverless mais rápido, AI integrada, padrões SQL abertos para migrações mais fáceis e visibilidade mais clara dos custos e do comportamento da carga de trabalho. Como a execução do DBSQL na arquitetura lakehouse da Databricks, analítica, engenharia de dados e AI operam em uma base única e governada. O desempenho melhora automaticamente, e as equipes gastam menos tempo ajustando sistemas ou gerenciando transferências.

O DBSQL continua sendo um warehouse aberto, inteligente e econômico, projetado para as realidades da analítica orientada por AI — e 2025 o impulsionou novamente.

O que vem a seguir

O Databricks SQL continua a liderar o mercado como um warehouse nativo de AI e pronto para operações que elimina a complexidade que os clientes enfrentam em sistemas legados. Próximos recursos incluem:

  • Transações com várias declarações, que oferecem às equipes atualizações atômicas em várias tabelas e removem a frágil lógica de reversão personalizada que muitos clientes criaram por conta própria. As transações com várias declarações também serão úteis para a migração para o Databricks.
  • Alertas V2, que estende a confiabilidade às operações do dia a dia, substituindo um sistema de alertas complexo por um modelo mais simples e escalável, projetado para milhares de verificações agendadas e padrões operacionais de nível empresarial.
  • Mais recursos de AI, para que os analistas possam aplicar LLMs e processar documentos sem sair de seus fluxos de trabalho, fechando a lacuna entre a lógica do warehouse e a inteligência.

Juntos, esses recursos levam o DBSQL a se tornar um warehouse unificado e inteligente que lida com a lógica transacional principal, o monitoramento operacional e a analítica assistida por AI em um só lugar.

Mais detalhes sobre as inovações

Esperamos que você aproveite esta série de inovações no Databricks SQL. Você sempre pode conferir esta publicação de Novidades dos últimos três meses. Abaixo está um inventário completo dos lançamentos sobre os quais publicamos no blog no último trimestre:

Introdução

Pronto para transformar seu data warehouse? O melhor data warehouse é um lakehouse! Para saber mais sobre o Databricks SQL, faça um tour pelo produto. Acesse databricks.com/sql para explorar o Databricks SQL e ver como organizações do mundo todo estão revolucionando suas plataformas de dados.

 

(This blog post has been translated using AI-powered tools) Original Post

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada

O que vem a seguir?

Introducing AI/BI: Intelligent Analytics for Real-World Data

Produto

June 11, 2024/11 min de leitura

Apresentando o AI/BI: analítica inteligente para dados do mundo real

DeepSeek R1 on Databricks

Anúncios

January 31, 2025/3 min de leitura

DeepSeek R1 no Databricks