Passa al contenuto principale

SQL sulla Lakehouse di Databricks nel 2025

Più veloce, più intelligente e senza manutenzione

DBSQL performance OG

Published: December 17, 2025

Prodotto7 min de leitura

Summary

  • Analitiche più rapide senza ottimizzazione: quest'anno DBSQL ha aggiunto un'altra accelerazione automatica, migliorando le prestazioni di dashboard e query senza alcuna gestione di indici o parametri.
  • AI integrata direttamente nei flussi di lavoro SQL: le nuove funzioni di AI consentono agli analisti di utilizzare i LLM ed elaborare documenti in SQL, riducendo i passaggi di consegne e velocizzando la generazione di insight.
  • SQL aperto e un migliore controllo dei costi: le funzionalità SQL estese e conformi allo standard ANSI semplificano le migrazioni da warehouse legacy, mentre i nuovi strumenti di monitoraggio dei costi offrono ai team una visibilità più chiara sulla spesa.

I data warehouse tradizionali sono lenti, costosi e vincolati a sistemi proprietari. Richiedono una messa a punto costante e creano ostacoli per i team di analitiche che necessitano di velocità e scalabilità, rallentando le decisioni dei team finanziari, delle attività operative e di prodotto. Databricks SQL (DBSQL) rimuove questi limiti. È in media 5 volte più veloce, funziona in modalità serverless e segue standard aperti. Questa intelligenza prestazionale default non è vincolata a livelli premium. 

Oltre il 60% delle aziende Fortune 500 utilizza DBSQL per le analitiche e la BI sulla Databricks Data Intelligence Platform. 

Nel 2025, DBSQL ha continuato a offrire funzionalità che hanno migliorato le prestazioni, l'IA, la gestione dei costi e le funzionalità SQL aperte. Questo riepilogo mette in luce gli aggiornamenti che hanno avuto il maggiore impatto per i data team quest'anno.

Prestazioni che migliorano automaticamente

Query più veloci senza tuning

Dal 2022, DBSQL Serverless ha fornito un miglioramento medio delle prestazioni di 5 volte. Le dashboard che prima richiedevano 10 secondi ora si caricano in circa 2 secondi, senza richiedere la gestione degli indici o l'ottimizzazione manuale. 

Nel 2025, le prestazioni sono ulteriormente migliorate:

miglioramenti delle prestazioni per DBSQL

Poiché Databricks si basa sulla Data Intelligence Platform, questa intelligence è disponibile per impostazione predefinita per ogni cliente, non è riservata ai livelli premium o alle offerte dal prezzo più elevato.

Migliore visibilità con Query Profile

Per aiutare i team a comprendere i modelli delle prestazioni, la vista Profilo query aggiornata ora include:

  • Un riepilogo visivo delle metriche di lettura e scrittura
  • Un pannello “Top operator” per identificare le parti più onerose di una query
  • Navigazione più chiara nel grafo di esecuzione
  • Filtri per concentrarsi su metriche specifiche
Miglioramenti alla UX del profilo query

Questo aiuta i team a diagnosticare più rapidamente dashboard lente e modelli complessi, senza affidarsi a congetture.

AI integrata direttamente nei flussi di lavoro SQL

L'IA è ormai parte delle analitiche di tutti i giorni. Nel 2025, DBSQL ha introdotto funzioni di IA native in modo che gli analisti possano usare i modelli linguistici di grandi dimensioni direttamente in SQL. Tra le nuove funzionalità vi sono:

  • ai_query per  riepilogo, classificazione, estrazione e analisi del sentiment
  • ai_parse_document, attualmente in versione beta, converte PDF e altri documenti non strutturati in tabelle

Queste funzioni vengono eseguite su modelli ospitati da Databricks, come Meta Llama e OpenAI GPT OSS, o su modelli personalizzati forniti dall'utente. Sono ottimizzate per la Scale e fino a 3 volte più veloci rispetto agli approcci alternativi.

I team ora possono riepilogare i ticket di assistenza, estrarre campi dai contratti o analizzare il feedback dei clienti direttamente nelle query di reporting. Gli analisti restano in SQL. I flussi di lavoro sono più veloci. Niente più cambi di strumento o programmazione in Python.

Throughput dell'AI

Gestione automatizzata delle prestazioni con Predictive Optimization

Con la crescita dei dati e il cambiamento dei carichi di lavoro, le prestazioni spesso si degradano nel tempo. L'ottimizzazione predittiva affronta questo problema direttamente.

Nel 2025, la Gestione Automatica delle Statistiche è diventata generalmente disponibile. Elimina la necessità di eseguire i comandi ANALYZE o di gestire manualmente i Job di ottimizzazione.

Ora, le ottimizzazioni predittive, in automatico: 

  • Raccoglie le statistiche di ottimizzazione dopo il caricamento dei dati
  • Seleziona gli indici di salto dei dati
  • Migliora continuamente i piani di esecuzione nel tempo
Throughput delle statistiche automatizzate con DBSQL

Questo riduce il sovraccarico operativo e previene il graduale drift delle prestazioni che affligge molti warehouse.

Funzionalità SQL aperte che semplificano le migrazioni

Per molti clienti, le stored procedure, le transazioni e i costrutti SQL proprietari sono la parte più difficile dell'abbandono dei warehouse legacy. Tuttavia, molte aziende desiderano migrare da sistemi legacy come Oracle, Teradata e SQL Server per motivi di TCO e innovazione. DBSQL ha continuato a investire in funzionalità SQL aperte e conformi allo standard ANSI per ridurre l'impegno richiesto per la migrazione e aumentare la portabilità.

Le nuove funzionalità includono:

  • Stored Procedures (Anteprima pubblica) con la governance di Unity Catalog
  • SQL Scripting (Disponibilità generale) per loop e condizionali in SQL
  • CTE ricorsive (Disponibilità generale) per query gerarchiche
  • Regole di confronto (Anteprima pubblica) per l'ordinamento e il confronto basati sulla lingua
  • Tabelle temporanee (in Public Preview per tutti i clienti a gennaio) per eliminare l'onere di gestire le tabelle intermedie o di individuare i dati residui.

Queste funzionalità seguono gli standard SQL aperti e sono disponibili in Apache Spark. Semplificano le migrazioni e riducono la dipendenza da costrutti proprietari.

DBSQL ha anche aggiunto Spatial SQL con tipi di dati geometry e geography. Oltre 80 funzioni come ST_Distance e ST_Contains supportano l'analisi geospaziale su larga scala direttamente in SQL.

Gestione dei costi per carichi di lavoro su larga scala

Con la crescente adozione di SQL, i team faticano a spiegare l'aumento della spesa in warehouse, dashboard e strumenti. DBSQL ha introdotto nuovi strumenti che aiutano i team a monitorare e controllare la spesa a livello di warehouse, dashboard e utente.

Gli aggiornamenti principali includono:

  • Dashboard utilizzo account per identificare i costi in aumento
  • Tag e budget per monitorare la spesa per team
  • Tabelle di sistema per un'analisi dettagliata a livello di query
  • Cruscotto di monitoraggio dei costi granulare e viste materializzate (anteprima privata) per avvisi e monitoraggio dei driver di costo

Queste funzionalità facilitano la comprensione di quali query, dashboard o strumenti determinano il consumo.

   

Monitoraggio del warehouse e controllo degli accessi

Con l'aumentare dei team che si affidano a DBSQL, gli amministratori devono monitorare la concorrenza e lo stato di integrità del warehouse senza concedere privilegi eccessivi agli utenti. DBSQL ha inoltre aggiunto nuove funzionalità di governance e osservabilità:

  • Conteggio query completate (GA) per mostrare quante query terminano in un intervallo di tempo, aiutando a identificare i pattern di concorrenza
  • Autorizzazioni CAN VIEW in modo che gli amministratori possano concedere l'accesso in sola lettura al monitoraggio senza concedere i diritti di esecuzione
Grafico del conteggio delle query completate

Questi aggiornamenti semplificano l'esecuzione di analitiche sicure e affidabili su vasta scala.

Il risultato

DBSQL ha continuato a migliorare nel 2025. Ora offre prestazioni serverless più veloci, AI integrata, standard SQL aperti per migrazioni più semplici e una visibilità più chiara sui costi e sul comportamento del carico di lavoro. Poiché DBSQL viene eseguito sull'architettura lakehouse di Databricks, le analitiche, l'ingegneria dei dati e l'AI operano tutti su un'unica base governata. Le prestazioni migliorano automaticamente e i team dedicano meno tempo alla messa a punto dei sistemi o alla gestione dei passaggi di consegne.

DBSQL resta un warehouse aperto, intelligente e conveniente, progettato per le realtà delle analitiche basate sull'IA — e il 2025 lo ha ulteriormente migliorato.

Prossimi passi

Databricks SQL continua a essere leader di mercato come warehouse AI-native e pronto per le attività operative, eliminando la complessità che i clienti riscontrano nei sistemi legacy. Le prossime funzionalità includono:

  • Transazioni multi-istruzione, che offrono ai team aggiornamenti atomici su più tabelle e rimuovono la fragile logica di rollback personalizzata che molti clienti hanno creato autonomamente. Le transazioni multi-istruzione saranno utili anche per la migrazione a Databricks.
  • Alerts V2, che estende l'affidabilità alle attività operative quotidiane, sostituendo un complesso sistema di avvisi con un modello più semplice e scalabile, progettato per migliaia di controlli pianificati e modelli operativi di livello enterprise.
  • Più funzionalità di IA, in modo che gli analisti possano applicare gli LLM ed elaborare documenti senza abbandonare i loro flussi di lavoro, colmando il divario tra la logica del warehouse e l'intelligence. 

Insieme, queste funzionalità spingono DBSQL verso un warehouse unificato e intelligente in grado di gestire la logica transazionale di base, il monitoraggio operativo e le analitiche assistite dall'AI in un unico posto.

Maggiori dettagli sulle innovazioni

Ci auguriamo che questa serie di innovazioni in Databricks SQL sia di tuo gradimento. Puoi sempre consultare questo post sulle novità degli ultimi tre mesi. Di seguito è riportato un elenco completo dei lanci di cui abbiamo parlato sul blog nell'ultimo trimestre:

Guida introduttiva

Pronto a trasformare il tuo data warehouse? Il miglior data warehouse è un lakehouse! Per saperne di più su Databricks SQL, partecipa a un tour del prodotto. Visita databricks.com/sql per esplorare Databricks SQL e scoprire come le organizzazioni di tutto il mondo stanno rivoluzionando le loro piattaforme di dati.

Non perdere mai un post di Databricks

Iscriviti al nostro blog e ricevi gli ultimi post direttamente nella tua casella di posta elettronica.

Cosa succederà adesso?

Introducing AI/BI: Intelligent Analytics for Real-World Data

Produto

June 12, 2024/11 min de leitura

Apresentando o AI/BI: analítica inteligente para dados do mundo real

DeepSeek R1 on Databricks

Anúncios

January 31, 2025/3 min de leitura

DeepSeek R1 no Databricks