Direkt zum Hauptinhalt

SQL auf dem Databricks Lakehouse im Jahr 2025

Schneller, intelligenter und wartungsfrei

DBSQL performance OG

Published: December 17, 2025

Produkt7 min de leitura

Summary

  • Schnellere Analytics ohne Tuning: DBSQL hat dieses Jahr einen weiteren automatischen Geschwindigkeits-Boost hinzugefügt, der die Dashboard- und Abfrageleistung ohne Index- oder Parameterverwaltung verbessert.
  • KI direkt in SQL-Workflows integriert: Mit neuen KI-Funktionen können Analysten LLMs verwenden und Dokumente in SQL verarbeiten, wodurch Übergaben reduziert und die Erkenntnisgewinnung beschleunigt wird.
  • Offenes SQL und bessere Kostenkontrolle: Erweiterte ANSI-konforme SQL-Features vereinfachen die Migration von Legacy-Data-Warehouses, während neue Tools zum Kosten-Monitoring Teams einen klareren Einblick in die Ausgaben geben.

Herkömmliche Data Warehouses sind langsam, teuer und an proprietäre Systeme gebunden. Sie erfordern eine ständige Optimierung, erschweren die Arbeit von Analyseteams, die Geschwindigkeit und Skalierbarkeit benötigen, und verlangsamen die Entscheidungsfindung in Finanz-, Betriebs- und Produktteams. Databricks SQL (DBSQL) hebt diese Einschränkungen auf. Es ist im Durchschnitt 5-mal schneller, läuft serverless und folgt offenen Standards. Diese defaultmäßige Performance-Intelligenz ist nicht auf Premium-Tarife beschränkt. 

Über 60 % der Fortune 500-Unternehmen nutzen DBSQL für Analytics und BI auf der Databricks Data Intelligence Platform. 

Im Jahr 2025 hat DBSQL weiterhin Funktionalität bereitgestellt, die die Performance, die KI, das Kostenmanagement und die offenen SQL-Funktionen verbesserte. Diese Zusammenfassung hebt die Updates hervor, die in diesem Jahr den größten Einfluss für Datenteams hatten.

Performance, die sich automatisch verbessert

Schnellere Abfragen ohne Tuning

Seit 2022 hat DBSQL Serverless eine durchschnittliche Performance-Steigerung um das 5-Fache erzielt. Dashboards, die früher 10 Sekunden zum Laden brauchten, werden jetzt in etwa 2 Sekunden geladen, ohne dass eine Indexverwaltung oder manuelle Optimierung erforderlich ist. 

2025 hat sich die Performance erneut verbessert:

Performance-Verbesserungen für DBSQL

Da Databricks auf der Data Intelligence Platform aufbaut, steht diese Intelligenz jedem Kunden by default zur Verfügung und ist nicht auf Premium-Stufen oder die teuersten Angebote beschränkt.

Bessere Einblicke mit Query Profile

Damit Teams Performance-Muster besser verstehen können, enthält die aktualisierte Ansicht „Query Profile“ jetzt Folgendes:

  • Eine visuelle Zusammenfassung der Lese- und Schreibmetriken
  • Ein „Top-Operatoren“-Panel zur Identifizierung aufwendiger Teile einer Abfrage
  • Übersichtlichere Navigation durch den Ausführungsgraphen
  • Filter, um sich auf bestimmte Metriken zu konzentrieren
UX-Verbesserungen bei Abfrageprofilen

Dies hilft Teams, langsame Dashboards und komplexe Modelle schneller zu diagnostizieren – ganz ohne Rätselraten.

KI direkt in SQL-Workflows integriert

KI ist jetzt Teil der alltäglichen Analysen. Im Jahr 2025 hat DBSQL native KI-Funktionen eingeführt, sodass Analysten große Sprachmodelle direkt in SQL verwenden können. Einige der neuen Funktionen sind:

  • ai_query für  Zusammenfassung, Klassifizierung, Extraktion und Sentimentanalysen
  • ai_parse_document, derzeit in der Beta-Version, konvertiert PDFs und andere unstrukturierte Dokumente in Tabellen

Diese Funktionen laufen auf von Databricks gehosteten Modellen wie Meta Llama und OpenAI GPT OSS oder auf benutzerdefinierten Modellen, die Sie bereitstellen. Sie sind für Skalierbarkeit optimiert und bis zu 3-mal schneller als alternative Ansätze.

Teams können jetzt Support-Tickets zusammenfassen, Felder aus Verträgen extrahieren oder Kundenfeedback direkt in Reporting-Abfragen analysieren. Analysten bleiben in SQL. Workflows laufen schneller. Kein Wechseln zwischen Tools oder Programmieren in Python mehr.

KI-Durchsatz

Automatisiertes Performance-Management mit Predictive Optimization

Wenn Datenmengen wachsen und sich Workloads ändern, lässt die Performance mit der Zeit oft nach. Prädiktive Optimierung adressiert dieses Problem direkt.

Im Jahr 2025 wurde Automatic Statistics Management allgemein verfügbar. Es macht die manuelle Ausführung von ANALYZE-Befehlen oder die Verwaltung von Optimierungs-Jobs überflüssig.

Jetzt: Predictive Optimizations automatisch: 

  • Erfasst Optimierungsstatistiken nach dem Laden von Daten
  • Wählt Indizes zum Überspringen von Daten aus
  • Verbessert kontinuierlich die Ausführungspläne im Laufe der Zeit
Automatisierter Statistikdurchsatz mit DBSQL

Dies reduziert den Betriebsaufwand und verhindert die allmähliche Performance-Drift, mit der viele Warehouses zu kämpfen haben.

Open SQL-Features, die Migrationen vereinfachen

Für viele Kunden sind Stored Procedures, Transaktionen und proprietäre SQL-Konstrukte der schwierigste Teil bei der Ablösung von Legacy-Warehouses. Viele Unternehmen möchten jedoch aus TCO- und Innovationsgründen von Legacy-Systemen wie Oracle, Teradata und SQL Server migrieren. DBSQL hat seine Investitionen in offene, ANSI-konforme SQL-Features fortgesetzt, um den Migrationsaufwand zu reduzieren und die Portabilität zu erhöhen.

Zu den neuen Funktionen gehören:

  • Stored Procedures (Public Preview) mit Unity Catalog-Governance
  • SQL Scripting (allgemein verfügbar) für Schleifen und Bedingungen in SQL
  • Rekursive CTEs (allgemein verfügbar) für hierarchische Abfragen
  • Sortierfolgen (Public Preview) für sprachsensitive Sortierung und Vergleiche
  • Temporäre Tabellen (Öffentliche Vorschau für alle Kunden im Januar) beseitigen den Aufwand für die Verwaltung von Zwischentabellen oder das Aufspüren von Restdaten

Diese Funktionen entsprechen offenen SQL-Standards und sind in Apache Spark verfügbar. Sie erleichtern Migrationen und verringern die Abhängigkeit von proprietären Konstrukten.

DBSQL hat außerdem Spatial SQL mit Geometrie- und Geografietypen hinzugefügt. Über 80 Funktionen wie ST_Distance und ST_Contains unterstützen umfangreiche georäumliche Analysen direkt in SQL.

Kostenmanagement für umfangreiche Workloads

Mit zunehmender SQL-Einführung haben Teams Schwierigkeiten, die steigenden Ausgaben für Warehouses, Dashboards und Tools zu erklären. DBSQL hat neue Tools eingeführt, die Teams dabei helfen, die Ausgaben auf Warehouse-, Dashboard- und Benutzerebene zu überwachen und zu steuern.

Zu den wichtigsten Updates gehören:

  • Dashboard zur Account-Nutzung zur Erkennung steigender Kosten
  • Tags und Budgets zur Verfolgung der Ausgaben nach Team
  • Systemtabellen für eine detaillierte Analyse auf Abfrageebene
  • Dashboard zur granularen Kosten-Monitoring und Materialized Views (Private Vorschau) für Alerts und Cost driver-Tracking

Diese Features machen es einfacher zu verstehen, welche Abfragen, Dashboards oder Tools den Verbrauch verursachen.

   

Warehouse-Monitoring und Zugriffskontrolle

Da immer mehr Teams DBSQL nutzen, müssen Admins die Parallelität und den Zustand des Warehouse überwachen, ohne den Benutzern zu viele Berechtigungen zu erteilen. DBSQL bietet außerdem neue Funktionen für Governance und Observability:

  • Completed Query Count (GA), um anzuzeigen, wie viele Abfragen in einem Zeitfenster abgeschlossen werden, was dabei hilft, Parallelitätsmuster zu erkennen
  • CAN VIEW-Berechtigungen, sodass Administratoren schreibgeschützten Zugriff auf das Monitoring gewähren können, ohne Ausführungsrechte zu vergeben
Diagramm zur Anzahl der abgeschlossenen Abfragen

Diese Updates erleichtern die skalierbare Ausführung sicherer und zuverlässiger Analysen.

Das Ergebnis

DBSQL wurde 2025 weiter verbessert. Es bietet jetzt eine schnellere serverless Performance, integrierte KI, offene SQL-Standards für einfachere Migrationen und eine klarere Übersicht über Kosten und Workload-Verhalten. Da DBSQL auf der Lakehouse-Architektur von Databricks ausgeführt wird, arbeiten Analytics, Data Engineering und KI auf einer einzigen, verwalteten Grundlage. Die Performance verbessert sich automatisch und Teams verbringen weniger Zeit mit dem Tuning von Systemen oder der Verwaltung von Übergaben.

DBSQL bleibt ein offenes, intelligentes und kosteneffizientes Warehouse, das für die Realitäten KI-gestützter Analytics entwickelt wurde – und 2025 hat es erneut vorangebracht.

Wie geht es weiter?

Databricks SQL ist als KI-natives, betriebsbereites Warehouse weiterhin marktführend und beseitigt die Komplexität, mit der Kunden bei Altsystemen konfrontiert sind. Zu den kommenden Features gehören:

  • Multi-Statement-Transaktionen, die Teams atomare Updates über mehrere Tabellen hinweg ermöglichen und die anfällige benutzerdefinierte Rollback-Logik entfernen, die viele Kunden selbst erstellt haben. Multi-Statement-Transaktionen werden auch bei der Migration zu Databricks von Vorteil sein.
  • Alerts V2, das die Zuverlässigkeit auf den täglichen Betrieb ausweitet und ein komplexes Alert-System durch ein einfacheres, skalierbares Modell ersetzt, das für Tausende von geplanten Überprüfungen und Betriebsmuster auf Unternehmensebene ausgelegt ist.
  • Mehr KI-Funktionen, sodass Analysten LLMs anwenden und Dokumente verarbeiten können, ohne ihre Workflows zu verlassen, wodurch die Lücke zwischen Warehouse-Logik und Intelligenz geschlossen wird. 

Zusammen entwickeln diese Funktionen DBSQL weiter zu einem einheitlichen, intelligenten Warehouse, das zentrale Transaktionslogik, operatives Monitoring und KI-gestützte Analysen an einem Ort verarbeitet.

Weitere Details zu den Innovationen

Wir wünschen Ihnen viel Freude mit dieser Fülle an Innovationen in Databricks SQL. Sie können jederzeit diesen Beitrag zu den Neuerungen der letzten drei Monate einsehen. Nachfolgend finden Sie eine vollständige Liste der Launches, über die wir im letzten Quartal gebloggt haben:

Erste Schritte

Sind Sie bereit, Ihr Data Warehouse zu transformieren? Das beste Data Warehouse ist ein Lakehouse. Machen Sie eine Produkttour, um mehr über Databricks SQL zu erfahren. Besuchen Sie databricks.com/sql, um Databricks SQL zu entdecken und zu sehen, wie Unternehmen weltweit ihre Datenplattformen revolutionieren.

Verpassen Sie keinen Beitrag von Databricks

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.

Was kommt als Nächstes?

Introducing AI/BI: Intelligent Analytics for Real-World Data

Produto

June 12, 2024/11 min de leitura

Apresentando o AI/BI: analítica inteligente para dados do mundo real

DeepSeek R1 on Databricks

Anúncios

January 31, 2025/3 min de leitura

DeepSeek R1 no Databricks