Revenir au contenu principal

Le SQL sur le Lakehouse de Databricks en 2025

Plus rapide, plus intelligent et sans maintenance

DBSQL performance OG

Published: December 17, 2025

Produit9 min de leitura

Summary

  • Une analytique plus rapide sans réglage : DBSQL a ajouté une autre accélération automatique cette année, améliorant les performances des tableaux de bord et des requêtes sans aucune gestion d'index ou de paramètres.
  • L'IA intégrée directement dans les flux de travail SQL : De nouvelles fonctions d'IA permettent aux analystes d'utiliser des LLM et de traiter des documents en SQL, ce qui réduit les transferts et accélère la génération d'insights.
  • SQL ouvert et meilleur monitoring des coûts : Les fonctions SQL étendues et conformes à la norme ANSI simplifient les migrations à partir des entrepôts existants, tandis que les nouveaux outils de monitoring des coûts donnent aux équipes une meilleure visibilité sur les dépenses.

Les data warehouses traditionnels sont lents, coûteux et verrouillés dans des systèmes propriétaires. Ils exigent un réglage constant, créent des frictions pour les équipes d'analytique qui ont besoin de vitesse et d'évolutivité, et ralentissent les décisions des équipes des finances, des opérations et des équipes produit. Databricks SQL (DBSQL) supprime ces limites. Il est en moyenne 5 fois plus rapide, fonctionne en serverless et respecte les standards ouverts. Cette intelligence de performance par défaut n'est pas réservée aux niveaux premium. 

Plus de 60 % des entreprises du classement Fortune 500 utilisent DBSQL pour l'analytique et la BI sur la Databricks Data Intelligence Platform. 

En 2025, DBSQL a continué de fournir des fonctionnalités qui ont amélioré les performances, l'AI, la gestion des coûts et les capacités SQL ouvertes. Ce récapitulatif met en évidence les mises à jour qui ont eu le plus grand impact sur les équipes de données cette année.

Des performances qui s'améliorent automatiquement

Des queries plus rapides sans réglage

Depuis 2022, DBSQL Serverless a permis d'améliorer les performances en moyenne de 5x. Les dashboards qui prenaient auparavant 10 secondes à charger s'affichent désormais en 2 secondes environ, sans nécessiter de gestion d'index ou d'optimisation manuelle. 

En 2025, les performances se sont encore améliorées :

  • Des queries jusqu'à 25 % plus rapides en plus des gains 5x existants
  • Livré automatiquement, aucune configuration requise
  • Aucune gestion d'index ou de paramètres n'est requise
Améliorations des performances pour DBSQL

Databricks reposant sur la Data Intelligence Platform, cette intelligence est disponible par default pour chaque client, et n'est pas réservée aux niveaux premium ou aux offres les plus chères.

Meilleure visibilité grâce au profil de requête

Pour aider les équipes à comprendre les modèles de performance, la vue mise à jour du profil de query inclut désormais :

  • Un résumé visuel des métriques de lecture et d'écriture
  • Un panneau « Principaux opérateurs » pour identifier les parties coûteuses d'une query
  • Navigation plus claire dans le graphe d'exécution
  • Filtres pour se concentrer sur des métriques spécifiques
Améliorations de l'UX du profil query

Cela aide les équipes à diagnostiquer plus rapidement les tableaux de bord lents et les modèles complexes, sans avoir à faire de suppositions.

L'IA intégrée directement dans les workflows SQL

L'IA fait désormais partie de l'analytique au quotidien. En 2025, DBSQL a introduit des fonctions d'IA natives afin que les analystes puissent utiliser les grands modèles de langage directement en SQL. Parmi les nouvelles fonctionnalités, on retrouve :

  • ai_query pour la synthèse, la classification, l'extraction et l'analyse des sentiments
  • ai_parse_document, actuellement en bêta, convertit les PDF et autres documents non structurés en tableaux

Ces fonctions s'exécutent sur des modèles hébergés par Databricks, tels que Meta Llama et OpenAI GPT OSS, ou sur des modèles personnalisés que vous fournissez. Elles sont optimisées pour la montée en charge et jusqu'à 3 fois plus rapides que les approches alternatives.

Les équipes peuvent désormais résumer les tickets de support, extraire des champs de contrats ou analyser les commentaires des clients directement dans les queries de reporting. Les analystes restent en SQL. Les workflows sont plus rapides. Fini les changements d'outils ou le codage en Python.

throughput de l'IA

Gestion automatisée de la performance avec l'optimisation prédictive

À mesure que les données augmentent et que les workloads évoluent, les performances se dégradent souvent avec le temps. L'Optimisation prédictive résout ce problème directement.

En 2025, la Gestion automatique des statistiques a été généralisée. Elle supprime la nécessité d'exécuter des commandes ANALYZE ou de gérer manuellement les Jobs d'optimisation.

Désormais, les optimisations prédictives s'exécutent automatiquement : 

  • Collecte les statistiques d'optimisation après le chargement des données
  • Sélectionne les index de saut de données
  • Améliore continuellement les plans d'exécution au fil du temps
throughput des statistiques automatisées avec DBSQL

Cela permet de réduire les frais généraux opérationnels et d'éviter la dérive progressive des performances à laquelle de nombreux entrepôts sont confrontés.

Fonctionnalités SQL ouvertes qui simplifient les migrations

Pour de nombreux clients, les procédures stockées, les transactions et les constructions SQL propriétaires représentent la partie la plus difficile de l'abandon des entrepôts de données traditionnels. Cependant, de nombreuses entreprises souhaitent migrer depuis des systèmes existants comme Oracle, Teradata et SQL Server pour des raisons de TCO et d'innovation. DBSQL a poursuivi ses investissements dans les fonctionnalités SQL ouvertes et conformes à la norme ANSI afin de réduire l'effort de migration et d'augmenter la portabilité.

Les nouvelles fonctionnalités comprennent :

  • Procédures stockées (Preview publique) avec la gouvernance Unity Catalog
  • Scripts SQL (disponibilité générale) pour les boucles et les conditions dans le langage SQL
  • CTE récursives (Disponibilité générale) pour les requêtes hiérarchiques
  • Collations (Préversion publique) pour le tri et la comparaison tenant compte de la langue
  • Tables temporaires (Préversion publique pour tous les clients en janvier) pour ne plus avoir à gérer les tables intermédiaires ou à rechercher les données résiduelles

Ces fonctionnalités respectent les normes SQL ouvertes et sont disponibles dans Apache Spark. Elles facilitent les migrations et réduisent la dépendance à l'égard des constructions propriétaires.

DBSQL a également ajouté Spatial SQL avec des types de géométrie et de géographie. Plus de 80 fonctions telles que ST_Distance et ST_Contains prennent en charge l'analyse géospatiale à grande échelle directement en SQL.

Gestion des coûts pour les charges de travail à grande échelle

À mesure que l'adoption de SQL se développe, les équipes ont du mal à expliquer l'augmentation des dépenses liées aux entrepôts, aux tableaux de bord et aux outils. DBSQL a introduit de nouveaux outils qui aident les équipes à surveiller et à maîtriser les dépenses au niveau du warehouse, du tableau de bord et de l'utilisateur.

Les principales mises à jour sont les suivantes :

  • Tableau de bord d'utilisation du compte pour identifier l'augmentation des coûts
  • Tags et budgets pour suivre les dépenses par équipe
  • Tables système pour une analyse détaillée au niveau des queries
  • Tableau de bord de monitoring granulaire des coûts et vues matérialisées (en Private Preview) pour les alertes et le suivi des cost drivers

Ces fonctionnalités permettent de comprendre plus facilement quelles requêtes, quels tableaux de bord ou quels outils sont à l'origine de la consommation.

   

Surveillance de l'entrepôt et contrôle d'accès

À mesure que de plus en plus d'équipes utilisent DBSQL, les administrateurs doivent surveiller la simultanéité et la santé de l'entrepôt sans accorder de privilèges excessifs aux utilisateurs. DBSQL a également ajouté de nouvelles fonctionnalités de gouvernance et d'observabilité :

  • Nombre de requêtes terminées (GA) pour indiquer le nombre de requêtes qui se terminent dans une fenêtre de temps, ce qui aide à identifier les modèles de simultanéité
  • Autorisations CAN VIEW pour que les administrateurs puissent accorder un accès en lecture seule au monitoring sans accorder de droits d'exécution
graphique du nombre de queries terminées

Ces mises à jour facilitent l'exécution d'analytiques sécurisées et fiables à grande échelle.

Le résultat

DBSQL a continué de s'améliorer en 2025. Il offre désormais des performances serverless plus rapides, une IA intégrée, des standards SQL ouverts pour faciliter les migrations et une visibilité plus claire sur les coûts et le comportement des charges de travail. Parce que DBSQL s'exécute sur l'architecture lakehouse de Databricks, l'analytique, la Data Engineering et l'IA fonctionnent tous sur une base unique et gouvernée. Les performances s'améliorent automatiquement, et les équipes passent moins de temps à optimiser les systèmes ou à gérer les transferts.

DBSQL reste un entrepôt ouvert, intelligent et rentable, conçu pour les réalités de l'analytique basée sur l'IA — et 2025 l'a encore fait progresser.

Et ensuite

Databricks SQL reste leader sur le marché en tant que data warehouse natif pour l'IA et prêt pour les opérations, qui élimine la complexité à laquelle les clients sont confrontés avec les systèmes existants. Les fonctionnalités à venir sont les suivantes :

  • Transactions multi-instructions, qui permettent aux équipes d'effectuer des mises à jour atomiques sur plusieurs tables et de supprimer la logique de restauration personnalisée et fragile que de nombreux clients ont développée eux-mêmes. Les transactions multi-instructions seront également utiles pour la migration vers Databricks.
  • Alertes V2, qui étend la fiabilité aux opérations quotidiennes, en remplaçant un système d'alertes complexe par un modèle plus simple et évolutif conçu pour des milliers de vérifications planifiées et des modèles opérationnels de niveau entreprise.
  • Davantage de fonctionnalités d'IA, afin que les analystes puissent appliquer des LLM et traiter des documents sans quitter leurs workflows, comblant ainsi le fossé entre la logique d'entrepôt et l'intelligence. 

Ensemble, ces capacités font évoluer DBSQL vers un warehouse unifié et intelligent qui gère la logique transactionnelle de base, le monitoring opérationnel et l'analytique assistée par l'IA en un seul endroit.

Plus de détails sur les innovations

Nous espérons que vous apprécierez cette profusion d'innovations dans Databricks SQL. Vous pouvez toujours consulter cet article sur les nouveautés des trois derniers mois. Vous trouverez ci-dessous un inventaire complet des lancements que nous avons présentés sur notre blog au cours du dernier trimestre :

Démarrer

Prêt à transformer votre data warehouse ? Le meilleur data warehouse est un lakehouse ! Pour en savoir plus sur Databricks SQL, suivez une visite du produit. Rendez-vous sur databricks.com/sql pour explorer Databricks SQL et découvrir comment les entreprises du monde entier révolutionnent leurs plateformes de données.

Ne manquez jamais un article Databricks

Abonnez-vous à notre blog et recevez les derniers articles dans votre boîte mail.

Et ensuite ?

Introducing AI/BI: Intelligent Analytics for Real-World Data

Produto

June 12, 2024/11 min de leitura

Apresentando o AI/BI: analítica inteligente para dados do mundo real

DeepSeek R1 on Databricks

Anúncios

January 31, 2025/3 min de leitura

DeepSeek R1 no Databricks