Ir al contenido principal

SQL en Databricks Lakehouse en 2025

Más rápido, más inteligente y sin mantenimiento

DBSQL performance OG

Published: December 17, 2025

Producto8 min de leitura

Summary

  • Análisis más rápidos sin necesidad de ajustes: DBSQL ha añadido este año otra mejora automática de la velocidad, lo que mejora el rendimiento del panel de control y de las consultas sin necesidad de gestionar índices o parámetros.
  • IA integrada directamente en los flujos de trabajo SQL: las nuevas funciones de IA permiten a los analistas utilizar modelos de lenguaje grande (LLM) y procesar documentos en SQL, lo que reduce los traspasos y acelera la generación de información.
  • SQL abierto y mejor control de costos: las funciones SQL ampliadas compatibles con ANSI simplifican las migraciones desde almacenes heredados, mientras que las nuevas herramientas de supervisión de costos proporcionan a los equipos una visibilidad más clara del gasto.

Los data warehouses tradicionales son lentos, costosos y están restringidos a sistemas propietarios. Requieren ajustes constantes y generan fricción para los equipos de análisis que necesitan velocidad y escalabilidad, y ralentizan la toma de decisiones en los equipos de finanzas, operaciones y productos. Databricks SQL (DBSQL) elimina estos límites. Es 5 veces más rápido en promedio, se ejecuta sin servidor y sigue estándares abiertos. Esta inteligencia de rendimiento predeterminada no es exclusiva de los niveles premium. 

Más del 60 % de las empresas de la lista Fortune 500 utilizan DBSQL para el análisis y la inteligencia empresarial en la Databricks Data Intelligence Platform. 

En 2025, DBSQL continuó ofreciendo funcionalidades que mejoraron el rendimiento, la IA, la gestión de costos y las capacidades de SQL abierto. Este resumen destaca las actualizaciones que tuvieron el mayor impacto para los equipos de datos este año.

Rendimiento que mejora automáticamente

Consultas más rápidas sin necesidad de ajustes.

Desde 2022, DBSQL Serverless ha ofrecido una mejora de rendimiento promedio de 5x. Los dashboards que antes tardaban 10 segundos ahora se cargan en unos 2 segundos, sin requerir administración de índices ni ajustes manuales. 

En 2025, el rendimiento volvió a mejorar:

mejoras de rendimiento para DBSQL

Debido a que Databricks se basa en la Plataforma de Inteligencia de Datos, esta inteligencia está disponible para todos los clientes de forma predeterminada, no está bloqueada tras niveles prémium ni las ofertas de mayor precio.

Mejor visibilidad con Query Profile

Para ayudar a los equipos a comprender los patrones de rendimiento, la vista actualizada del Perfil de Consulta ahora incluye:

  • Un resumen visual de las métricas de lectura y escritura
  • Un panel de “Operadores principales” para identificar las partes costosas de una consulta
  • Navegación más clara a través del gráfico de ejecución
  • Filtros para enfocarse en métricas específicas
Mejoras en la UX del perfil de consulta

Esto ayuda a los equipos a diagnosticar paneles lentos y modelos complejos con mayor rapidez, sin tener que hacer suposiciones.

IA integrada directamente en los flujos de trabajo de SQL

La IA ahora es parte de la analítica diaria. En 2025, DBSQL introdujo funciones de IA nativas para que los analistas puedan usar modelos de lenguaje grandes directamente en SQL. Algunas de las nuevas capacidades incluyen:

  • ai_query para resumen, clasificación, extracción y análisis de sentimiento
  • ai_parse_document, actualmente en beta, convierte PDF y otros documentos no estructurados en tablas

Estas funciones se ejecutan en modelos alojados en Databricks, como Meta Llama y OpenAI GPT OSS, o en modelos personalizados que usted proporcione. Están optimizadas para escalar y son hasta 3 veces más rápidas que los enfoques alternativos.

Ahora los equipos pueden resumir tickets de soporte, extraer campos de contratos o analizar los comentarios de los clientes directamente en las consultas de informes. Los analistas se quedan en SQL. Los flujos de trabajo avanzan más rápido. Se acabó el cambio de herramientas o la codificación en Python.

Rendimiento de la AI

Gestión automatizada del rendimiento con la optimización predictiva

A medida que los datos crecen y las cargas de trabajo cambian, el rendimiento suele degradarse con el tiempo. La optimización predictiva aborda este problema directamente.

En 2025, Automatic Statistics Management pasó a estar disponible de forma general. Elimina la necesidad de ejecutar comandos ANALYZE o de gestionar manualmente los trabajos de optimización.

Ahora, las optimizaciones predictivas realizan automáticamente lo siguiente: 

  • Recopila estadísticas de optimización después de la carga de datos
  • Selecciona los índices de omisión de datos
  • Mejora continuamente los planes de ejecución con el tiempo
Rendimiento de las estadísticas automatizadas con DBSQL

Esto reduce la sobrecarga operativa y evita la degradación gradual del rendimiento con la que luchan muchos almacenes de datos.

Funciones de SQL abierto que simplifican las migraciones

Para muchos clientes, los procedimientos almacenados, las transacciones y las construcciones SQL propietarias son la parte más difícil de abandonar los almacenes de datos heredados. Sin embargo, muchas empresas quieren migrar desde sistemas heredados como Oracle, Teradata y SQL Server por razones de TCO e innovación. DBSQL continuó invirtiendo en características de SQL abiertas y compatibles con ANSI para reducir el esfuerzo de migración y aumentar la portabilidad.

Las nuevas capacidades incluyen:

  • Procedimientos almacenados (versión preliminar pública) con gobernanza de Unity Catalog
  • SQL Scripting (disponible de forma general) para bucles y condicionales en SQL
  • CTE recursivas (disponibilidad general) para consultas jerárquicas
  • Cotejos (versión preliminar pública) para la ordenación y comparación en función del idioma
  • Temporary Tables (versión preliminar pública para todos los clientes en enero) para eliminar la carga de gestionar tablas intermedias o rastrear datos residuales

Estas características siguen los estándares SQL abiertos y están disponibles en Apache Spark. Facilitan las migraciones y reducen la dependencia de construcciones propietarias.

DBSQL también agregó SQL espacial con tipos de geometría y geografía. Más de 80 funciones, como ST_Distance y ST_Contains, permiten el análisis geoespacial a gran escala directamente en SQL.

Gestión de costos para cargas de trabajo a gran escala

A medida que crece la adopción de SQL, los equipos tienen dificultades para explicar el aumento del gasto en almacenes, paneles de control y herramientas. DBSQL introdujo nuevas herramientas que ayudan a los equipos a supervisar y controlar el gasto a nivel de almacén, panel de control y usuario.

Las actualizaciones clave incluyen:

  • Panel de uso de la cuenta para identificar el aumento de los costos
  • Etiquetas y presupuestos para hacer un seguimiento del gasto por equipo
  • Tablas del sistema para el análisis detallado a nivel de consulta
  • Panel de supervisión pormenorizada de costos y vistas materializadas (versión preliminar privada) para alertas y seguimiento de los factores de costo

Estas características facilitan la comprensión de qué consultas, dashboards o herramientas impulsan el consumo.

   

Supervisión del almacén de datos y control de acceso

A medida que más equipos confían en DBSQL, los administradores necesitan supervisar la simultaneidad y el estado del warehouse sin conceder privilegios excesivos a los usuarios. DBSQL también añadió nuevas capacidades de gobernanza y observabilidad:

  • Recuento de consultas completadas (GA) para mostrar cuántas consultas finalizan en una ventana de tiempo, lo que ayuda a identificar patrones de simultaneidad
  • Permisos CAN VIEW para que los administradores puedan conceder acceso de solo lectura a la supervisión sin otorgar derechos de ejecución
gráfico de recuento de consultas completadas

Estas actualizaciones facilitan la ejecución de análisis seguros y confiables a escala.

El resultado

DBSQL siguió mejorando en 2025. Ahora ofrece un rendimiento serverless más rápido, IA integrada, estándares SQL abiertos para facilitar las migraciones y una visibilidad más clara de los costos y el comportamiento de la carga de trabajo. Como DBSQL se ejecuta en la arquitectura lakehouse de Databricks, el análisis, la ingeniería de datos y la IA operan en una única base gobernada. El rendimiento mejora automáticamente y los equipos dedican menos tiempo a ajustar los sistemas o a gestionar las transferencias.

DBSQL sigue siendo un warehouse abierto, inteligente y rentable diseñado para las realidades de la analítica impulsada por IA, y 2025 lo ha vuelto a impulsar.

¿Qué sigue?

Databricks SQL sigue liderando el mercado como un warehouse nativo de IA y listo para las operaciones que elimina la complejidad a la que se enfrentan los clientes en los sistemas heredados. Las próximas características incluyen:

  • Transacciones de varias instrucciones, que proporcionan a los equipos actualizaciones atómicas en varias tablas y eliminan la frágil lógica de reversión personalizada que muchos clientes crearon por su cuenta. Las transacciones de varias instrucciones también serán beneficiosas para migrar a Databricks.
  • Alerts V2, que extiende la confiabilidad a las operaciones del día a día, y reemplaza un sistema de alertas complejo por un modelo más simple y escalable, diseñado para miles de comprobaciones programadas y patrones operativos de nivel empresarial.
  • Más capacidades de IA, para que los analistas puedan aplicar LLM y procesar documentos sin abandonar sus flujos de trabajo, cerrando la brecha entre la lógica del almacén de datos y la inteligencia. 

En conjunto, estas capacidades llevan a DBSQL hacia un almacén unificado e inteligente que gestiona la lógica transaccional principal, el monitoreo operativo y el análisis asistido por IA en un solo lugar.

Más detalles sobre las innovaciones

Esperamos que disfrute de esta gran cantidad de innovaciones en Databricks SQL. Siempre puede consultar esta publicación de novedades de los últimos tres meses. A continuación, se muestra un inventario completo de los lanzamientos sobre los que hemos escrito en el blog durante el último trimestre:

Comenzar

¿Estás listo para transformar tu data warehouse? ¡El mejor data warehouse es un lakehouse! Para obtener más información sobre Databricks SQL, haz un recorrido del producto. Visita databricks.com/sql para explorar Databricks SQL y ver cómo las organizaciones de todo el mundo están revolucionando sus plataformas de datos.

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.

¿Qué sigue?

Introducing AI/BI: Intelligent Analytics for Real-World Data

Produto

June 12, 2024/11 min de leitura

Apresentando o AI/BI: analítica inteligente para dados do mundo real

DeepSeek R1 on Databricks

Anúncios

January 31, 2025/3 min de leitura

DeepSeek R1 no Databricks