Ir al contenido principal
Producto

SQL en Databricks Lakehouse en 2025

MƔs rƔpido, mƔs inteligente y sin mantenimiento

por Ina Felsheim y Ruwen Henning Hess

  • AnĆ”lisis mĆ”s rĆ”pidos sin necesidad de ajustes: DBSQL ha aƱadido este aƱo otra mejora automĆ”tica de la velocidad, lo que mejora el rendimiento del panel de control y de las consultas sin necesidad de gestionar Ć­ndices o parĆ”metros.
  • IA integrada directamente en los flujos de trabajo SQL: las nuevas funciones de IA permiten a los analistas utilizar modelos de lenguaje grande (LLM) y procesar documentos en SQL, lo que reduce los traspasos y acelera la generación de información.
  • SQL abierto y mejor control de costos: las funciones SQL ampliadas compatibles con ANSI simplifican las migraciones desde almacenes heredados, mientras que las nuevas herramientas de supervisión de costos proporcionan a los equipos una visibilidad mĆ”s clara del gasto.

Los data warehouses tradicionales son lentos, costosos y estÔn restringidos a sistemas propietarios. Requieren ajustes constantes y generan fricción para los equipos de anÔlisis que necesitan velocidad y escalabilidad, y ralentizan la toma de decisiones en los equipos de finanzas, operaciones y productos. Databricks SQL (DBSQL) elimina estos límites. Es 5 veces mÔs rÔpido en promedio, se ejecuta sin servidor y sigue estÔndares abiertos. Esta inteligencia de rendimiento predeterminada no es exclusiva de los niveles premium. 

MÔs del 60 % de las empresas de la lista Fortune 500 utilizan DBSQL para el anÔlisis y la inteligencia empresarial en la Databricks Data Intelligence Platform. 

En 2025, DBSQL continuó ofreciendo funcionalidades que mejoraron el rendimiento, la IA, la gestión de costos y las capacidades de SQL abierto. Este resumen destaca las actualizaciones que tuvieron el mayor impacto para los equipos de datos este año.

Rendimiento que mejora automƔticamente

Consultas mƔs rƔpidas sin necesidad de ajustes.

Desde 2022, DBSQL Serverless ha ofrecido una mejora de rendimiento promedio de 5x. Los dashboards que antes tardaban 10 segundos ahora se cargan en unos 2 segundos, sin requerir administración de índices ni ajustes manuales. 

En 2025, el rendimiento volvió a mejorar:

mejoras de rendimiento para DBSQL

Debido a que Databricks se basa en la Plataforma de Inteligencia de Datos, esta inteligencia estƔ disponible para todos los clientes de forma predeterminada, no estƔ bloqueada tras niveles prƩmium ni las ofertas de mayor precio.

Mejor visibilidad con Query Profile

Para ayudar a los equipos a comprender los patrones de rendimiento, laĀ vista actualizada del Perfil de Consulta ahora incluye:

  • Un resumen visual de las mĆ©tricas de lectura y escritura
  • Un panel de ā€œOperadores principalesā€ para identificar las partes costosas de una consulta
  • Navegación mĆ”s clara a travĆ©s del grĆ”fico de ejecución
  • Filtros para enfocarse en mĆ©tricas especĆ­ficas
Mejoras en la UX del perfil de consulta

Esto ayuda a los equipos a diagnosticar paneles lentos y modelos complejos con mayor rapidez, sin tener que hacer suposiciones.

IA integrada directamente en los flujos de trabajo de SQL

La IA ahora es parte de la analĆ­tica diaria. En 2025, DBSQL introdujoĀ funciones de IA nativas para que los analistas puedan usar modelos de lenguaje grandes directamente en SQL. Algunas de las nuevas capacidades incluyen:

  • ai_query para resumen, clasificación, extracción y anĆ”lisis de sentimiento
  • ai_parse_document, actualmente en beta, convierte PDF y otros documentos no estructurados en tablas

Estas funciones se ejecutan en modelos alojados en Databricks, como Meta Llama y OpenAI GPT OSS, o en modelos personalizados que usted proporcione. EstƔn optimizadas para escalar y son hasta 3 veces mƔs rƔpidas que los enfoques alternativos.

Ahora los equipos pueden resumir tickets de soporte, extraer campos de contratos o analizar los comentarios de los clientes directamente en las consultas de informes. Los analistas se quedan en SQL. Los flujos de trabajo avanzan mÔs rÔpido. Se acabó el cambio de herramientas o la codificación en Python.

Rendimiento de la AI

Gestión automatizada del rendimiento con la optimización predictiva

A medida que los datos crecen y las cargas de trabajo cambian, el rendimiento suele degradarse con el tiempo. La optimización predictiva aborda este problema directamente.

En 2025, Automatic Statistics Management pasó a estar disponible de forma general. Elimina la necesidad de ejecutar comandos ANALYZE o de gestionar manualmente los trabajos de optimización.

Ahora, las optimizaciones predictivas realizan automÔticamente lo siguiente: 

  • Recopila estadĆ­sticas de optimización despuĆ©s de la carga de datos
  • Selecciona los Ć­ndices de omisión de datos
  • Mejora continuamente los planes de ejecución con el tiempo
Rendimiento de las estadĆ­sticas automatizadas con DBSQL

Esto reduce la sobrecarga operativa y evita la degradación gradual del rendimiento con la que luchan muchos almacenes de datos.

Funciones de SQL abierto que simplifican las migraciones

Para muchos clientes, los procedimientos almacenados, las transacciones y las construcciones SQL propietarias son la parte mÔs difícil de abandonar los almacenes de datos heredados. Sin embargo, muchas empresas quieren migrar desde sistemas heredados como Oracle, Teradata y SQL Server por razones de TCO e innovación. DBSQL continuó invirtiendo en características de SQL abiertas y compatibles con ANSI para reducir el esfuerzo de migración y aumentar la portabilidad.

Las nuevas capacidades incluyen:

  • Procedimientos almacenados (versión preliminar pĆŗblica) con gobernanza de Unity Catalog
  • SQL Scripting (disponible de forma general) para bucles y condicionales en SQL
  • CTE recursivas (disponibilidad general) para consultas jerĆ”rquicas
  • Cotejos (versión preliminar pĆŗblica) para la ordenación y comparación en función del idioma
  • Temporary Tables (versión preliminar pĆŗblica para todos los clientes en enero) para eliminar la carga de gestionar tablas intermedias o rastrear datos residuales

Estas caracterƭsticas siguen los estƔndares SQL abiertos y estƔn disponibles en Apache Spark. Facilitan las migraciones y reducen la dependencia de construcciones propietarias.

DBSQL también agregó SQL espacial con tipos de geometría y geografía. MÔs de 80 funciones, como ST_Distance y ST_Contains, permiten el anÔlisis geoespacial a gran escala directamente en SQL.

Gestión de costos para cargas de trabajo a gran escala

A medida que crece la adopción de SQL, los equipos tienen dificultades para explicar el aumento del gasto en almacenes, paneles de control y herramientas. DBSQL introdujo nuevas herramientas que ayudan a los equipos a supervisar y controlar el gasto a nivel de almacén, panel de control y usuario.

Las actualizaciones clave incluyen:

  • Panel de uso de la cuenta para identificar el aumento de los costos
  • Etiquetas y presupuestos para hacer un seguimiento del gasto por equipo
  • Tablas del sistema para el anĆ”lisis detallado a nivel de consulta
  • Panel de supervisión pormenorizada de costos y vistas materializadas (versión preliminar privada) para alertas y seguimiento de los factores de costo

Estas características facilitan la comprensión de qué consultas, dashboards o herramientas impulsan el consumo.

Ā Ā Ā 

Supervisión del almacén de datos y control de acceso

A medida que mÔs equipos confían en DBSQL, los administradores necesitan supervisar la simultaneidad y el estado del warehouse sin conceder privilegios excesivos a los usuarios. DBSQL también añadió nuevas capacidades de gobernanza y observabilidad:

  • Recuento de consultas completadas (GA) para mostrar cuĆ”ntas consultas finalizan en una ventana de tiempo, lo que ayuda a identificar patrones de simultaneidad
  • Permisos CAN VIEW para que los administradores puedan conceder acceso de solo lectura a la supervisión sin otorgar derechos de ejecución
grƔfico de recuento de consultas completadas

Estas actualizaciones facilitan la ejecución de anÔlisis seguros y confiables a escala.

El resultado

DBSQL siguió mejorando en 2025. Ahora ofrece un rendimiento serverless mÔs rÔpido, IA integrada, estÔndares SQL abiertos para facilitar las migraciones y una visibilidad mÔs clara de los costos y el comportamiento de la carga de trabajo. Como DBSQL se ejecuta en la arquitectura lakehouse de Databricks, el anÔlisis, la ingeniería de datos y la IA operan en una única base gobernada. El rendimiento mejora automÔticamente y los equipos dedican menos tiempo a ajustar los sistemas o a gestionar las transferencias.

DBSQL sigue siendo un warehouse abierto, inteligente y rentable diseƱado para las realidades de la analƭtica impulsada por IA, y 2025 lo ha vuelto a impulsar.

¿Qué sigue?

Databricks SQL sigue liderando el mercado como un warehouse nativo de IA y listo para las operaciones que elimina la complejidad a la que se enfrentan los clientes en los sistemas heredados. Las próximas características incluyen:

  • Transacciones de varias instrucciones,Ā que proporcionan a los equipos actualizaciones atómicas en varias tablas y eliminan la frĆ”gil lógica de reversión personalizada que muchos clientes crearon por su cuenta. Las transacciones de varias instrucciones tambiĆ©n serĆ”n beneficiosas para migrar a Databricks.
  • Alerts V2, que extiende la confiabilidad a las operaciones del dĆ­a a dĆ­a, y reemplaza un sistema de alertas complejo por un modelo mĆ”s simple y escalable, diseƱado para miles de comprobaciones programadas y patrones operativos de nivel empresarial.
  • MĆ”s capacidades de IA, para que los analistas puedan aplicar LLM y procesar documentos sin abandonar sus flujos de trabajo, cerrando la brecha entre la lógica del almacĆ©n de datos y la inteligencia.Ā 

En conjunto, estas capacidades llevan a DBSQL hacia un almacén unificado e inteligente que gestiona la lógica transaccional principal, el monitoreo operativo y el anÔlisis asistido por IA en un solo lugar.

MƔs detalles sobre las innovaciones

Esperamos que disfrute de esta gran cantidad de innovaciones en Databricks SQL. Siempre puede consultar esta publicación de novedades de los últimos tres meses. A continuación, se muestra un inventario completo de los lanzamientos sobre los que hemos escrito en el blog durante el último trimestre:

Comenzar

¿EstÔs listo para transformar tu data warehouse? ”El mejor data warehouse es un lakehouse! Para obtener mÔs información sobre Databricks SQL, haz un recorrido del producto. Visita databricks.com/sql para explorar Databricks SQL y ver cómo las organizaciones de todo el mundo estÔn revolucionando sus plataformas de datos.

Recibe las Ćŗltimas publicaciones en tu bandeja de entrada

SuscrĆ­bete a nuestro blog y recibe las Ćŗltimas publicaciones directamente en tu bandeja de entrada.