Almacenamiento de datos más sencillo, rápido y económico
por Gaurav Saraf y Kevin Clugage
Nos complace compartir las últimas funciones nuevas y mejoras de rendimiento que hacen que Databricks SQL sea más sencillo, rápido y económico que nunca. Con más de 7,000 clientes que utilizan Databricks SQL como su data warehouse en la actualidad, ¡este se ha convertido en el producto de más rápido crecimiento en nuestra historia!
Databricks SQL está integrado en la arquitectura de lakehouse. Fuimos pioneros en este enfoque a principios de 2020 y lanzamos Databricks SQL (DBSQL) como parte de Databricks Data Intelligence Platform. Predijimos que los data warehouses independientes y separados se convertirían en sistemas heredados debido a sus altos costos y carácter propietario, y hoy vemos pruebas sólidas de que esto es cierto: el informe de MIT Technology Insights muestra que el 74% de las empresas ya han adoptado la arquitectura de lakehouse. Las numerosas plataformas de datos basadas en lakehouse disponibles para estas empresas se analizaron recientemente en Forrester Wave para Data Lakehouses, que reconoció a Databricks como Líder con las puntuaciones más altas tanto en la categoría de oferta actual como en la de estrategia en comparación con todas las demás.

En nuestras conversaciones con los clientes, la ventaja de lakehouse proviene de dos cosas: el menor costo total y una plataforma unificada para AI y BI. El lakehouse permite utilizar una sola copia de los datos, en un formato abierto, para todas sus cargas de trabajo de AI y BI. Esto elimina la duplicación y replicación de datos necesarias para mantener los datos sincronizados entre múltiples plataformas, lo que reduce drásticamente los costos y simplifica la arquitectura.
El año pasado, declaramos que el enfoque clásico para el rendimiento del sistema, basado en heurísticas y optimizadores de costos, ¡estaba equivocado la mayor parte del tiempo! Aunque esas técnicas eran las mejores disponibles, la era actual de la AI ha permitido un enfoque completamente nuevo. Hoy en día, utilizamos una nueva generación de sistemas de AI en todas las capas de nuestra plataforma que han llevado las mejoras de rendimiento del sistema a un nuevo nivel. Estos sistemas de AI analizan sus cargas de trabajo y mejoran la eficiencia y el rendimiento de forma automática.
Estos son solo algunos de nuestros sistemas de AI integrados y lo mejor de todo es que no necesita conocer los detalles de cómo funcionan: la magia ocurre de forma automática. Dado el tiempo que dedicamos a esta área, se puede decir que estamos obsesionados con el rendimiento, y con el tiempo podemos ver la diferencia que esto ha marcado. Cuando analizamos las cargas de trabajo repetitivas de nuestros clientes, ¡el rendimiento de las mismas consultas de BI ha mejorado en un 73% en comparación con hace dos años! ¡Eso es 4 veces más rápido!

También hemos infundido AI en nuestra experiencia de usuario, lo que hace que Databricks SQL sea más fácil de usar y más productivo para los analistas de SQL. El Asistente de AI de Databricks, ahora disponible de forma general, es un asistente de AI integrado y sensible al contexto que ayuda a los analistas de SQL a crear, editar y depurar SQL. Este asistente está integrado en el mismo motor de inteligencia de datos de nuestra plataforma, por lo que comprende el contexto único de su negocio. El asistente ha tenido una rápida adopción en Databricks debido a lo bien que puede redactar consultas o corregir errores para los analistas de SQL, lo que ahorra incontables horas de tiempo y aumenta la productividad.

Con el auge de los modelos de GenAI y ML, no sorprende que los analistas de SQL quieran acceder cada vez más a esos modelos de AI directamente dentro de SQL. Presentamos por primera vez las funciones de AI en Databricks SQL el año pasado exactamente por esa razón, y desde entonces hemos visto una rápida adopción. Las funciones de AI se encuentran ahora en vista previa pública y también hemos añadido nuevas funciones como la búsqueda vectorial. Las funciones de AI abstraen las complejidades técnicas del uso de LLM, lo que permite a los analistas y científicos de datos utilizar estos modelos sin esfuerzo, sin tener que preocuparse por la infraestructura subyacente.
La función ai_query() le permite consultar cualquier modelo de AI desde SQL. Estos pueden ser modelos de GenAI o modelos clásicos de ML. Incluso puede utilizar modelos de LLM externos
Funciones de LLM integradas
También hay 9 nuevas funciones de GenAI que le permiten analizar texto no estructurado con el poder de los LLM. Por ejemplo:
Extraer información importante del texto que está presente en la columna de una tabla:
Clasificar los comentarios de las reseñas de un producto en función del contenido:
Consulte las 9 funciones aquí
AI Search: ¡La nueva función de búsqueda vectorial le permite realizar búsquedas de KNN y facilita el uso directo de RAG! Esto utiliza el producto AI Search de Databricks. Al combinar las capacidades de búsqueda vectorial y las capacidades de AI_query, los analistas de SQL ahora pueden ejecutar análisis complejos fácilmente. Por ejemplo, ahora se pueden buscar todos los tweets
AI_Forecast: una nueva función integrada de pronóstico de series temporales para que puedas pronosticar métricas (por ejemplo, ingresos) rápidamente a través de SQL sin necesidad de crear un modelo de ML personalizado.
Con el objetivo de democratizar verdaderamente la obtención de información a partir de los datos, también presentamos Databricks AI/BI, un producto de inteligencia de negocios que aprovecha la AI generativa para comprender profundamente la semántica de los datos y permitir el análisis de datos de autoservicio para todos en tu organización. Desarrollado sobre un sistema de AI compuesto, AI/BI aprovecha la información de todo tu patrimonio de datos, incluidos los metadatos de Unity Catalog, las canalizaciones de ETL, las consultas SQL y más. Cuenta con dos componentes principales: AI/BI Dashboards, una oferta de BI de código bajo para crear rápidamente visualizaciones de datos y paneles, y Genie, una interfaz conversacional para tus datos que aprende continuamente de los comentarios de los usuarios para responder a una amplia gama de preguntas comerciales del mundo real sin alucinaciones. Estas innovaciones mejoran significativamente el análisis de autoservicio dentro de Databricks SQL, lo que permite el acceso a una gama más amplia de usuarios no técnicos al tiempo que garantiza una gobernanza unificada, el seguimiento del linaje, el uso compartido seguro y un alto rendimiento a través de la integración con tu Data Intelligence Platform.
Además de las nuevas funciones de AI, también hemos lanzado una serie de capacidades principales de SQL Warehouse. Miles de clientes han migrado sus almacenes de datos heredados a DBSQL. Para hacer posibles esas migraciones, nos aseguramos de que DBSQL tuviera todas las funciones para proporcionar las mismas capacidades de almacenamiento de datos en el lakehouse:
No lo olvides, todo esto funciona en un excelente editor de SQL impulsado por AI y en una herramienta de creación de paneles integrada.
Además, gracias a nuestros excelentes socios, también contamos con un ecosistema rico, abierto e integrado de tus herramientas de datos y AI favoritas, como Power BI, Tableau y dbt. Es casi seguro que cualquier herramienta que utilices hoy en día ya funcione con DBSQL.

Para obtener más información sobre lo último en almacenamiento de datos y Databricks SQL, consulta la conferencia principal de Data Warehouse de Data + AI Summit, junto con las numerosas sesiones del track de Almacenamiento de datos, Analítica y BI.
Si deseas migrar tu almacén de datos existente a un almacén de datos serverless de alto rendimiento, con una excelente experiencia de usuario y un costo total menor, entonces Databricks SQL es la solución: pruébalo gratis.
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.