En el Data and AI Summit, presentamos una nueva categoría de bases de datos operativas llamadas lakebases para crear aplicaciones inteligentes. Hoy, nos complace anunciar la versión preliminar pública de Databricks Lakebase, la primera base de datos Postgres totalmente administrada creada para aplicaciones de datos e IA.
Los clientes están combinando sus datos operativos y analíticos para crear aplicaciones inteligentes: sirviendo características y modelos, creando aplicaciones independientes o analizando datos operativos en un lakehouse. Pero siguen teniendo problemas con el aprovisionamiento, el escalado y la falta de una experiencia de desarrollador moderna para los datos, porque las bases de datos no han visto mucha innovación en las últimas décadas.
Las lakebases proporcionan una solución para la era de la IA. En este blog, presentaremos las características y ventajas clave de Databricks Lakebase y describiremos cómo los clientes ya utilizan Lakebase en la actualidad.
Las bases de datos OLTP no han cambiado fundamentalmente desde los años 90. Incluso cuando se implementan en la nube, estas bases de datos heredadas son lentas y costosas de aprovisionar y administrar. Las bases de datos operativas suelen implementarse en una pila separada de la plataforma de análisis, lo que crea silos entre los datos transaccionales y analíticos. Además, estas bases de datos tampoco encajan en un flujo de trabajo de desarrollo moderno necesario para el desarrollo de la IA. La arquitectura tradicional suele incluir bases de datos separadas para los entornos de desarrollo, pruebas, ensayo y producción, cada una de ellas aprovisionada, poblada y mantenida por separado.
Databricks Lakebase es la primera base de datos de este tipo construida sobre estándares de código abierto, con una arquitectura altamente escalable, basada en la separación de computación y almacenamiento, y diseñada específicamente para el desarrollo de aplicaciones modernas. Lakebase está profundamente integrada en el lakehouse para facilitar la combinación de pilas operativas, analíticas y de IA.
En los últimos 7 años, Postgres se ha convertido en la base de datos más popular en la comunidad de desarrolladores y es la opción de base de datos de facto para las aplicaciones modernas. Es de código abierto, tiene un ecosistema vibrante de extensiones y está respaldada por una sólida comunidad de bibliotecas, herramientas y marcos. Los ingenieros ya saben cómo trabajar con ella, y todos los modelos fundacionales se entrenan con grandes cantidades de datos disponibles para el ecosistema de Postgres, lo que la hace muy accesible a las aplicaciones y agentes inteligentes.
Con soporte para extensiones populares como PostGIS y pgvector, y un amplio ecosistema de controladores y herramientas, Lakebase proporciona un rico conjunto de capacidades que resultarán familiares a los equipos de desarrollo.
Lakebase aprovecha una arquitectura que separa la computación y el almacenamiento, lo que permite el escalado independiente al tiempo que admite transacciones de baja latencia (<10 ms) y alta concurrencia (>10k qps).
Lakebase está totalmente gestionada por Databricks, lo que significa que no hay ninguna infraestructura que aprovisionar o mantener. El resultado es un servicio de base de datos que elimina la fricción tanto de la infraestructura como de los procesos de desarrollo, lo que permite a los equipos avanzar más rápido sin comprometer el control ni la fiabilidad.
Lakebase se basa en la tecnología Neon, que proporciona bifurcación de copia en escritura y computación sin servidor de escalado automático. La bifurcación de copia en escritura permite crear instantáneamente una nueva base de datos con los mismos datos y esquema que una base de datos existente, sin afectar a la original. Esta nueva base de datos es económicamente amigable porque no duplica los datos subyacentes. El escalado automático de la computación sin servidor proporciona tiempos de inicio inferiores a un segundo y se escala en función de la demanda, con un escalado a cero que permite una utilización rentable de la computación.
En conjunto, el escalado automático sin servidor de las capacidades de computación y bifurcación cambia por completo el paradigma de desarrollo de las aplicaciones. Los desarrolladores pueden crear instantáneamente una bifurcación de base de datos para que coincida con cada bifurcación de git y no tienen que preocuparse por levantar nuevas instancias de base de datos, muestrear datos para entornos de desarrollo o pruebas, o hidratar varias bases de datos.
Para los desarrolladores y los agentes por igual, esto significa que los entornos de base de datos efímeros se pueden crear, utilizar y dar de baja rápidamente a un coste prácticamente nulo, con prácticamente ningún esfuerzo.
La experiencia completa de desarrollador de Neon en Lakebase y muchas más características interesantes estarán disponibles próximamente.
Lakebase integra una capa de base de datos transaccional con el lakehouse y hereda la madurez operativa de la plataforma Databricks, incluyendo la observabilidad, la seguridad y los controles de acceso. Lakebase se sincroniza con las tablas gestionadas de Unity Catalog, lo que facilita y agiliza la combinación de cargas de trabajo operativas, analíticas y de IA sin necesidad de canalizaciones ETL personalizadas. Como resultado, puede crear aplicaciones inteligentes que consuman características o predicciones generadas en el lakehouse y actualizar la capa analítica con datos operativos nuevos, todo ello dentro de una plataforma unificada.
Con cientos de clientes en el programa Private Preview, ha sido emocionante ver la variedad de casos de uso, incluyendo:

En Heineken, nuestro objetivo es convertirnos en la cervecera mejor conectada. Para ello, necesitábamos una forma de unificar todos nuestros conjuntos de datos para acelerar el camino de los datos al valor. Databricks ha sido durante mucho tiempo nuestra base para el análisis, creando información como recomendaciones de productos y mejoras en la cadena de suministro. Nuestra plataforma de datos analíticos está evolucionando ahora para ser una plataforma de datos de IA operativa y necesita entregar esos conocimientos a las aplicaciones con baja latencia. —Jelle Van Etten, Jefe de la Plataforma de Datos Global, Heineken
En Tibber, capacitar a los clientes para que tomen el control de su consumo de energía requiere una infraestructura de datos flexible. La integración de Lakebase con Databricks facilita el servicio de datos analíticos y transaccionales, lo que nos ayuda a ofrecer información en tiempo real a nuestros clientes. — Niklas Nordansjö, Jefe de la Plataforma de Datos, Tibber AS
Una sólida red de socios ayuda a los clientes de Lakebase a trabajar con sus socios tecnológicos e integradores de sistemas existentes para la integración de datos, la inteligencia empresarial y la gobernanza. Estamos encantados de contar con un increíble grupo de socios de lanzamiento de la industria para Lakebase.

En dbt Labs, estamos cambiando la forma en que se realiza la ingeniería de datos. Con el nuevo Lakebase de Databricks, nuestros clientes conjuntos podrán ahora combinar datos transaccionales de baja latencia y datos analíticos en una sola plataforma en Databricks. Esto nos ayudará a ambos a ofrecer IA a escala empresarial para nuestros clientes. Estamos impacientes por marcar el comienzo de la nueva era de la analítica con Databricks. — Ryan Segar, Director de Producto, dbt Labs
Lakebase combina la familiaridad y la extensibilidad de Postgres, la escalabilidad de una arquitectura moderna sin servidor, una experiencia de desarrollador moderna, con la experiencia de datos unificada del lakehouse y la madurez operativa de la plataforma de inteligencia de datos de Databricks. Al combinar estos elementos en una única oferta totalmente gestionada, Lakebase permite a los equipos crear aplicaciones inteligentes basadas en datos sin la complejidad operativa tradicionalmente asociada a los sistemas transaccionales.
Lakebase está disponible en versión preliminar pública con precios disponibles aquí. Si está buscando crear aplicaciones que incorporen análisis e IA, es la pieza que falta en su pila, lista para acelerar el desarrollo y simplificar las operaciones. Si es administrador de Workspace o de Cuenta, puede activarlo directamente desde su Databricks Workspace. ¡Pruébelo hoy mismo!
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
