30 de marzo de 2026

Cómo el desarrollo de software agéntico cambiará las bases de datos

Lo que los agentes realmente necesitan de la infraestructura de bases de datos y lo que aprendimos al construir Lakebase

por Ippokratis Pandis, Nikita Shamgunov y Reynold Xin

En nuestro artículo anterior, presentamos Lakebase, la arquitectura de base de datos de tercera generación que separa fundamentalmente el almacenamiento y la computación. En este artículo, exploramos una consecuencia crítica de este cambio: ¿cómo están cambiando los agentes de IA el ciclo de vida del desarrollo de software y qué tipo de bases de datos necesitan realmente los agentes de IA?

El ciclo de vida del desarrollo de software está experimentando una transformación radical. Los LLM han permitido una nueva generación de frameworks agénticos que pueden analizar requisitos, escribir código, ejecutar pruebas, implementar servicios y refinar iterativamente aplicaciones, todo a una velocidad récord. Como resultado, el costo marginal de construir y desplegar aplicaciones está disminuyendo drásticamente.

Aunque todavía estamos en las primeras etapas del desarrollo de software agéntico, hemos observado consistentemente, tanto dentro de Databricks como entre nuestra base de clientes, que la tasa de experimentación se está acelerando y el volumen de aplicaciones que se están construyendo está explotando. A medida que el mundo transita del software hecho a mano al desarrollo de software agéntico, identificamos tres tendencias emergentes que redefinirán conjuntamente los requisitos de los sistemas de bases de datos modernos:

El desarrollo de software pasará de ser un proceso convencional, lento y lineal, a un proceso evolutivo rápido.
El software será más valioso en general, pero el valor de cada aplicación individual se desplomará a medida que disminuya el costo marginal de desarrollar software. Esto significa que necesitamos una infraestructura que pueda soportar el desarrollo de software a un costo marginal mínimo. Crucialmente, la arquitectura también debe tener en cuenta el hecho de que cualquiera de estas bases de datos pequeñas y efímeras puede convertirse en un sistema de producción con mucho tráfico, lo que hace que la capacidad de soportar un crecimiento elástico y sin interrupciones sea un requisito arquitectónico fundamental.
Los ecosistemas abiertos se convertirán en un requisito operativo estricto, no solo en una preferencia.

Aquí hay una mirada más profunda a cada una de estas tendencias y cómo Lakebase está arquitectónicamente diseñado para soportarlas.

Desarrollo de Software Evolutivo Rápido

Dado que una gran parte del ciclo de vida del desarrollo de software era históricamente muy costosa (escribir código, pruebas, operaciones), construir y operar una nueva aplicación requería una inversión de ingeniería significativa. En consecuencia, el desarrollo de software tradicional se optimizó para una planificación cuidadosa y un proceso relativamente lineal.

Los agentes cambian esta dinámica. Las aplicaciones ahora se pueden generar, modificar y reimplementar en minutos. En lugar de construir un sistema cuidadosamente diseñado, los desarrolladores y los agentes exploran cada vez más grandes espacios de implementaciones posibles. El desarrollo comienza a parecerse a un algoritmo evolutivo:

Generar una versión inicial de una aplicación.
Crear rápidamente variantes con diferentes esquemas, prompts o lógica.
Evaluar los resultados.
Continuar el desarrollo a partir de las versiones más exitosas.

Dependiendo de la complejidad, cada iteración evolutiva puede durar desde segundos hasta horas, lo que es 100x a 1000x más rápido que los ciclos de desarrollo pre-LLM. De hecho, nuestra telemetría de entornos de producción de Lakebase muestra que, en promedio, cada proyecto de base de datos tiene ~10 ramas y algunas bases de datos con ramas anidadas alcanzan profundidades de más de 500 iteraciones (es decir, 500 iteraciones en la evolución).

La infraestructura de código como Git ya soporta muy bien este flujo de trabajo. Los desarrolladores o agentes pueden crear una rama del código base con git checkout -b instantáneamente. Sin embargo, la infraestructura de bases de datos heredada no ofrece una forma rápida y rentable de ramificar el estado de la base de datos.

Lakebase está diseñado para soportar este flujo de trabajo evolutivo agéntico de forma nativa. Los agentes pueden crear una rama de una base de datos de producción o de prueba al instante y a un costo cercano a cero. Dado que Lakebase utiliza un mecanismo de ramificación de copia en escritura de metadatos O(1) en la capa de almacenamiento, no se requiere una copia física costosa de los datos. Simplemente ramifica los datos junto con el código y solo paga la computación de la base de datos durante la duración del experimento.

Sensibilidad al Costo

Como se mencionó anteriormente, aunque el software será más valioso en general, el valor de cada aplicación individual se desplomará a medida que disminuya el costo marginal de desarrollar software. Muchos servicios generados por agentes son pequeñas herramientas internas, prototipos o flujos de trabajo estrechos. Pueden ejecutarse solo ocasionalmente o servir cargas de trabajo muy variables y orientadas a eventos.

En este mundo, necesitamos una infraestructura que pueda soportar el desarrollo de nuevo software a un costo marginal/incremental mínimo. Cualquier base de datos que imponga cientos de dólares al mes como precio base mínimo es imposible de justificar si la aplicación en sí misma proporciona un valor limitado o experimental. Nuestros datos muestran que para aproximadamente la mitad de estas aplicaciones agénticas, la vida útil de la computación de la base de datos es inferior a 10 segundos.

Las bases de datos tradicionales fueron diseñadas como componentes de infraestructura siempre activos con una sobrecarga fija de aprovisionamiento y operación. Ese modelo se adapta a aplicaciones grandes y estables, pero falla económicamente cuando las aplicaciones son numerosas, efímeras y de corta duración.

La naturaleza sin servidor y elástica de Lakebase aborda directamente este imperativo de costos. Al desacoplar completamente las instancias de cómputo de la capa de almacenamiento, Lakebase puede escalar automáticamente la computación de la base de datos según la carga en subsegundos. Crucialmente, también escala la base de datos a cero cuando no se utiliza, eliminando por completo el piso de costos y logrando costos inactivos cercanos a cero.

Creciendo de Pequeño a Grande

La naturaleza del desarrollo impulsado por agentes significa que se crea constantemente un gran volumen de bases de datos pequeñas y efímeras para pruebas, prototipos y flujos de trabajo estrechos. El desafío arquitectónico crucial es que los desarrolladores, y los propios agentes, no pueden predecir cuáles de estas aplicaciones nacientes despegarán repentinamente y requerirán una escala de producción masiva.

Por lo tanto, la arquitectura de la base de datos debe soportar inherentemente un crecimiento elástico y sin interrupciones, desde una instancia pequeña y de bajo costo hasta un sistema de producción a gran escala con tráfico intenso. Esta transición debe ocurrir sin requerir ninguna re-plataforma manual, aprovisionamiento o pasos de migración complejos por parte del usuario. La arquitectura por sí sola debe manejar la evolución, haciendo de la capacidad de escalar instantáneamente desde casi cero hasta una capacidad masiva un requisito fundamental para un mundo donde la exploración agéntica es el modelo de desarrollo predeterminado.

Ecosistemas de Código Abierto

Los sistemas agénticos derivan sus capacidades de los LLM entrenados en extensos corpus de código fuente y documentación técnica disponibles públicamente. Este sesgo de entrenamiento les da una familiaridad operativa profunda con los ecosistemas de código abierto, las API y la semántica de errores.

Las bases de datos como Postgres están profundamente integradas en el mundo del código abierto. Sus interfaces, comportamientos y códigos de error aparecen en los datos de entrenamiento de los que aprenden los modelos modernos. Como resultado, los agentes pueden generar consultas, esquemas e integraciones para ellos de manera mucho más confiable. Las bases de datos propietarias enfrentan una desventaja inherente porque los agentes simplemente carecen de suficiente contexto para operarlas de manera efectiva.

Para el desarrollo impulsado por agentes, la apertura ya no es solo una preferencia filosófica, es un requisito práctico para la automatización confiable. Pero este requisito debe extenderse más allá de la interfaz de consulta; debe llegar a la propia capa de almacenamiento. Si bien las bases de datos en la nube de segunda generación pueden usar motores de ejecución de código abierto, aún bloquean sus datos en formatos de almacenamiento propietarios e internos.

Lakebase está construido sobre Postgres, pero lleva la apertura un paso más allá. Almacena datos en formatos de página Postgres estándar y abiertos directamente en el almacenamiento de objetos en la nube (el data lake). Esto permite que los agentes, los motores de análisis externos y las nuevas herramientas interactúen con los datos de forma nativa, sin verse limitados por un único motor de cómputo propietario.

Bases de Datos para la Era Agéntica

El cambio no es hipotético, ya está en marcha. En el servicio Lakebase de Databricks, los agentes de IA ahora crean aproximadamente 4 veces más bases de datos que los usuarios humanos.

Este punto de datos captura las tendencias descritas anteriormente en un solo gráfico. Los agentes son creadores prolíficos de entornos de bases de datos: inician instancias para experimentos, las ramifican para pruebas y las descartan cuando terminan. La infraestructura que sirve a estas cargas de trabajo debe soportar este patrón de manera económica y operativa.

Propiedades como la eficiencia de costos, la agilidad y la apertura siempre han sido deseables. Pero el auge del desarrollo de software agéntico las ha convertido de conveniencias a requisitos fundamentales. Las bases de datos que imponen altos costos iniciales, carecen de primitivas de ramificación o bloquean datos en formatos propietarios, cada vez se desfasarán más con la forma en que se está construyendo el software.

Este es precisamente el espacio de diseño de Lakebase. Fue construido para las realidades económicas y técnicas específicas que crea el desarrollo impulsado por IA: ramificación evolutiva a costo cero, verdadera elasticidad de escala a cero, almacenamiento abierto de Postgres en el lake y operaciones de autogestión. A medida que los agentes participan cada vez más en la construcción y evolución del software, las bases de datos más adecuadas para este nuevo mundo son aquellas diseñadas desde cero para la experimentación, la apertura y la elasticidad.

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

Recibe las últimas publicaciones en tu bandeja de entrada

Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.

Ver todos los blogs