Una conversación con Ari Kaplan, Jefe de Evangelización Técnica de Databricks, sobre análisis conversacional, bases de datos modernas y por qué la brecha entre líderes y rezagados se está cerrando rápidamente
por Catherine Brown
Hay una pregunta que circula en salas de juntas y reuniones de liderazgo de datos en este momento que dice algo así: "Ya tenemos BI. Ya tenemos una solución de base de datos. Entonces, ¿por qué necesitamos algo diferente?"
Es una pregunta justa. Y es una que Ari Kaplan ha respondido en cinco continentes. Como Director Global de Evangelización de Databricks, Ari ha pasado su carrera en la intersección de datos, tecnología y transformación empresarial, incluyendo un período como Presidente de la Independent Oracle Users Group, una organización que representa a más de 22.000 profesionales de bases de datos. Ha visto de primera mano lo que funciona, lo que envejece mal y lo que exige la próxima década.
En esta conversación, profundizamos en el análisis conversacional, la arquitectura detrás de Genie y Lakebase, lo que realmente se necesita para ganarse la confianza de los ejecutivos en los insights impulsados por IA, y por qué las empresas que no actúan pueden encontrarse más rezagadas de lo que piensan.
La información sin acción es solo trivia
Catherine Brown: Ari, a los ejecutivos les encanta la idea de hablar con sus datos, pero ¿dónde ocurre el fallo con el análisis conversacional?
Ari Kaplan: ¡Absolutamente! El resultado final es que las empresas quieren hablar con sus datos, gobernados dentro del contexto de su propio negocio. Pero aquí es donde falla: si todo lo que obtienes son hechos —trivia, esencialmente— y no hay un camino hacia la acción, entonces ¿cuál es el punto? El valor de cualquier insight solo es tan real como lo que sucede a causa de él.
Esa es la diferencia que Databricks está tratando de lograr. No es solo conversación, sino que conduce a algo. Estaba hablando con Etihad Airlines, uno de nuestros principales usuarios de Genie. Su equipo de finanzas estaba haciendo preguntas como: "Si los precios del petróleo suben el próximo trimestre, ¿cómo ajustamos nuestros precios para seguir ganando dinero y que los clientes sigan queriendo volar?" Ese tipo de análisis solía llevar meses, pero con Genie y el análisis predictivo, están ejecutando esos escenarios en tiempo real y tomando la decisión de cambiar los precios y las rutas casi de inmediato. Ese es un gran ejemplo de una empresa que opera con sus datos, no solo informada por ellos.
Catherine: Entonces, ¿cuándo una respuesta en lenguaje natural necesita convertirse en algo más, como un flujo de trabajo, una transacción o una decisión real?
Ari: Debería suceder de inmediato si quieres que importe. Un informe que se queda ahí y nadie actúa es solo ruido. El objetivo es pasar del insight a la acción sin crear algo frágil.
No quieres un sistema en el que alguien simplemente tome una respuesta de IA y la aplique ciegamente. Todavía necesitas un humano en el bucle. Lo que sí quieres es agilidad: datos que se actualizan constantemente, insights que se mantienen al día y personas en la organización que tienen la supervisión para asegurarse de que todo se mantenga conectado con la forma en que el negocio realmente opera. Los humanos siguen siendo la interfaz. Eso no desaparece.
Catherine: ¿Qué resuelve Genie para el usuario empresarial que los dashboards y los copilotos de BI aún no logran?
Ari: Bien, Genie va más allá de las herramientas tradicionales de inteligencia empresarial al permitirte simplemente hablar con tus propios datos en el contexto de tu negocio. Permite a los usuarios auto-servirse sus propios insights impulsados por IA.
Piensa en lo que es realmente un dashboard. Es una pregunta fija, que se hace una y otra vez, solo que con nuevos datos. Las empresas han estado haciendo eso durante casi 30 años. Funciona. Pero tiene un límite. Y ese límite es: la pregunta nunca cambia.
Genie supera ese límite porque ahora una persona no técnica, un ejecutivo, un líder de ventas, un gerente de finanzas, puede simplemente preguntar lo que realmente quiere saber en lenguaje claro y obtener una respuesta. No hay que enviar una solicitud al equipo de BI ni esperar una semana por un dashboard que está casi bien pero que aún necesita ajustes. Vale la pena señalar que el equipo de BI no desaparece. Pueden centrarse en las cosas genuinamente complejas en lugar de atender solicitudes de informes únicos. Al final, es una mejor situación para todos.
Y "Genie Code" es, para usuarios más técnicos, lo que permite a los científicos de datos, ingenieros de datos y otros ser mucho más efectivos y eficientes en sus trabajos y en las tareas que necesitan realizar.
Catherine: ¿Cómo encajan Genie y Lakebase? Porque desde fuera, pueden sonar como dos productos separados que pueden o no interactuar.
Ari: Genie y Lakebase son realmente dos mitades de la misma idea. Lakebase es un área clave donde pueden residir tus datos transaccionales. Es la base de datos moderna construida para manejar miles de millones o incluso billones de registros. Lakebase es solo una de las muchas fuentes con las que se conecta Genie. Lakehouse (DBSQL) es otra, al igual que cualquier cosa federada a través de Unity Catalog: Slack, SAP, Google Drive, SharePoint, etc.
Genie es la forma en que hablas con todos tus datos, desde Lakebase hasta tus datos de almacén en Lakehouse y más allá. Así que uno los almacena, ese es Lakebase. Y uno los presenta, ese es Genie. Y todo se ejecuta a través de Unity Catalog para gestionar y mantener los controles de gobernanza. Así, las personas adecuadas solo ven lo que se supone que deben ver, y todos trabajan con las mismas definiciones. En todos los equipos y para todos los usuarios de negocio, las definiciones son las mismas: cliente significa cliente y beneficio significa beneficio. Ese lenguaje compartido suena simple, pero es en realidad lo que hace que todo sea confiable.
Catherine: Aquí hay una pregunta divertida: Un CIO dice que ya tengo una base de datos. Argumenta por qué eso ya no es suficiente.
Ari: Me encanta esta porque viví el otro lado. Puedo decirte que la arquitectura fundamental detrás de las bases de datos tradicionales realmente no ha cambiado en décadas. Esas bases se construyeron para una era diferente.
Esto es lo que ha cambiado. Con Lakebase, puedes aprovisionar una nueva base de datos al instante, no en días o semanas. Y la mayoría de las bases de datos creadas hoy se aprovisionan con IA.
La segunda cosa es el costo. Tradicionalmente, si necesitabas un entorno de producción, un entorno de prueba y un entorno de control de calidad, estabas haciendo tres copias de tus datos. Triple almacenamiento, triple costo. Con Lakebase, puedes crear cien entornos sin hacer una sola copia de los datos subyacentes. Estuve en Brasil y las empresas me dijeron que redujeron su costo total de propiedad en un 40% después de la migración. Lo más alto que he oído es un 98%. No todos llegan a ese punto, pero los ahorros son reales dondequiera que voy.
Y luego la escala. Arctic Wolf, el centro de operaciones de red más grande del mundo, gestiona más de un billón de registros en Databricks cada día. Las viejas suposiciones simplemente ya no se sostienen.
Catherine: ¿Cuál es la diferencia real entre hacer una pregunta a tus datos y operar tu negocio con ellos?
Ari: La forma más fácil de decirlo: uno te dice lo que pasó, el otro te ayuda a decidir qué hacer a continuación.
Una aerolínea internacional con la que trabajo tenía 80 proveedores —catering, seguridad, electrónica, todo. Le preguntaron a Genie: ¿Cuál de nuestros proveedores nos está cobrando de más? Clasifícalos. Algo así habría llevado a un equipo de analistas meses. Genie lo respondió. Resultó que su proveedor de jugo de naranja era el que más cobraba de más. Ahora saben exactamente dónde ir para renegociar. Eso es operar un negocio con datos.
Supercell —hacen juegos con cientos de millones de jugadores mensuales— usa Lakebase para matchmaking en tiempo real, controles de toxicidad y decisiones de compra dentro del juego. Todo eso está sucediendo en vivo, a escala, porque la infraestructura de datos puede seguir el ritmo.
E iFood en Brasil, que maneja más del 90% de las entregas de comida del país, usa Lakebase para dirigir a los motociclistas a través de ciudades densas en tiempo real. Estas no son empresas que están pensando en usar sus datos mejor algún día. Ya lo están haciendo.
Catherine: ¿Por qué la semántica y las definiciones de negocio son importantes para que los ejecutivos confíen en el análisis conversacional?
Ari: Más de lo que la mayoría de la gente espera, honestamente. Aquí hay un ejemplo simple. Le pides a tres ejecutivos de la misma empresa que definan beneficio. Obtendrás tres respuestas diferentes. Lo mismo con la rotación de clientes, lo mismo con la satisfacción del cliente. Si tu sistema de análisis no sabe qué definición usar, obtendrás respuestas que causan discusiones en lugar de alineación.
Databricks brinda a los ejecutivos la capacidad de definir esos términos ellos mismos sin necesidad de desarrollo de software. Un ejecutivo puede decir: para mí, una venta no cuenta hasta que la ventana de devolución de 30 días haya cerrado. Esa definición ahora está integrada para todos los que usan ese espacio de Genie. Incluso puedes subir tu manual de RR. HH. o de operaciones, y Unity Catalog lo usará para comprender mejor el lenguaje de tu empresa.
FordDirect hizo algo similar en su red global de concesionarios. En miles de ubicaciones, usuarios muy no técnicos, vendedores de autos, recibieron informes operativos diarios a través de Genie. Informes que incluían qué clientes llegaban, qué vehículos estaban llegando y qué autos estaban siendo retirados. Realizaron una encuesta de satisfacción y tuvo un 95% de aprobación. Para una audiencia no técnica a esa escala, ese número es casi inaudito.
Catherine: ¿Qué sale mal cuando el análisis conversacional no está conectado a sistemas operativos gobernados?
Ari: Se produce deriva y se pierde la confianza, y una vez que se pierde la confianza, es muy difícil recuperarla. Encuestamos a más de 20.000 clientes, y la barrera más grande para la adopción de IA y datos fue la falta de confianza. No el costo, no la complejidad, la confianza. Y esa desconfianza proviene de sistemas que no están gobernados, donde diferentes equipos definen las cosas de manera diferente, y las respuestas comienzan a divergir de la realidad. Las alucinaciones son la versión dramática de esto, pero la versión más silenciosa —datos ligeramente desactualizados, definiciones ligeramente inconsistentes— es en realidad más peligrosa porque es más difícil de detectar.
Catherine: Para los líderes que dicen que el análisis de lenguaje natural es demasiado arriesgado porque la terminología cambia constantemente, ¿qué debe ser cierto antes de que deban seguir adelante?
Ari: No se equivocan, el riesgo es real. Sin salvaguardias, los chatbots de propósito general son genuinamente arriesgados porque no saben si los datos de los que extraen información son de la semana pasada o de hace cinco años. Y, no entienden el contexto de su negocio. La respuesta no es esperar, sin embargo. La respuesta es ser deliberado sobre cómo lo implementa.
Fox Sports es el ejemplo al que sigo volviendo. Su reputación se basa enteramente en la precisión. Las personas toman decisiones, a veces financieras que involucran apuestas, basándose en su contenido. Implementaron un chatbot público impulsado por Databricks. Pero tuvieron cuidado al implementarlo. Predefinieron qué se podía y qué no se podía preguntar. Hicieron que los humanos moldearan cómo se enmarcaban las respuestas. Y construyeron controles para prevenir alucinaciones. Hoy, el 25% de todas las preguntas en Fox Sports se ejecutan a través de ese entorno. Todo porque primero obtuvieron la base correcta.
Catherine: Para el líder que piensa que Genie es solo text-to-SQL con una mejor historia, ¿qué se están perdiendo?
Ari: Mucho, para ser honesto. Lo fundamental que se están perdiendo es que Genie se basa en sus datos, con su terminología y gobernado por sus reglas de negocio. Un chatbot genérico ha sido entrenado en internet —letras de Taylor Swift, trivia histórica, lo que sea. Genie sabe lo que su empresa quiere decir cuando usa los términos cliente y conoce su año fiscal. Conoce su catálogo de productos. Esa especificidad granular es importante. Y Genie va mucho más allá de preguntas y respuestas. Genie realiza investigaciones abiertas. Hace predicciones. Se conecta a sus sistemas adyacentes como Salesforce, Workday, SAP, Slack, para que pueda hacer preguntas que abarquen toda su empresa. He visto a ejecutivos usarlo para hacer preguntas genuinamente abiertas como: "¿En qué debería enfocarme hoy?" Y esos ejecutivos se van con dos ideas que nunca habían considerado. Eso no es text-to-SQL. Es algo muy diferente.
Catherine: Última pregunta: en 18 meses, ¿qué diferencia a las empresas que están operativizando una pila de datos moderna de las que todavía están ejecutando demostraciones?
Ari: De hecho, fui parte de la historia detrás de la película “Moneyball”, que se centró en cómo una industria (la Major League Baseball) tuvo que cambiar. Los equipos que no se adaptaron se quedaron atrás de manera drástica y rápida. La frase de esa historia fue "adaptarse o morir". Suena extremo, pero sigo volviendo a ella.
He estado en Brasil, Australia, India, en Europa y Asia en los últimos meses. A dondequiera que voy, las empresas se mueven rápido. Las que se toman esto en serio ahora mismo están avanzando. Y la brecha no se mantendrá pequeña, se acumulará. El valor es real. Las empresas están obteniendo mejores insights, sí, pero también están automatizando trabajos que solían consumir equipos enteros, transformando cadenas de suministro y acelerando el desarrollo de software. Todo está disponible ahora mismo. Los ejecutivos que tratan esto como algo a evaluar más tarde descubrirán que el "más tarde" llegó antes de lo que esperaban.
La Pila de Datos Ha Cambiado. La Pregunta Es Si Usted Lo Ha Hecho.
Aquí está el punto sobre el argumento de Ari: en realidad no se trata de productos. Se trata de un cambio en lo que es posible y la rapidez con la que se está convirtiendo en la expectativa básica. Genie y Lakebase no son una herramienta de BI y una base de datos que casualmente viven en la misma plataforma. Son una única respuesta a una pregunta que todo líder de datos está recibiendo en este momento: ¿cómo hacemos que nuestros datos realmente funcionen para las personas que dirigen este negocio? Uno los almacena y gobierna a una escala para la que los sistemas heredados nunca fueron diseñados. El otro los pone en lenguaje claro frente a las personas que más los necesitan, con el contexto y las salvaguardias para hacerlos confiables.
Las organizaciones que lo hacen bien no solo están ejecutando mejores informes. Están tomando decisiones más rápidas, detectando problemas antes y encontrando oportunidades que sus competidores todavía están creando hojas de cálculo para encontrar.
Explore lo que Genie y Lakebase pueden hacer por su organización.
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.