Publicado: 12 de junio de 2024
por Patrick Wendell y Naveen Rao
Durante el último año, hemos visto un aumento de modelos fundacionales comerciales y de código abierto que muestran sólidas capacidades de razonamiento en tareas de conocimiento general. Si bien los modelos generales son un bloque de construcción importante, las aplicaciones de IA de producción a menudo emplean Sistemas de IA Compuestos, que aprovechan múltiples componentes como modelos ajustados, recuperación, uso de herramientas y agentes de razonamiento. Estos sistemas de agentes de IA aumentan los modelos fundacionales para impulsar una mejor calidad y ayudar a los clientes a llevar estas aplicaciones GenAI a producción con confianza.
Hoy, en el Data and AI Summit, anunciamos varias capacidades nuevas que hacen de Databricks Mosaic AI la mejor plataforma para construir sistemas de agentes de IA de calidad de producción. Estas características se basan en nuestra experiencia trabajando con miles de empresas para poner en producción aplicaciones impulsadas por IA. Los anuncios de hoy incluyen soporte para el ajuste fino de modelos fundacionales, un catálogo empresarial para herramientas de IA, un nuevo SDK para construir, implementar y evaluar agentes de IA, y una puerta de enlace de IA unificada para gobernar servicios de IA implementados.
Con este anuncio, Databricks ha integrado completamente y expandido sustancialmente las capacidades de construcción de modelos incluidas inicialmente en nuestra adquisición de MosaicML hace un año.

La evaluación de modelos de IA monolíticos a sistemas compuestos es un área activa de investigación académica e industrial. Resultados recientes han encontrado que “los resultados de IA de vanguardia se obtienen cada vez más mediante sistemas compuestos con múltiples componentes, no solo modelos monolíticos”. Estos hallazgos se ven reforzados por lo que vemos en nuestra base de clientes. Tomemos como ejemplo a la firma de investigación financiera FactSet: cuando implementaron un LLM comercial para su caso de uso de Texto a Fórmula Financiera, solo pudieron obtener un 55% de precisión en la fórmula generada; sin embargo, modularizar su modelo en un sistema compuesto les permitió especializar cada tarea y lograr un 85% de precisión. Databricks Mosaic AI admite la construcción de sistemas de IA a través de los siguientes productos:

Los usuarios solo tienen que seleccionar una tarea y un modelo base, y proporcionar datos de entrenamiento (como una tabla Delta o un archivo .jsonl) para obtener un modelo completamente ajustado que poseen para su tarea especializada

Databricks Model Serving ahora admite la llamada a funciones y los usuarios pueden experimentar rápidamente con funciones y modelos base en el AI Playground
Los modelos de IA de propósito general se optimizan para benchmarks, como MMLU, pero los sistemas de IA implementados están diseñados para resolver tareas específicas del usuario como parte de un producto más amplio (por ejemplo, responder un ticket de soporte, generar una consulta o sugerir una respuesta). Para asegurarnos de que estos sistemas funcionen bien, es importante tener un marco de evaluación robusto para definir métricas de calidad, recopilar señales de calidad e iterar sobre el rendimiento. Hoy estamos emocionados de anunciar varias herramientas de evaluación nuevas:

Databricks MLflow proporciona métricas asistidas por IA para ayudar a los desarrolladores a obtener intuiciones rápidas

Databricks MLflow permite a las partes interesadas, incluso a aquellas fuera de la Plataforma Databricks, evaluar los resultados de los modelos y proporcionar calificaciones para ayudar a iterar en la calidad
Corning es una empresa de ciencia de materiales; nuestras tecnologías de vidrio y cerámica se utilizan en muchas aplicaciones industriales y científicas, por lo que comprender y actuar sobre nuestros datos es esencial. Construimos un asistente de investigación de IA utilizando Databricks Mosaic AI Agent Framework para indexar cientos de miles de documentos, incluidos datos de la oficina de patentes de EE. UU. Era extremadamente importante para nosotros que nuestro asistente impulsado por LLM respondiera preguntas con alta precisión, de esa manera, nuestros investigadores podrían encontrar y avanzar en las tareas en las que estaban trabajando. Para implementar esto, utilizamos Databricks Mosaic AI Agent Framework para construir una solución Hi Hello Generative AI aumentada con los datos de la oficina de patentes de EE. UU. Al aprovechar la Plataforma de Inteligencia de Datos de Databricks, mejoramos significativamente la velocidad de recuperación, la calidad de la respuesta y la precisión. — Denis Kamotsky, Ingeniero Principal de Software, Corning
Ante la explosión de modelos fundacionales de vanguardia, hemos visto que nuestra base de clientes adopta rápidamente nuevos modelos: DBRX tuvo mil clientes experimentando con él a las dos semanas de su lanzamiento, y estamos viendo varios cientos de clientes experimentando con los modelos Llama3 lanzados recientemente. Muchas empresas encuentran difícil dar soporte a estos modelos más nuevos en su plataforma dentro de un plazo razonable, y los cambios en las estructuras de prompts y las interfaces de consulta dificultan su implementación. Además, a medida que las empresas abren el acceso a los modelos más recientes y geniales, la gente se entusiasma y crea un montón de cosas, lo que puede convertirse rápidamente en un lío de problemas de gobernanza. Los problemas comunes de gobernanza son los límites de tasa que se alcanzan y afectan a las aplicaciones de producción, los costos crecientes a medida que la gente ejecuta modelos GenAI en tablas grandes, y las preocupaciones sobre fugas de datos a medida que la PII se envía a proveedores de modelos de terceros. Hoy, nos complace anunciar nuevas capacidades en AI Gateway para la gobernanza y un catálogo de modelos curado para habilitar el descubrimiento de modelos. Las características incluidas son:
Databricks Model Serving está acelerando nuestros proyectos impulsados por IA al facilitar el acceso y la gestión seguros de múltiples modelos SaaS y abiertos, incluidos los alojados dentro o fuera de Databricks. Su enfoque centralizado simplifica la gestión de seguridad y costos, permitiendo a nuestros equipos de datos centrarse más en la innovación y menos en la sobrecarga administrativa. — Greg Rokita, AVP, Technology en Edmunds.com
Databricks Mosaic AI potencia a los equipos para construir y colaborar en sistemas de IA compuestos desde una única plataforma con gobernanza centralizada y una interfaz unificada para entrenar, rastrear, evaluar, cambiar y desplegar. Al aprovechar los datos empresariales, las organizaciones pueden pasar del conocimiento general a la inteligencia de datos. Esta evolución permite a las organizaciones obtener insights más relevantes más rápido.
¡Estamos emocionados de ver qué innovaciones construirán nuestros clientes a continuación!
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
