Ir al contenido principal

Mejora la calidad de respuesta de tu aplicación RAG con datos estructurados en tiempo real

Feature Serving Social Card

La Generación Aumentada por Recuperación (RAG) es un mecanismo eficiente para proporcionar datos relevantes como contexto en las aplicaciones de IA generativa. La mayoría de las aplicaciones de RAG suelen utilizar índices vectoriales para buscar contexto relevante a partir de datos no estructurados, como documentación, wikis y tickets de soporte. Ayer, anunciamos la vista previa pública de Databricks Vector Search, que ayuda exactamente con eso. Sin embargo, la calidad de la respuesta de la IA generativa puede mejorarse aumentando estos contextos basados en texto con datos estructurados relevantes y personalizados. Imagina una herramienta de IA generativa en un sitio web de venta minorista en el que los clientes pregunten: "¿Dónde está mi pedido reciente?". Esta IA debe entender que la consulta es sobre una compra específica, luego recopilar información de envío actualizada de los artículos de línea, antes de usar los LLM para generar una respuesta. El desarrollo de estas aplicaciones escalables demanda un trabajo sustancial, que integra tecnologías para el manejo de datos tanto estructurados como no estructurados con capacidades de IA generativa.

Nos complace anunciar la versión preliminar pública de Databricks Feature & Function Serving, un servicio en tiempo real de baja latencia diseñado para servir datos estructurados desde Databricks Data Intelligence Platform. Puede acceder instantáneamente a features de ML precalculadas, así como realizar transformaciones de datos en tiempo real al servir cualquier función de Python desde Unity Catalog. Los datos recuperados pueden utilizarse en motores de reglas en tiempo real, aplicaciones de ML clásico y de IA generativa.

El uso de Feature and Function Serving (AWS)(Azure) para datos estructurados, en coordinación con Databricks Vector Search (AWS)(Azure) para datos no estructurados, simplifica significativamente la puesta en producción de aplicaciones de IA generativa. Los usuarios pueden crear e implementar estas aplicaciones directamente en Databricks y aprovechar las canalizaciones de datos, la gobernanza y otras características empresariales existentes. Los clientes de Databricks de diversos sectores utilizan estas tecnologías junto con marcos de código abierto para crear potentes aplicaciones de IA generativa, como las que se describen en la siguiente tabla.

IndustriaCASOS DE USO
Venta minorista
  • Recomendaciones de productos / Clasificación de búsqueda usando preferencias de usuario, historial de búsqueda, ubicación, etc.
  • Búsqueda de productos basada en imágenes y metadatos
  • Gestión y previsión de inventarios a partir de datos de ventas, tendencias estacionales y análisis de mercado/competencia.
Educación
  • Planes de aprendizaje personalizados basados en errores pasados, tendencias históricas y  cohortes
  • Calificación automatizada, retroalimentación, seguimientos e informes de progreso
  • Filtrado de contenido para dispositivos asignados
Servicios financieros
  • Aplicaciones de lenguaje natural para que analistas e inversores correlacionen las llamadas de resultados y los informes con la inteligencia de mercado y las tendencias históricas
  • Análisis de fraude y riesgos
  • Gestión de patrimonio personalizada, planificación de la jubilación, análisis de tipo "what-if" y próximas mejores acciones
Viajes y hotelería
  • Chatbots para interacciones personalizadas con los clientes y recomendaciones de viaje a la medida
  • Planificación dinámica de rutas con datos meteorológicos, patrones de tráfico en vivo y datos históricos
  • Optimización dinámica de precios mediante análisis competitivos y fijación de precios basada en la demanda
Salud y ciencias biológicas
  • Interacción del paciente/miembro y resúmenes de salud
  • Aplicaciones de asistencia para la atención personalizada, las decisiones clínicas y la coordinación de la atención
  • Resumen de informes de R&D, análisis de ensayos clínicos, reposicionamiento de fármacos
Seguros
  • Evaluación de riesgos para la suscripción de hipotecas utilizando texto y datos estructurados sobre propiedades y vecindarios
  • Chatbots de usuario para consultas sobre políticas, riesgos y análisis de hipótesis
  • Automatización del procesamiento de reclamos
Tecnología y manufactura
  • Mantenimiento prescriptivo y diagnósticos para equipos mediante instrucciones guiadas
  • Detección de anomalías en flujos de datos en tiempo real en comparación con estadísticas históricas
  • Análisis automatizado para la producción diaria / análisis de turnos y planificación futura
Medios y entretenimiento
  • Descubrimiento de contenido y recomendaciones en la aplicación, correo electrónico personalizado y marketing digital
  • Localización de contenido
  • Experiencias de juego personalizadas y reseñas de juegos

Servir datos estructurados a aplicaciones RAG

Para demostrar cómo los datos estructurados pueden mejorar la calidad de una aplicación de IA generativa, usamos el siguiente ejemplo de un chatbot de planificación de viajes. El ejemplo muestra cómo las preferencias del usuario (p. ej., "vista al mar" o "apto para familias") se pueden combinar con información no estructurada de hoteles para buscar coincidencias. Normalmente, los precios de los hoteles cambian dinámicamente según la demanda y la estacionalidad. Una calculadora de precios integrada en la aplicación de Gen AI asegura que las recomendaciones se encuentren dentro del presupuesto del usuario. La aplicación de IA generativa que impulsa el bot usa Databricks Vector Search y Databricks Feature and Function Serving como componentes básicos para servir las preferencias personalizadas del usuario, el presupuesto y la información de hoteles mediante la API de agentes de LangChain.

travel-planning-bot

*Bot de planificación de viajes que tiene en cuenta las preferencias y el presupuesto del usuario

Puede encontrar el notebook completo de esta aplicación de RAG Chain como se muestra arriba. Esta aplicación se puede ejecutar localmente dentro del notebook o implementarse como un endpoint accesible mediante una interfaz de usuario de chatbot.

Acceda a sus datos y  funciones como endpoints en tiempo real

Con Feature Engineering in Unity Catalog, ya puede usar cualquier tabla con una clave principal para servir características para el entrenamiento y el servicio. Model Serving de Databricks admite el uso de funciones de Python para calcular características bajo demanda. Los endpoints de características y funciones, creados con la misma tecnología que utiliza internamente Databricks Model Serving, se pueden usar para acceder a cualquier característica precalculada o para calcularlas bajo demanda. Con una sintaxis simple, puede definir una función de especificación de característica en Unity Catalog que puede codificar el grafo acíclico dirigido para computar y servir características como un punto de conexión REST.

Esta función de especificación de características se puede servir en tiempo real como un endpoint de REST. Todos los endpoints están accesibles en la pestaña de navegación izquierda "Serving", incluidos features, funciones, modelos entrenados personalizados y modelos fundacionales. Aprovisione el endpoint con esta API

El endpoint también se puede crear mediante un flujo de trabajo de la UI, como se muestra a continuación.

Endpoint

Ahora se puede acceder a las características en tiempo real consultando el endpoint:

Para servir datos estructurados a aplicaciones de IA en tiempo real, los datos precalculados deben implementarse en bases de datos operativas. Los usuarios ya pueden utilizar almacenes en línea externos como fuente de features precalculadas; por ejemplo, DynamoDB y Cosmos DB se utilizan comúnmente para servir features en Databricks Model Serving. Las Online Tables de Databricks (AWS)(Azure) agregan una nueva funcionalidad que simplifica la sincronización de características precalculadas a un formato de datos optimizado para las búsquedas de datos de baja latencia. Puedes sincronizar cualquier tabla con una clave primaria como una tabla en línea y el sistema configurará una canalización automática para garantizar la actualización de los datos.

Unity Catalog Explorer

Cualquier tabla de Unity Catalog con claves primarias se puede usar para servir características en aplicaciones de Gen AI usando Databricks Online Tables.

Próximos pasos

Use este ejemplo de notebook ilustrado anteriormente para personalizar sus aplicaciones RAG

Inscríbete en un webinar sobre IA generativa de Databricks disponible on-demand.

Feature and Function Serving (AWS)(Azure) está disponible en versión preliminar pública. Consulte la documentación de la API y los ejemplos adicionales.

Las Online Tables de Databricks (AWS)(Azure) están disponibles como versión preliminar pública cerrada (Gated Public Preview). Usa este formulario para registrarte en la capacitación.

Lea el resumen de los anuncios (creación de aplicaciones RAG de alta calidad) realizados a principios de esta semana.

Ruta de aprendizaje para ingenieros de IA generativa: toma cursos a tu propio ritmo, a pedido y dirigidos por un instructor sobre IA generativa

¿Busca resolver casos de uso de IA generativa? ¡Compite en el Hackathon de IA Generativa de Databricks y AWS! Regístrate aquí.

 

¿Tiene un caso de uso que le gustaría compartir con Databricks? Contáctenos en [email protected] 

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.

¿Qué sigue?

image

Data Science e ML

October 31, 2023/9 min de leitura

Anunciando as métricas de LLM-como-juiz do MLflow 2.8 e as Melhores Práticas para Avaliação de LLM de Aplicações RAG, Parte 2

Creating High Quality RAG Applications with Databricks

Anúncios

December 6, 2023/7 min de leitura

Criando aplicativos RAG de alta qualidade com a Databricks