Skip to main content

Modelos de lenguaje grande

Acelera la innovación con IA generativa y modelos de lenguaje grandes con Databricks

¿Qué son los modelos de lenguaje grande?

Los modelos de lenguaje grande (LLM) son modelos de aprendizaje automático muy eficaces para realizar tareas relacionadas con el lenguaje, como la traducción, la respuesta a preguntas, el chat y el resumen de contenido, así como la generación de contenido y código. Los LLM extraen valor de enormes conjuntos de datos y hacen que ese "aprendizaje" sea accesible de forma inmediata. Databricks facilita el acceso a estos LLM para integrarlos en los flujos de trabajo y las capacidades de la plataforma para aumentar, perfeccionar y preentrenar tus propios LLM utilizando tus propios datos para un mejor rendimiento en el dominio.

S&P Global image

Procesamiento de lenguaje natural con LLM

S&P Global utiliza modelos de lenguaje grande en Databricks para comprender mejor las diferencias y similitudes clave en las presentaciones de las empresas, lo que ayuda a los gestores de activos a construir una cartera más diversa.

Using LLM image

Aprovecha los LLM para una variedad de casos de uso

Los LLM pueden tener impacto comercial en diversos casos de uso e industrias: traducir texto a otros idiomas, mejorar la experiencia del cliente con chatbots y asistentes de IA, organizar y clasificar los comentarios de los clientes para los departamentos adecuados, resumir documentos extensos, como conferencias sobre resultados y documentos legales, crear nuevo contenido de marketing y generar código de software a partir del lenguaje natural. Incluso se pueden utilizar para alimentar otros modelos, como aquellos que generan arte. Algunos LLM populares son la familia de modelos GPT (como ChatGPT), BERT, Llama, MPT y Anthropic.

llama

Usa IA generativa y modelos de lenguaje grande

Databricks te permite iniciar con un modelo de lenguaje grande existente como Llama 2, MPT, BGE, OpenAI o Anthropic y aumentarlo o perfeccionarlo con tus datos empresariales, o crear tu propio LLM personalizado desde cero mediante el preentrenamiento. Cualquier LLM existente se puede implementar, gobernar, consultar y monitorear. Facilitamos la extensión de estos modelos utilizando técnicas como la generación aumentada por recuperación (RAG), el perfeccionamiento con eficiencia de parámetros (PEFT) o el perfeccionamiento estándar.

fine tuning

Perfecciona los LLM utilizando tus datos

Personaliza un modelo con tus datos para una tarea específica. Con el soporte de herramientas de código abierto, como Hugging Face y DeepSpeed, puedes tomar rápidamente un LLM de base y comenzar a entrenarlo con tus propios datos para lograr más precisión en tu dominio y carga de trabajo. Esto también te da control para gestionar los datos utilizados para el entrenamiento, asegurándote de usar la IA de manera responsable.

pretrain custom llm

Preentrena tu propio LLM personalizado

Crea tu propio modelo de LLM desde cero con el preentrenamiento de Mosaic AI para asegurar que el conocimiento fundamental del modelo esté adaptado a tu dominio específico. El resultado es un modelo personalizado que se diferencia de manera única y se entrena con los datos únicos de tu organización. Mosaic AI Pre-training es una solución de entrenamiento optimizada que puede crear nuevos LLM con muchos millones de parámetros en días, con costos de entrenamiento hasta 10 veces más bajos.

Built-in LLMOps graphic image

LLMOps (MLOps para LLM) incorporadas

Usa MLOps integradas y listas para la producción con una instancia administrada de MLflow para el seguimiento, la gestión y la implementación de modelos. Una vez implementado el modelo, puedes monitorear aspectos como la latencia, la deriva de datos y más con la capacidad de activar canalizaciones de reentrenamiento, todo en la misma Databricks Data Intelligence Platform unificada para LLMOps de extremo a extremo.

data-centric platform graphic image

Datos y modelos en una plataforma unificada

La mayoría de los modelos se entrenarán más de una vez, por lo que tener los datos de entrenamiento en la misma plataforma de ML será crucial tanto para el rendimiento como para el costo. El entrenamiento de LLM en Databricks Data Intelligence Platform te brinda acceso a herramientas y capacidad de cálculo de primera clase (dentro de un lago de datos extremadamente rentable) y te permite continuar reentrenando los modelos a medida que tus datos evolucionan con el tiempo.

¿Listo para empezar?