Ir al contenido principal
Databricks AI Research

Ciencia de vanguardia, impacto en el mundo real.

Blog de investigación

Ver todas las entradas del blog

Tecnología

A wide technology dbrx card
Tecnología

DBRX

DBRX es un LLM de código abierto y uso comercial, desarrollado por nuestro equipo en Databricks y lanzado en marzo de 2024. Al momento de su lanzamiento, se posicionó como el modelo de código abierto de mayor calidad disponible. Gracias a su arquitectura de mezcla de expertos dispersa, también es rápido, ya que integra estas capacidades extraordinarias en solo 36 000 millones de parámetros activos.

Shutterstock ImageAI, powered by Databricks
TECNOLOGÍA

Shutterstock ImageAI, impulsado por Databricks

ImageAI está entrenado exclusivamente en el repositorio de Shutterstock para crear imágenes de alta resolución basadas en datos confiables.

Mosaic BERT tech card graphic
Tecnología

Mosaic BERT

Preentrena tu propio modelo BERT con tus propios datos desde cero usando Mosaic AI por tan solo $20.

A wide tech mpt card
Tecnología

MPT

Los modelos MPT son una familia de LLM de código abierto y uso comercial que se lanzaron en el verano de 2023. Incluyen el MPT-30B (que prioriza la calidad) y el MPT-7B (que prioriza la eficiencia). Puedes descargar versiones de estos modelos ya entrenados por nosotros o entrenar tus propios modelos MPT con tus datos utilizando el producto Mosaic AI Multi-Cloud Training (MCT).

Mosaic Diffusion tech card graphic
Tecnología

Mosaic Diffusion

Mosaic Diffusion es un modelo generativo que convierte descripciones de texto en imágenes, diseñado para ser altamente eficiente.

Composer tech card graphic
Tecnología

Compositor

Composer es una biblioteca de entrenamiento de aprendizaje profundo de código abierto optimizada para escalabilidad y usabilidad.

LLM Foundry tech card graphic
Tecnología

LLM Foundry

Databricks LLM Foundry es una base de código de código abierto altamente eficiente para entrenar, ajustar y evaluar LLM.

Performance tech card graphic
Tecnología

Rendimiento

Nuestro stack de aprendizaje profundo es el más eficiente para entrenar, ajustar y desplegar modelos grandes a escala.

Streaming tech card graphic
Tecnología

Conjunto de datos de transmisión

StreamingDataset es un DataLoader de código abierto de PyTorch que hace que sea fácil y eficiente transmitir conjuntos de datos de entrenamiento.

Evaluation Gauntlet tech card graphic
Tecnología

Desafío de evaluación

Evaluation Gauntlet es una biblioteca para evaluar la calidad de los modelos de lenguaje generativos.

¿Estás listo para convertirte en una empresa de datos + IA?

Da los primeros pasos en tu transformación de datos