Revenir au contenu principal
Databricks AI Research

Une science de pointe pour un impact réel.

Technologie

A wide technology dbrx card
Technologie

DBRX

Développé par notre équipe chez Databricks et publié en mars 2024, DBRX est un LLM open source et utilisable en contexte commercial. Au moment de sa sortie, il était le meilleur modèle open source du marché. Son architecture MoE (mélange d'experts) sparse le rend très rapide : ces capacités extraordinaires sont concentrées dans 36 milliards de paramètres actifs seulement.

Shutterstock ImageAI, powered by Databricks
Technologie

Shutterstock ImageAI, optimisé par Databricks

Entraîné exclusivement sur le dépôt de Shutterstock, ImageAI crée des images haute résolution reposant sur des données fiables.

Mosaic BERT tech card graphic
Technologie

Mosaic BERT

Avec Mosaic AI, préentraînez intégralement votre propre modèle BERT sur vos données pour 20 $.

A wide tech mpt card
Technologie

MPT

Publiés à l'été 2023, les modèles MPT sont des LLM open source utilisables à des fins commerciales. Cette famille comprend notamment MPT-30B (axé sur la qualité) et MPT-7B (axé sur l'efficacité). Vous pouvez télécharger des versions de ces modèles entraînées par nos soins, ou entraîner vos propres modèles MPT sur vos données à l'aide de Mosaic AI Multi-Cloud Training (MCT).

Mosaic Diffusion tech card graphic
Technologie

Mosaic Diffusion

Conçu avant tout dans un souci d'efficacité, Mosaic Diffusion est un modèle génératif qui transforme les descriptions textuelles en images.

Composer tech card graphic
Technologie

Composer

Composer est une bibliothèque open source d'entraînement pour le deep learning, optimisée dans une optique d'évolutivité et de facilité d'utilisation.

LLM Foundry tech card graphic
Technologie

LLM Foundry

Databricks LLM Foundry est une base de code open source très efficace pour l'entraînement, l'affinement et l'évaluation des LLM.

Performance tech card graphic
Technologie

Performance

Notre suite de deep learning offre une efficacité optimale pour l'entraînement, l'affinement et le déploiement de grands modèles à grande échelle.

Streaming tech card graphic
Technologie

StreamingDataset

StreamingDataset est un DataLoader PyTorch open source qui permet de diffuser facilement et efficacement des datasets d'entraînement.

Evaluation Gauntlet tech card graphic
Technologie

Evaluation Gauntlet

Evaluation Gauntlet est une bibliothèque permettant d'évaluer la qualité des modèles de langage génératifs.

Prêts à devenir une entreprise axée sur les données et l'IA ?

Faites le premier pas de votre transformation data