Mosaic AI
Développez et déployez des applications de ML et d'IA générative de qualité production
Databricks Mosaic AI fournit des outils unifiés pour créer, déployer, évaluer et encadrer les solutions d'IA et de ML, des modèles ML prédictifs aux dernières applications d'IA générative. Reposant sur la Databricks Data Intelligence Platform, Mosaic AI offre aux organisations un moyen économique et sécurisé de développer des applications d'IA de qualité production intégrées à leurs données d'entreprise.
Qualité production
Produisez des applications d'IA précises, sûres et encadrées
Un contrôle total
Restez maître des modèles et des données
Réduisez les coûts
Entraînez vos LLM personnalisés et mettez-les à disposition pour un coût dix fois moins élevé
Commencez à créer votre solution d'IA générative
Quatre modèles d'architecture permettent d'élaborer une solution basée sur un grand modèle de langage(LLM) : l'ingénierie de prompt, la génération augmentée par récupération (RAG), le réglage fin (fine-tuning) et le pré-entraînement. Databricks est le seul fournisseur à prendre en charge les quatre modèles d'architecture d'IA générative. Pour vous, c'est l'assurance d'avoir toutes les options à portée de main et de pouvoir évoluer en fonction des besoins de votre activité.
Un contrôle total sur vos modèles et vos données
Mosaic AI fait partie de la Data Intelligence Platform de Databricks, qui rassemble les données, l'entraînement des modèles et les environnements de production au sein d'une solution unique. Vous pouvez utiliser vos données internes en toute sécurité pour augmenter, ajuster ou développer vos propres modèles de machine learning ou d'IA générative, de façon à les enrichir d'une compréhension sémantique de votre activité, sans que vos données et votre propriété intellectuelle n'aient à quitter vos locaux.
Centralisez le déploiement et la gouvernance de tous vos modèles d'IA
Model Serving est un service unifié pour le déploiement, la gouvernance et l'interrogation des modèles d'IA. Notre approche unifiée facilite l'expérimentation et la mise en production des modèles. Sont concernés :
- Les modèles ML personnalisés tels que PyFunc, scikit-learn et LangChain
- Les modèles de fondation (FM) sur Databricks tels que Llama 3, MPT, Mistral et BGE
- Les modèles de fondation hébergés ailleurs tels que ChatGPT, Claude 3, Cohere et Stable Diffusion
Centralisez la supervision des données, des fonctionnalités et des modèles d'IA
Lakehouse Monitoring fournit une solution de supervision unifiée au sein même de la Data Intelligence Platform de Databricks. Elle surveille les propriétés statistiques et la qualité de toutes les tables en un clic. Dans le cas des applications basées sur l'IA générative, elle peut analyser les sorties pour détecter les contenus toxiques ou dangereux et diagnostiquer les erreurs.
Encadrez et suivez le data lineage sur l'ensemble du cycle de vie de l'IA, depuis les données jusqu'aux modèles
Appliquez des autorisations rigoureuses et des limites de débit. Tracez le data lineage pour respecter les exigences de sécurité et de gouvernance les plus strictes. Tous les assets de ML, des données aux modèles, peuvent être régis à l'aide d'un outil unique : Unity Catalog. Il garantit une supervision cohérente et un contrôle constant à chaque étape du cycle de vie du ML : développement, déploiement et maintenance.
Entraînez vos LLM personnalisés et mettez-les à disposition pour un coût dix fois moins élevé
Avec Mosaic AI, vous pouvez développer votre propre LLM personnalisé à partir de zéro. Vous aurez ainsi l'assurance que les connaissances fondatrices du modèle sont en phase avec votre domaine d'intérêt. Comme vous l'entraînez à l'aide de la propriété intellectuelle et des données de votre organisation, vous obtenez un modèle personnalisé et unique. Databricks Mosaic AI Training est une solution d'entraînement optimisée. Il peut créer en quelques jours de nouveaux LLM possédant plusieurs milliards de paramètres, pour un coût d'entraînement dix fois plus faible.
Les composants du produit
Notebooks collaboratifs
Les notebooks Databricks prennent nativement en charge Python, R, SQL et Scala. Les utilisateurs peuvent ainsi travailler avec les langages et bibliothèques de leur choix pour extraire, visualiser et partager des informations.
Runtime pour le machine learning
Accès en un clic à des clusters ML préconfigurés, optimisés et basés sur une distribution évolutive et fiable des frameworks ML les plus populaires (tels que PyTorch, TensorFlow et scikit-learn), avec des optimisations intégrées pour des performances inégalées dans toute l'entreprise.
Magasin de fonctionnalités
Facilitez la réutilisation des fonctionnalités grâce à une recherche de fonctionnalités basée sur le lignage de données exploitant les sources de données enregistrées automatiquement. Rendez vos fonctionnalités disponibles pour l'apprentissage grâce à un déploiement de modèle simplifié ne nécessitant pas de modification de l'application client.
Référentiels
Repos permet aux ingénieurs de suivre les workflows Git dans Databricks. Ainsi, les équipes data peuvent exploiter les workflows de CI / CD automatisés et la portabilité du code.
Grands modèles de langage
Databricks facilite le déploiement, la gouvernance, l'interrogation et la surveillance de l'accès aux LLM, tout en simplifiant leur intégration à vos workflows. Ses capacités de plateforme permettent d'augmenter par récupération (RAG) ou d'affiner les LLM à partir de vos propres données, pour de meilleures performances de domaine. Nous proposons également des outils optimisés pour pré-entraîner vos LLM en quelques jours seulement, à un coût dix fois inférieur.