Au cours de la dernière année, nous avons constaté une explosion de modèles fondamentaux commerciaux et open-source démontrant de solides capacités de raisonnement sur des tâches de connaissances générales. Bien que les modèles généraux constituent un élément essentiel, les applications d'IA en production utilisent souvent des systèmes d'IA composites, qui exploitent plusieurs composants tels que des modèles affinés, la récupération d'informations, l'utilisation d'outils et des agents de raisonnement. Ces systèmes d'agents IA augmentent les modèles fondamentaux pour offrir une bien meilleure qualité et aider les clients à déployer en toute confiance ces applications GenAI en production.
Aujourd'hui, lors du Data and AI Summit, nous avons annoncé plusieurs nouvelles fonctionnalités qui font de Databricks Mosaic AI la meilleure plateforme pour construire des systèmes d'agents IA de qualité production. Ces fonctionnalités sont basées sur notre expérience de travail avec des milliers d'entreprises pour mettre en production des applications basées sur l'IA. Les annonces d'aujourd'hui incluent la prise en charge du réglage fin des modèles fondamentaux, un catalogue d'entreprise pour les outils d'IA, un nouveau SDK pour construire, déployer et évaluer des agents IA, et une passerelle IA unifiée pour gouverner les services IA déployés.
Avec cette annonce, Databricks a entièrement intégré et considérablement élargi les capacités de création de modèles initialement incluses dans notre acquisition de MosaicML il y a un an.

L'évaluation des modèles d'IA monolithiques en systèmes composites est un domaine de recherche actif, tant académique qu'industriel. Des résultats récents ont montré que « les résultats d'IA de pointe sont de plus en plus obtenus par des systèmes composites avec plusieurs composants, et pas seulement par des modèles monolithiques ». Ces conclusions sont renforcées par ce que nous observons chez notre clientèle. Prenons par exemple la société de recherche financière FactSet : lorsqu'elle a déployé un LLM commercial pour son cas d'utilisation Text-to-Financial-Formula, elle n'a pu obtenir que 55 % de précision dans la formule générée. Cependant, la modularisation de son modèle en un système composite lui a permis de spécialiser chaque tâche et d'atteindre 85 % de précision. Databricks Mosaic AI prend en charge la construction de systèmes d'IA grâce aux produits suivants :

Les utilisateurs n'ont qu'à sélectionner une tâche et un modèle de base, et à fournir des données d'entraînement (sous forme de table Delta ou de fichier .jsonl) pour obtenir un modèle entièrement affiné qu'ils possèdent pour leur tâche spécialisée

Databricks Model Serving prend désormais en charge le function-calling et les utilisateurs peuvent rapidement expérimenter avec des fonctions et des modèles de base dans l'AI Playground
Les modèles d'IA à usage général sont optimisés pour des benchmarks tels que MMLU, mais les systèmes d'IA déployés sont conçus pour résoudre des tâches utilisateur spécifiques dans le cadre d'un produit plus large (par exemple, répondre à un ticket de support, générer une requête ou suggérer une réponse). Pour s'assurer que ces systèmes fonctionnent bien, il est important de disposer d'un cadre d'évaluation robuste pour définir les métriques de qualité, collecter les signaux de qualité et itérer sur les performances. Aujourd'hui, nous sommes ravis d'annoncer plusieurs nouveaux outils d'évaluation :

Databricks MLflow fournit des métriques assistées par IA pour aider les développeurs à former des intuitions rapides

Databricks MLflow permet aux parties prenantes, même celles extérieures à la plateforme Databricks, d'évaluer les sorties des modèles et de fournir des notes pour aider à itérer sur la qualité
Corning est une entreprise de science des matériaux - nos technologies de verre et de céramique sont utilisées dans de nombreuses applications industrielles et scientifiques, il est donc essentiel de comprendre et d'agir sur nos données. Nous avons construit un assistant de recherche IA en utilisant Databricks Mosaic AI Agent Framework pour indexer des centaines de milliers de documents, y compris des données de l'office des brevets américain. Il était extrêmement important pour nous que notre assistant basé sur LLM réponde aux questions avec une grande précision - de cette façon, nos chercheurs pourraient trouver et faire progresser les tâches sur lesquelles ils travaillaient. Pour mettre cela en œuvre, nous avons utilisé Databricks Mosaic AI Agent Framework pour construire une solution Hi Hello Generative AI augmentée avec les données du bureau des brevets américain. En tirant parti de la plateforme Databricks Data Intelligence, nous avons considérablement amélioré la vitesse de récupération, la qualité des réponses et la précision. — Denis Kamotsky, ingénieur logiciel principal, Corning
Face à l'explosion des modèles fondamentaux de pointe, nous avons vu notre clientèle adopter rapidement de nouveaux modèles : DBRX a compté un millier de clients qui l'expérimentaient dans les deux semaines suivant son lancement, et nous voyons plusieurs centaines de clients expérimenter avec les modèles Llama3 récemment publiés. De nombreuses entreprises ont du mal à prendre en charge ces nouveaux modèles sur leur plateforme dans un délai raisonnable, et les changements dans les structures de prompts et les interfaces de requête les rendent difficiles à implémenter. De plus, lorsque les entreprises ouvrent l'accès aux modèles les plus récents et les plus performants, les gens s'enthousiasment et créent beaucoup de choses, ce qui peut rapidement dégénérer en un fouillis de problèmes de gouvernance. Les problèmes de gouvernance courants incluent l'atteinte des limites de débit qui impactent les applications de production, l'explosion des coûts lorsque les gens exécutent des modèles GenAI sur de grandes tables, et les préoccupations relatives aux fuites de données lorsque des PII sont envoyées à des fournisseurs de modèles tiers. Aujourd'hui, nous sommes ravis d'annoncer de nouvelles fonctionnalités dans AI Gateway pour la gouvernance et un catalogue de modèles organisé pour faciliter la découverte de modèles. Les fonctionnalités incluses sont :
Databricks Model Serving accélère nos projets axés sur l'IA en facilitant l'accès sécurisé et la gestion de plusieurs modèles SaaS et ouverts, y compris ceux hébergés sur ou en dehors de Databricks. Son approche centralisée simplifie la gestion de la sécurité et des coûts, permettant à nos équipes de données de se concentrer davantage sur l'innovation et moins sur la surcharge administrative. — Greg Rokita, AVP, Technology chez Edmunds.com
Databricks Mosaic AI permet aux équipes de construire et de collaborer sur des systèmes d'IA composés à partir d'une plateforme unique avec une gouvernance centralisée et une interface unifiée pour entraîner, suivre, évaluer, échanger et déployer. En tirant parti des données d'entreprise, les organisations peuvent passer de la connaissance générale à l'intelligence des données. Cette évolution permet aux organisations d'obtenir des informations plus pertinentes plus rapidement.
Nous sommes impatients de voir les innovations que nos clients construiront ensuite !
(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original
