Élargissement de la collaboration pour intégrer les GPU NVIDIA, le nouveau CPU Vera et les outils d'IA agentique dans la plateforme Databricks.
par Hanlin Tang et Tejas Sundaresan
La stack complète de l'AI, accélérée
Le calcul accéléré de NVIDIA alimente certaines des charges de travail d'AI les plus exigeantes sur Databricks, de l'entraînement à grande échelle, du fine-tuning et de l'inférence aux solutions d'AI spécifiques à chaque secteur. Aujourd'hui, au Data + AI Summit, nous mettons en lumière la façon dont l'infrastructure d'AI de NVIDIA est au cœur des nouvelles annonces de Databricks AI Runtime, Model Serving et des solutions Industry AI, avec notamment un aperçu de la manière dont le nouveau NVIDIA Vera CPU alimentera la prochaine génération d'infrastructures agentiques.
"Notre partenariat avec NVIDIA couvre l'ensemble du cycle de vie de l'AI. De l'infrastructure accélérée de NVIDIA qui alimente l'entraînement distribué dans AI Runtime aux logiciels exécutés au sein de nos plateformes de serving et de développement. Nous sommes ravis d'associer la technologie de NVIDIA aux capacités de données et de gouvernance de Databricks pour offrir une valeur incroyable à nos clients : une AI d'entreprise rapide, évolutive et bâtie sur des bases de confiance."— Adam Conway, SVP, Produit, Databricks
“Databricks permet aux entreprises de créer, déployer, faire évoluer et gouverner des agents d'AI qui s'appuient sur leur ressource la plus précieuse : les données d'entreprise. Grâce à notre partenariat élargi, NVIDIA et Databricks dynamisent la prochaine vague d'AI d'entreprise en intégrant l'informatique accélérée full-stack de NVIDIA avec les Vera CPUs, les Rubin GPUs, le réseau NVIDIA Quantum InfiniBand et le logiciel NVIDIA Agent Toolkit directement dans la plateforme Databricks.”— Pat Lee, Vice-président, Partenariats stratégiques d'entreprise, NVIDIA
Voici comment Databricks et NVIDIA co-construisent une plateforme d'AI, des GPUs pour l'entraînement et l'inférence aux CPUs conçus sur mesure pour l'ère agentique.
Databricks AI Runtime (AIR) apporte l'accélération des GPUs NVIDIA directement aux équipes chargées des données et de l'AI, afin qu'elles puissent entraîner et fine-tuner des modèles sur des données d'entreprise gouvernées sans avoir à gérer une infrastructure de GPUs distincte. Avec AIR, les clients bénéficient du matériel et du réseau NVIDIA de pointe, directement là où se trouvent leurs données gouvernées sur Databricks :

AI Runtime permet un accès transparent aux GPUs NVIDIA au sein de Databricks.
Databricks Model Serving alimente l'inférence en production pour des milliers de clients Databricks. Au cœur de Model Serving, le matériel et les logiciels NVIDIA offrent l'inférence à grande échelle, à faible latence et à haut débit dont nos clients ont besoin, sur des modèles de pointe comme Qwen, GPT-OSS et les réseaux de neurones personnalisés créés par nos clients. Les capacités de serving supplémentaires incluent le matériel NVIDIA et Triton Inference Server. Model Serving prend en charge les principaux GPUs optimisés pour l'inférence, avec le traitement par lots dynamique avancé de Triton et des performances optimisées à venir. Avec Model Serving, les clients peuvent déployer les modèles qu'ils entraînent sur du matériel NVIDIA directement sur l'infrastructure gérée de Databricks.
L'essor des agents autonomes introduit un nouveau défi d'infrastructure. Alors que les GPUs excelent dans l'inférence de modèles, le harnais d'agent, les appels d'outils, les analyses basées sur les CPUs et la gestion du raisonnement multi-étapes s'exécutent tous sur des CPUs. Les CPUs actuels constituent souvent le goulot d'étranglement : la latence dans l'appel d'outils, la surcharge de communication entre les étapes de l'agent et les performances irrégulières sous charge dégradent l'expérience agentique.
NVIDIA Vera est un CPU de nouvelle génération conçu spécifiquement pour cette charge de travail. Conçu pour trois cas d'usage principaux (les charges de travail agentiques, l'apprentissage par renforcement et l'analyse de données basée sur le CPU), Vera offre :
L'objectif est de proposer une stack complète accélérée par NVIDIA sur Databricks : les modèles s'exécutent sur des GPUs NVIDIA pour l'inférence, tandis que le harnais d'agent et les appels d'outils pourraient s'exécuter sur des CPUs Vera, chaque charge de travail s'exécutant sur un processeur conçu spécifiquement pour ses caractéristiques. Les développeurs personnalisent les modèles sur Databricks à l'aide de données propriétaires, les déploient via Model Serving, et l'infrastructure agentique environnante s'exécute sur un système de calcul conçu dès le départ pour ce modèle précis.
Grâce à Databricks Apps, les équipes peuvent héberger et exécuter NVIDIA Agent Toolkit, la plateforme de développement open source de NVIDIA pour la création, la personnalisation et le déploiement de workflows d'AI agentiques, directement au sein de leur environnement Databricks. Cela vous permet de bénéficier de :
Les GPUs sont puissants, mais obtenir une excellente utilisation, diagnostiquer les problèmes de performance et déboguer les charges de travail nécessitaient traditionnellement une expertise approfondie des systèmes. Nous changeons cela avec une approche axée sur les agents :
Genie Code prend en charge des compétences conçues autour du matériel et des logiciels NVIDIA. Les développeurs peuvent :
Genie Code et les outils de débogage NVIDIA sont également entièrement intégrés à diverses interfaces de produits Databricks, notamment :

Chaque secteur est confronté à des défis de calcul uniques, façonnés par les données qu'il génère et les modèles qu'il construit. Ces défis vont de l'analyse des génomes et de l'accélération de la découverte de médicaments à l'optimisation des chaînes d'approvisionnement, en passant par l'interprétation d'images médicales et la simulation d'usines, de robots et de jumeaux numériques.
Pour aider à résoudre ces problèmes, NVIDIA a massivement investi dans des bibliothèques et des frameworks de calcul accéléré spécifiques à chaque domaine. Nous sommes ravis d'apporter ces capacités directement dans la plateforme Databricks.
Les clients peuvent tirer parti de la pile de calcul accéléré de NVIDIA tout au long de l'expérience Databricks de bout en bout – de l'ingénierie des données et de l'expérimentation au développement de modèles et aux flux de production ; et désormais, les équipes de R&D spécialisées peuvent utiliser les capacités accélérées de NVIDIA sans quitter la plateforme Databricks.
Le partenariat s'étend aux bibliothèques de calcul accéléré et aux frameworks sectoriels de NVIDIA que les clients peuvent utiliser avec Databricks pour des charges de travail d'IA spécifiques à leur secteur :
| Domaine | Intégration NVIDIA | Capacité |
|---|---|---|
| Imagerie médicale | NVIDIA MONAI | Analyse et annotation d'images médicales basées sur l'IA |
| Traitement d'images | NVIDIA nvImageCodec | Encodage/décodage d'images accéléré par le matériel |
| Découverte de médicaments et biologie | NVIDIA BioNeMo | IA générative pour la conception biomoléculaire |
| Modélisation protéique et moléculaire | NVIDIA Proteina-Complexa | Prédiction de la structure des protéines et modélisation des interactions moléculaires |
| Génomique | NVIDIA Parabricks | Pipelines d'analyse génomique accélérés par GPU |
| Analyse unicellulaire | NVIDIA cuML | Analyse unicellulaire accélérée par GPU avec rapids-singlecell (scverse) |
| Optimisation des décisions | NVIDIA cuOpt | Optimisation mathématique accélérée par GPU, y compris la programmation linéaire, la programmation en nombres entiers mixtes, la programmation quadratique et le routage |
| Simulation et robotique | NVIDIA Isaac Sim | Simulation physiquement réaliste pour la robotique |
| Jumeaux numériques et simulation 3D | NVIDIA Omniverse | Création et visualisation de jumeaux numériques industriels |
| Intelligence documentaire | Nemotron Parse | Analyse et extraction de documents de haute précision |
L'infrastructure d'IA de NVIDIA prend en charge les couches critiques de l'IA sur Databricks : les GPU qui alimentent l'entraînement et l'inférence, les CPU Vera qui alimenteront l'orchestration de vos agents et l'analyse des données, l'NVIDIA Agent Toolkit qui permet de créer vos applications agentiques, et les outils de développement qui vous aident à tirer le meilleur parti de chaque cycle de calcul.
Que vous soyez une startup expérimentant votre première charge de travail sur GPU dans la Free Edition, une entreprise pharmaceutique utilisant BioNeMo pour la découverte de médicaments, ou une grande entreprise déployant des modèles de pointe à grande échelle, Databricks et NVIDIA vous offrent ensemble la performance, la simplicité et la gouvernance dont vous avez besoin.
Commencez dès aujourd'hui : essayez les GPU NVIDIA dans la Free Edition de Databricks, déployez NVIDIA Agent Toolkit sur Databricks Apps, ou explorez notre API Foundation Model alimentée par le calcul accéléré de NVIDIA.
(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original
Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.