Ampliamento della collaborazione per portare le GPU NVIDIA, la nuova CPU Vera e gli strumenti di AI agentica nella piattaforma Databricks.
L'intero stack dell'AI, accelerato
Il calcolo accelerato di NVIDIA alimenta alcuni dei carichi di lavoro di AI più impegnativi su Databricks, dall'addestramento su larga scala, al fine-tuning e all'inferenza, fino alle soluzioni di AI specifiche per il settore. Oggi al Data + AI Summit, evidenziamo come l'infrastruttura AI di NVIDIA sia al centro dei nuovi annunci di Databricks AI Runtime, Model Serving e delle soluzioni Industry AI, incluso uno sguardo a come la nuova NVIDIA Vera CPU alimenterà la prossima generazione di infrastrutture agentiche.
"La nostra partnership con NVIDIA copre l'intero ciclo di vita dell'AI. Dall'infrastruttura accelerata NVIDIA che alimenta l'addestramento distribuito in AI Runtime al software in esecuzione all'interno delle nostre piattaforme di serving e di sviluppo. Siamo entusiasti di combinare la tecnologia NVIDIA con le funzionalità di dati e governance di Databricks per sbloccare un valore incredibile per i nostri clienti: un'AI aziendale rapida, scalabile e costruita su fondamenta di cui potersi fidare."— Adam Conway, SVP, Product, Databricks
“Databricks consente alle aziende di creare, distribuire, scalare e governare agenti AI informati dalla loro risorsa più preziosa: i dati aziendali. Attraverso la nostra partnership ampliata, NVIDIA e Databricks stanno potenziando la prossima ondata di AI aziendale integrando nella piattaforma Databricks il calcolo accelerato NVIDIA full-stack con CPU Vera, GPU Rubin, rete NVIDIA Quantum InfiniBand e il software NVIDIA Agent Toolkit.”— Pat Lee, Vice President, Enterprise Strategic Partnerships, NVIDIA
Ecco come Databricks e NVIDIA stanno costruendo insieme una piattaforma AI, dalle GPU per l'addestramento e l'inferenza, alle CPU create appositamente per l'era agentica.
Databricks AI Runtime (AIR) porta l'accelerazione delle GPU NVIDIA direttamente ai team di dati e AI, consentendo loro di addestrare ed eseguire il fine-tuning di modelli su dati aziendali governati senza dover gestire un'infrastruttura GPU separata. Con AIR, i clienti ottengono l'hardware e la rete NVIDIA avanzati direttamente dove si trovano i loro dati governati su Databricks:

AI Runtime consente un accesso continuo alle GPU NVIDIA all'interno di Databricks.
Databricks Model Serving alimenta l'inferenza in produzione per migliaia di clienti Databricks. Al centro di Model Serving, l'hardware e il software NVIDIA offrono l'inferenza a bassa latenza e ad alto throughput su scala di cui i nostri clienti hanno bisogno, su modelli di frontiera come Qwen, GPT-OSS e reti neurali personalizzate create dai nostri clienti. Altre funzionalità di serving includono l'hardware NVIDIA e Triton Inference Server. Model Serving supporta le principali GPU ottimizzate per l'inferenza, con il batching dinamico avanzato di Triton e prestazioni ottimizzate in arrivo. Con Model Serving, i clienti possono distribuire i modelli che addestrano su hardware NVIDIA direttamente sull'infrastruttura Databricks gestita.
L'ascesa degli agenti autonomi introduce una nuova sfida infrastrutturale. Sebbene le GPU eccellano nell'inferenza dei modelli, l'harness dell'agente, le chiamate agli strumenti, l'analisi basata su CPU e la gestione del ragionamento multi-step vengono eseguiti tutti su CPU. Le CPU odierne rappresentano spesso il collo di bottiglia: la latenza nelle chiamate agli strumenti, il sovraccarico di comunicazione tra i passaggi dell'agente e le prestazioni incoerenti sotto carico degradano l'esperienza agentica.
NVIDIA Vera è una CPU di nuova generazione progettata specificamente per questo carico di lavoro. Progettata per tre casi d'uso principali (carichi di lavoro agentici, apprendimento per rinforzo e analisi dei dati basata su CPU), Vera offre:
La visione è uno stack end-to-end accelerato da NVIDIA su Databricks: i modelli vengono eseguiti su GPU NVIDIA per l'inferenza, mentre l'harness dell'agente e le chiamate agli strumenti potrebbero essere eseguiti su CPU Vera, con ciascun carico di lavoro su silicio creato appositamente per le sue caratteristiche. Gli sviluppatori personalizzano i modelli su Databricks utilizzando dati proprietari, li distribuiscono tramite Model Serving e l'infrastruttura agentica circostante viene eseguita su un calcolo progettato da zero per quel pattern esatto.
Costruito su Databricks Apps, i team possono ospitare ed eseguire NVIDIA Agent Toolkit, la piattaforma di sviluppo open source di NVIDIA per la creazione, la personalizzazione e la distribuzione di flussi di lavoro AI agentici, direttamente all'interno del proprio ambiente Databricks. Questo significa che otterrai:
Le GPU sono potenti, ma ottenere un'ottima percentuale di utilizzo, diagnosticare problemi di prestazioni ed eseguire il debug dei carichi di lavoro ha tradizionalmente richiesto una profonda esperienza nei sistemi. Stiamo cambiando questo approccio con una strategia orientata prima di tutto agli agenti (agent-first):
Genie Code supporta skill progettate attorno all'hardware e al software NVIDIA. Gli sviluppatori possono:
Genie Code e gli strumenti di debug NVIDIA sono inoltre completamente integrati con varie aree di prodotto Databricks, tra cui:

Ogni settore affronta sfide computazionali uniche, modellate dai dati che genera e dai modelli che costruisce. Queste sfide spaziano dall'analisi dei genomi e dall'accelerazione della scoperta di farmaci all'ottimizzazione delle catene di fornitura, all'interpretazione delle immagini mediche e alla simulazione di fabbriche, robot e gemelli digitali.
Per aiutare a risolvere questi problemi, NVIDIA ha investito molto in librerie e framework di calcolo accelerato specifici per il dominio. Siamo entusiasti di portare queste funzionalità direttamente nella piattaforma Databricks.
I clienti possono sfruttare lo stack di calcolo accelerato di NVIDIA nell'intera esperienza end-to-end di Databricks – dall'ingegneria dei dati e la sperimentazione fino allo sviluppo dei modelli e ai workflow di produzione; e ora i team di R&D specifici di dominio possono utilizzare le funzionalità accelerate di NVIDIA senza lasciare la piattaforma Databricks.
La partnership si estende alle librerie di calcolo accelerato e ai framework di dominio di NVIDIA che i clienti possono utilizzare con Databricks per i carichi di lavoro di AI specifici del settore:
| Dominio | Integrazione NVIDIA | Funzionalità |
|---|---|---|
| Imaging medico | NVIDIA MONAI | Analisi e annotazione di immagini mediche basate su AI |
| Elaborazione delle immagini | NVIDIA nvImageCodec | Codifica/decodifica delle immagini accelerata via hardware |
| Scoperta di farmaci & biologia | NVIDIA BioNeMo | AI generativa per la progettazione biomolecolare |
| Modellazione proteica & molecolare | NVIDIA Proteina-Complexa | Predizione della struttura delle proteine e modellazione delle interazioni molecolari |
| Genomica | NVIDIA Parabricks | Pipeline di analisi genomica accelerate da GPU |
| Singola cellula | NVIDIA cuML | Analisi a singola cellula accelerata da GPU con rapids-singlecell (scverse) |
| Ottimizzazione delle decisioni | NVIDIA cuOpt | Ottimizzazione matematica accelerata da GPU, inclusi programmazione lineare, programmazione lineare a numeri interi misti, programmazione quadratica e routing |
| Simulazione & robotica | NVIDIA Isaac Sim | Simulazione fisicamente accurata per la robotica |
| Digital twin & simulazione 3D | NVIDIA Omniverse | Creazione e visualizzazione di digital twin industriali |
| Document Intelligence | Nemotron Parse | Parsing ed estrazione di documenti ad alta precisione |
L'infrastruttura AI di NVIDIA supporta livelli critici di AI su Databricks: le GPU che alimentano l'addestramento e l'inferenza, le CPU Vera che alimenteranno l'orchestrazione dei tuoi agenti e l'analisi dei dati, l'NVIDIA Agent Toolkit che abilita le tue applicazioni agentiche e gli strumenti di sviluppo che ti aiutano a ottenere il massimo da ogni ciclo di calcolo.
Che tu sia una startup che sperimenta il suo primo carico di lavoro GPU nella Free Edition, un'azienda farmaceutica che esegue BioNeMo per la scoperta di farmaci o un'impresa che distribuisce modelli di frontiera su scala, Databricks e NVIDIA offrono insieme le prestazioni, la semplicità e la governance di cui hai bisogno.
Inizia oggi stesso: prova le GPU NVIDIA nella Free Edition di Databricks, distribuisci NVIDIA Agent Toolkit su Databricks Apps o esplora la nostra API Foundation Model basata sul calcolo accelerato di NVIDIA.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.