Scopri, valuta, installa, condividi e distribuisci modelli AI all'interno della tua organizzazione o tra cloud, piattaforme e regioni
di Tianyi Huang, Darshana Sivakumar, Akram Chetibi, Harish Gaur, Tao Tao, Bemnet Merha e Prasad Kona
Delta Sharing si è evoluto in OpenSharing, il primo protocollo aperto e neutrale rispetto ai vendor per condividere in modo sicuro gli asset AI, tra cui competenze degli agenti, modelli AI e dati non strutturati. Leggi l'annuncio.
Siamo lieti di annunciare la disponibilità generale (General Availability) della condivisione dei modelli AI all'interno di Delta Sharing di Databricks e del Databricks Marketplace. Questo traguardo segue l' annuncio della Public Preview a gennaio 2024. Dal lancio della Public Preview, abbiamo collaborato con nuovi clienti e provider di condivisione di modelli AI come Bitext, AI21 Labs e Ripple per semplificare ulteriormente la condivisione dei modelli AI.
Puoi condividere e distribuire facilmente i modelli AI in modo sicuro utilizzando Delta Sharing. La condivisione può avvenire all'interno della tua organizzazione o all'esterno, tra diversi cloud, piattaforme e regioni. Inoltre, Databricks Marketplace ora offre oltre 75 modelli AI, inclusi nuovi modelli AI specifici per il settore di John Snow Labs, OLA Krutrim e Bitext, oltre a modelli foundation come Databricks DBRX, Llama 3, AI21 Labs, Mistral e molti altri. In questo blog esamineremo l'esigenza aziendale di condividere i modelli AI ed esploreremo nel dettaglio i casi d'uso basati sul modello foundation Jamba 1.5 Mini di AI21 e sui modelli Bitext.
Inoltre, i modelli AI sono ora immediatamente disponibili pronti all'uso su Unity Catalog, semplificando il processo di accesso e distribuzione dei modelli in modo efficiente. Questo sviluppo non solo semplifica l'esperienza utente, ma migliora anche l'accessibilità dei modelli AI, supportando un'integrazione e una distribuzione fluide su varie piattaforme e regioni.
Ecco i 3 vantaggi della condivisione dei modelli AI con Databricks riscontrati con i primi utilizzatori e i partner di lancio
La condivisione dei modelli AI è supportata da Delta Sharing. I provider possono condividere i modelli AI con i clienti direttamente tramite Delta Sharing o inserendoli nel Databricks Marketplace, che utilizza a sua volta Delta Sharing.
Delta Sharing semplifica l'uso dei modelli AI ovunque ne avrai bisogno. Puoi addestrare i modelli ovunque e poi utilizzarli ovunque senza doverli spostare manualmente. I pesi del modello (ovvero i parametri che il modello AI ha appreso durante l'addestramento) verranno inseriti automaticamente nell'endpoint di distribuzione (ovvero il luogo in cui il modello "risiede"). Ciò elimina la necessità di complessi spostamenti di modelli dopo ogni addestramento o fine-tuning, garantendo un'unica fonte di verità e semplificando il processo di distribuzione. Ad esempio, i clienti possono addestrare i modelli nel cloud e nella regione che offrono l'infrastruttura di addestramento più conveniente, per poi distribuire il modello in un'altra regione più vicina agli utenti finali, riducendo al minimo la latenza di inferenza (ovvero il tempo impiegato da un modello AI per elaborare i dati e fornire risultati).
Il Databricks Marketplace, supportato da Delta Sharing, ti consente di trovare e utilizzare facilmente oltre 75 modelli AI. Puoi configurare questi modelli come se fossero sul tuo sistema locale e Delta Sharing li aggiornerà automaticamente durante la distribuzione o gli upgrade. Puoi anche personalizzare i modelli con i tuoi dati per attività come la gestione di una knowledge base. Come provider, ti basta una sola copia del tuo modello per condividerla con tutti i tuoi clienti Databricks.
Dall'annuncio della Public Preview della condivisione dei modelli AI a gennaio 2024, abbiamo collaborato con diversi clienti e partner per garantire che la condivisione dei modelli AI offra un risparmio significativo sui costi per le organizzazioni
"Utilizziamo modelli di apprendimento per rinforzo (RL) in alcuni dei nostri prodotti. Rispetto ai modelli di apprendimento supervisionato, i modelli RL presentano tempi di addestramento più lunghi e molte fonti di casualità nel processo di addestramento. Questi modelli RL devono essere distribuiti in 3 workspace in regioni AWS separate. Con la condivisione dei modelli possiamo avere un unico modello RL disponibile in più workspace senza doverlo addestrare nuovamente o senza dover eseguire complessi passaggi manuali per spostarlo." — Mihir Mavalankar, Machine Learning Engineer, Ripple
AI21 Labs, leader nell'AI generativa e nei modelli linguistici di grandi dimensioni, ha pubblicato Jamba 1.5 Mini, parte della famiglia di modelli Jamba 1.5, sul Databricks Marketplace. Jamba 1.5 Mini di AI21 Labs introduce un approccio innovativo ai modelli linguistici AI per l'uso aziendale. La sua innovativa architettura ibrida Mamba-Transformer consente una finestra di contesto effettiva di 256K token, insieme a velocità e qualità eccezionali. Grazie all'ottimizzazione di Mini per un uso efficiente delle risorse di calcolo, può gestire lunghezze di contesto fino a 140K token su una singola GPU.
"AI21 Labs è lieta di annunciare che Jamba 1.5 Mini è ora disponibile sul Databricks Marketplace. Con Delta Sharing, le aziende possono accedere alla nostra architettura Mamba-Transformer, dotata di una finestra di contesto da 256K, garantendo velocità e qualità eccezionali per soluzioni AI trasformative"— Pankaj Dugar, SVP & GM, AI21 Labs
Una finestra di contesto effettiva di 256K token nei modelli AI si riferisce alla capacità del modello di elaborare e considerare 256.000 token di testo contemporaneamente. Questo è importante perché consente al modello di AI21 di gestire set di dati ampi e complessi, rendendolo particolarmente utile per attività che richiedono la comprensione e l'analisi di informazioni estese, come documenti lunghi o flussi di lavoro complessi e ricchi di dati, e migliorando la fase di recupero (retrieval) di qualsiasi flusso di lavoro basato su RAG. L'architettura ibrida di Jamba garantisce che la qualità del modello non si degradi all'aumentare del contesto, a differenza di quanto si osserva solitamente con le finestre di contesto dichiarate degli LLM basati su Transformer.

Guarda questo video tutorial che mostra come ottenere il modello AI21 Jamba 1.5 Mini dal Databricks Marketplace, eseguirne il fine-tuning e distribuirlo
La finestra di contesto da 256k di Jamba 1.5 Mini consente ai modelli di gestire in modo efficiente l'equivalente di 800 pagine di testo in un singolo prompt. Ecco alcuni esempi di come i clienti Databricks in diversi settori possono utilizzare questi modelli
Bitext offre modelli verticalizzati pre-addestrati sul Databricks Marketplace. Questi modelli sono versioni del modello Mistral-7B-Instruct-v0.2 ottimizzate tramite fine-tuning per la creazione di chatbot, assistenti virtuali e copilot per il settore del Retail Banking, offrendo ai clienti risposte rapide e precise sulle loro esigenze bancarie. Questi modelli possono essere prodotti per qualsiasi famiglia di foundation model: GPT, Llama, Mistral, Jamba, OpenELM…
Un'importante App di social trading registrava tassi di abbandono elevati durante l'onboarding degli utenti. Ha sfruttato i modelli bancari verticalizzati pre-addestrati di Bitext per rinnovare il processo di onboarding, trasformando i moduli statici in un'esperienza utente conversazionale, intuitiva e personalizzata.
Bitext ha condiviso il modello AI verticalizzato con il cliente. Utilizzando quel modello come base, un data scientist ha eseguito il fine-tuning iniziale con dati specifici del cliente, come le FAQ più comuni. Questo passaggio ha garantito che il modello comprendesse i requisiti unici e il linguaggio della base di utenti. A questo è seguito un fine-tuning avanzato con Databricks.
Una volta eseguito il fine-tuning del modello Bitext, questo è stato distribuito utilizzando Databricks AI Model Serving.
La collaborazione ha definito un nuovo standard nell'interazione con gli utenti all'interno del settore della finanza social, migliorando significativamente il coinvolgimento e la retention dei clienti. Grazie all'avvio rapido offerto dal modello AI condiviso, l'intera implementazione è stata completata in sole 2 settimane.
Dai un'occhiata alla demo che mostra come installare ed eseguire il fine-tuning del modello AI verticalizzato di Bitext dal Databricks Marketplace qui
"A differenza dei modelli generici che richiedono una grande quantità di dati di addestramento, iniziare con un modello specializzato per un settore specifico riduce i dati necessari per personalizzarlo. Questo aiuta i clienti a distribuire rapidamente modelli AI su misura. Siamo entusiasti di AI Model Sharing. I nostri clienti hanno riscontrato una riduzione fino al 60% dei costi delle risorse (meno data scientist e requisiti computazionali inferiori) e un risparmio fino al 50% sulle interruzioni operative (test e distribuzione più rapidi) grazie ai nostri modelli AI specializzati disponibili sul Databricks Marketplace." — Antonio S. Valderrábanos , Fondatore e CEO, Bitext
| Componenti di costo | Approccio LLM generico | Modello verticalizzato di Bitext su Databricks Marketplace | Risparmio sui costi (%) |
| Verticalizzazione | Alto - Fine-tuning esteso per settore & caso d'uso | Basso - Inizio con LLM verticale pre-ottimizzato | 60% |
| Personalizzazione con i dati aziendali | Medio - È richiesto un ulteriore fine-tuning | Basso - È necessaria una personalizzazione specifica | 30% |
| Tempo totale di addestramento | 3-6 mesi | 1-2 mesi | Riduzione del 50-60% |
| Allocazione delle risorse | Alto - Più data scientist e potenza computazionale | Basso - Meno intensivo | 40-50% |
| Interruzione operativa | Alto - Fasi di integrazione e test più lunghe | Basso - Distribuzione più rapida | 50% |
Ora che la condivisione dei modelli AI è generalmente disponibile (GA) sia per Delta Sharing che per i nuovi modelli AI sul Databricks Marketplace, ti invitiamo a:
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.