Oggi siamo entusiasti di annunciare che abbiamo completato l'acquisizione di MosaicAI, una piattaforma leader per la creazione e la personalizzazione di modelli di intelligenza artificiale generativa per la tua azienda. Fin dalla fondazione di Databricks, la nostra missione è stata quella di democratizzare i dati e l'IA per ogni azienda. L'IA generativa alimenterà la prossima ondata di applicazioni dati aziendali e, insieme a MosaicAI, intendiamo fornire l'esperienza migliore della categoria per l'addestramento, la personalizzazione e la distribuzione di applicazioni di IA generativa.
Lavoreremo insieme al team di MosaicAI per accelerare quelli che consideriamo i tre sviluppi più importanti richiesti per portare l'IA generativa nel mainstream per le aziende:
Democratizzazione rapida delle capacità dei modelli. Crediamo in un futuro in cui i modelli siano ampiamente disponibili per ogni azienda. La democratizzazione di qualsiasi tecnologia richiede prezzi ridotti e maggiore accesso. Il team di MosaicAI si è concentrato intensamente sui miglioramenti dell'efficienza hardware e software per ridurre drasticamente il prezzo dell'addestramento e della personalizzazione di modelli linguistici di grandi dimensioni. Continueremo a lavorare insieme per ridurre i costi di addestramento e di servizio al fine di fornire capacità di modellazione di alta qualità a una porzione sempre maggiore del mercato. La democratizzazione richiede anche l'accesso alle tecniche. Lavoreremo con il team di ricerca di MosaicAI per continuare a innovare, in modo aperto, sulle architetture di modellazione come quelle che hanno alimentato i popolari LLM di base MPT-7B e MPT-30B. Ad oggi, MPT-7B è stato scaricato oltre 3 milioni di volte, rendendolo l'LLM open più scaricato di sempre.
Far funzionare i modelli di IA generativa per le aziende. Ci siamo tutti familiarizzati con i chatbot di uso generale. Come i chatbot consumer, anche le applicazioni di IA aziendali beneficiano di capacità di ragionamento e interfacce basate sul linguaggio. Ma a differenza dei chatbot generali, le applicazioni aziendali hanno molti requisiti aggiuntivi. Devono incorporare grandi volumi di dati personalizzati: informazioni sui processi aziendali, clienti, account, ordini o altri aspetti del loro business. Devono garantire la privacy e la sicurezza dei loro utenti e dei loro dati. Le applicazioni aziendali hanno anche poca tolleranza per le allucinazioni o le risposte errate. Databricks e MosaicAI insieme renderanno molto più facile per le aziende incorporare i propri dati per distribuire applicazioni di IA sicure, protette ed efficaci.
Unificare lo stack di IA e dati. Ogni parte del ciclo di vita dello sviluppo del modello richiede buoni dati. Le aziende si differenzieranno dai concorrenti utilizzando dati proprietari che consentono loro di creare modelli migliori e applicazioni più intelligenti. Con MosaicAI, Databricks continuerà a mettere i dati al centro del percorso dell'IA. Ciò include la preparazione dei dati upstream come la pulizia, la featurizzazione e l'embedding dei dati per l'uso nei modelli. Include anche l'utilizzo dei dati per migliorare i modelli, in un ciclo di rinforzo positivo, apprendendo dai dati generati come stanno funzionando i modelli e insegnando ai modelli in base ai risultati generati in precedenza. In ogni fase del ciclo di vita del machine learning, i dati e i modelli devono essere curati congiuntamente per costruire le migliori applicazioni. Ciò è ancora più importante per i modelli generativi, dove qualità e sicurezza dipendono così tanto da buoni dati di addestramento.
Il prodotto di MosaicAI, che consente alle aziende di creare in modo efficiente grandi modelli di IA sui propri dati e processi aziendali, rimarrà disponibile per l'acquisto diretto. In futuro, integreremo strettamente MosaicAI con la Lakehouse AI Platform, avvicinando lo stack di addestramento ai dati del cliente e ad altre capacità di Lakehouse AI.
Siamo entusiasti del futuro di Databricks e MosaicAI e di come possiamo aiutare i nostri clienti con le loro ambizioni di IA generativa.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
