Databricks è lieta di annunciare l'acquisizione di Quotient AI, un'azienda innovatrice nella valutazione e nell'apprendimento per rinforzo per gli agenti AI. Quotient aiuta le aziende a monitorare il comportamento degli agenti in produzione, rilevare problemi critici e utilizzare tali segnali per migliorare continuamente le prestazioni degli agenti. Man mano che le organizzazioni implementano agenti AI in flussi di lavoro business-critical, hanno bisogno di metodi affidabili per garantire che tali sistemi funzionino come previsto nel mondo reale. Integrando Quotient in Databricks, stiamo rafforzando Genie, Genie Code e Agent Bricks con valutazione e apprendimento continui, offrendo a sviluppatori e organizzazioni agenti di AI che diventano più accurati, affidabili e specializzati nel tempo.
Risolvere la sfida della messa in produzione per gli agenti AI
Emerge una nuova sfida mentre le aziende passano gli agenti AI dalla fase pilota alla produzione: come misurare, eseguire il debug e migliorare le prestazioni in modo affidabile su Scale. Poiché gli agenti sono sistemi composti complessi di modelli, memoria, strumenti, competenze e altri componenti, i team devono non solo valutare la qualità, ma anche comprendere rapidamente la causa principale dei fallimenti. Senza un solido sistema di valutazione in grado di interpretare i fallimenti del sistema, la risoluzione dei problemi per migliorare le prestazioni diventa lenta e i responsabili di prodotto non riescono ad acquisire la fiducia necessaria per il rilascio in produzione.
Vi presentiamo Quotient
Quotient è stato creato per colmare il divario nella valutazione degli agenti e nell'apprendimento continuo. Creato dagli ingegneri che hanno guidato il miglioramento della qualità di GitHub Copilot, il team vanta una profonda esperienza nella misurazione e nel miglioramento di sistemi di AI su larga Scale. La piattaforma Quotient analizza le tracce complete degli agenti dai sistemi di produzione per rilevare problemi come allucinazioni, errori di ragionamento e uso scorretto degli strumenti. Questi segnali vengono raggruppati e trasformati automaticamente in set di dati di valutazione strutturati e segnali di ricompensa che possono essere utilizzati per monitorare e perfezionare gli agenti. Questo approccio consente alle organizzazioni non solo di osservare il comportamento degli agenti, ma di migliorarlo sistematicamente, aiutando i sistemi di AI a diventare esperti di dominio che apprendono continuamente dall'utilizzo nel mondo reale.
Quotient + Databricks
Databricks fornisce già potenti strumenti per la valutazione e il miglioramento degli agenti di AI. Con Quotient, stiamo rafforzando queste funzionalità sulla nostra piattaforma integrando un livello di valutazione e miglioramento continuo che fornisce ai clienti sistemi di IA più accurati e affidabili. Questo rafforza tre aree di prodotto chiave in Databricks:
Man mano che gli agenti AI si assumono maggiori responsabilità in tutta l'azienda, le organizzazioni hanno bisogno di sistemi di cui potersi fidare. Combinando le funzionalità di Quotient con la ricerca di Databricks AI e la piattaforma, i clienti possono implementare agenti di IA che non solo vengono eseguiti in produzione, ma migliorano nel tempo.
Siamo entusiasti di dare il benvenuto al team di Quotient in Databricks mentre continuiamo a costruire la piattaforma più affidabile per sviluppare, implementare e migliorare sistemi agentici su vasta scala.
Per saperne di più, consulta Databricks AI e il lancio di Genie Code.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
