Il co-fondatore di Databricks Arsalan Tavakoli-Shiraji su cosa separa le aziende che generano valore AI reale da quelle bloccate in un ciclo di sprawl
La domanda che sta emergendo nelle sale riunioni e nelle sessioni di strategia dei dati in questo momento: perché così tante iniziative di IA generano attività senza generare valore? Sembra semplice finché non si cerca di rispondere.
Arsalan Tavakoli-Shiraji ha osservato questo schema ripetersi in centinaia di conversazioni aziendali. In qualità di co-fondatore e Vicepresidente Senior di Field Engineering presso Databricks, si trova all'intersezione tra architettura tecnica e strategia aziendale di IA.
In questa conversazione, Arsalan ed io abbiamo discusso di cosa i CDO e i CTO devono capire per mettere in produzione sistemi agentivi, di come si presentano i fallimenti di governance una volta che l'IA passa dalla produzione di output all'esecuzione di azioni — invio di messaggi, aggiornamento di record, esecuzione di decisioni — e di come trovare una vittoria significativa senza creare il tipo di proliferazione di IA che tormenta le organizzazioni per anni.
La Distanza tra Attività di IA e Valore di IA
Catherine Brown: Lavori con le aziende in tutte le fasi di adozione dell'IA. Dove si collocano la maggior parte di esse, onestamente?
Arsalan Tavakoli-Shiraji: In diverse categorie. Alcune stanno ancora sperimentando — prendendo in mano i modelli, eseguendo progetti pilota, vedendo cosa è possibile fare. Altre sono andate oltre e stanno automatizzando compiti specifici: generazione di testi, trascrizione di appunti, permettere alle persone di fare domande sui propri dati. E poi c'è il gruppo molto più piccolo che ha capito come progettare da zero tenendo conto delle capacità dell'IA. La maggior parte delle organizzazioni è ancora nelle prime due categorie. C'è molta proliferazione di IA, molta attività di IA. C'è molto meno valore di IA.
La grande differenza è da dove si parte. Coloro che ottengono un valore significativo iniziano con l'obiettivo che vogliono raggiungere — maggiore produttività, una nuova capacità aziendale, riduzione del rischio — e lavorano a ritroso. Non partono dalla tecnologia.
Catherine: Qual è l'errore architetturale più comune che impedisce ai sistemi agentivi di raggiungere la produzione?
Arsalan: L'errore che vedo di più è pensare che la selezione di un modello sia la parte difficile. Al momento, ottenere un modello di base di alta qualità è la parte più facile del problema. La parte più difficile è tutto ciò che sta sotto.
Nell'ambiente aziendale, devi considerare alcune cose. Dove sono i tuoi dati e come ti ci connetti? La maggior parte delle organizzazioni ha dati sparsi in una dozzina di posti diversi, bloccati in formati proprietari che non comunicano tra loro. E una volta che inizi a collegare gli agenti a quei dati, hai bisogno di una governance seria. Non solo governance sui dati stessi, ma governance che comprenda gli agenti: cosa stanno facendo, quali permessi hanno, dove stanno andando e come più agenti di più sistemi si connettono. E infine, gli agenti hanno bisogno di una profonda comprensione semantica della tua organizzazione. Sono, di fatto, lavoratori virtuali che operano per tuo conto. Devono sapere cosa significa fare bene, quali sono le definizioni e le metriche chiave e qual è il contesto effettivo del business.
L'anti-pattern è semplice: dati bloccati in silos, governance saltata o trattata come un problema secondario, e poi una corsa per capire perché gli agenti non funzionano in produzione. Le organizzazioni falliscono su queste tre cose quasi ogni volta.
Perché Dashboard e Pipeline Batch Sono le Fondamenta Sbagliate
Catherine: Strutturalmente, perché dashboard e pipeline batch sono inadeguati per dove le aziende devono andare?
Arsalan: Sono dei cerotti. Le dashboard forniscono un punto di riferimento visivo che è ancora importante per le aziende quando prendono decisioni. Ma la maggior parte è costruita per rispondere a una domanda che qualcuno ha posto una volta. Vengono costruite, vengono visualizzate un paio di volte, e poi si uniscono a quella che chiamerei la discarica delle dashboard.
Le dashboard sono anche difficili da interrogare. Vedi qualcosa nei dati e vuoi sapere perché è successo. Vuoi collegarlo a un evento, scavare sotto, e fare una domanda di follow-up. Storicamente, ciò significa che qualcuno va, estrae i dati sottostanti, esegue un'analisi e torna da te. Questa latenza è brutale in un mondo in cui le cose si muovono velocemente.
Le pipeline batch hanno un problema simile. L'elaborazione batch aveva senso quando le decisioni avvenivano abbastanza lentamente che i dati giornalieri o settimanali andavano bene. Ma in un mondo agentivo, la finestra tra quando vedi qualcosa e quando puoi agire su di essa si sta restringendo rapidamente. Quando hai sistemi disconnessi che operano su cicli batch, semplicemente non puoi rispondere alla velocità richiesta dagli agenti.
Cosa Risolve Effettivamente Lakebase
Catherine: Mentre le aziende passano dalla sperimentazione di IA all'esecuzione agentiva, dove si inserisce Lakebase?
Arsalan: L'infrastruttura che la maggior parte delle organizzazioni ha costruito attorno ai propri livelli analitici e ai propri data warehouse, è stata progettata per un tipo specifico di lavoro: query su larga scala, insight aggregati e analisti umani che eseguono report. Questo è un carico di lavoro fondamentalmente diverso da quello richiesto dalle applicazioni agentive.
Quando inizi a costruire per gli agenti, stai costruendo per un consumatore molto diverso. Pensa a un'azienda di telecomunicazioni che vuole mettere un'applicazione intelligente nelle mani di ogni tecnico sul campo. O una società di gestione patrimoniale che distribuisce un assistente IA a ciascuno dei propri consulenti. O un rivenditore che mostra raccomandazioni in tempo reale al punto vendita. Queste applicazioni devono servire un numero enorme di utenti contemporaneamente con una latenza molto bassa. E tutto questo deve avvenire a un costo che abbia senso su larga scala.
È qui che entra in gioco Lakebase. Gli agenti hanno bisogno di un database transazionale, non di un database analitico. E ne hanno bisogno uno costruito specificamente per le esigenze del mondo agentivo. Lakebase è quella fondazione. È ciò che permette alle organizzazioni di passare dalla sperimentazione con l'IA all'esecuzione su larga scala in produzione, senza che l'infrastruttura collassi sotto il carico. E funziona insieme al livello analitico che le organizzazioni hanno già. Non è una sostituzione. È il pezzo che mancava.
Fallimenti di governance quando gli agenti agiscono
Catherine: Quali fallimenti di governance tendono ad emergere una volta che i sistemi smettono di generare solo output e iniziano effettivamente ad agire?
Arsalan:
È comune presumere che qualsiasi permesso abbia una persona, anche il suo agente dovrebbe avere quegli stessi permessi. E mentre questa logica ha senso, la realtà è che quasi nessuna organizzazione ha permessi perfetti impostati correttamente per ogni persona e in ogni sistema. Gli esseri umani navigano questa realtà in modo imperfetto, ma poiché abbiamo istinti, possiamo aggirare le sfide. Abbiamo consapevolezza del contesto che ci dice: “sì, tecnicamente posso farlo. Ma probabilmente non dovrei farlo senza prima controllare.” Gli agenti non hanno questa consapevolezza situazionale. Hanno un obiettivo e un insieme di vincoli. E trovano un percorso verso l'obiettivo all'interno di questi vincoli.
Quando gli agenti generano solo output, lo scenario peggiore è che generino contenuti di bassa qualità. Quando iniziano ad agire, inviando messaggi, effettuando ordini, eliminando record, comunicando per tuo conto, la posta in gioco è completamente diversa. La governance è uno dei pezzi fondamentali che determina se è possibile effettivamente sbloccare valore dagli agenti. Le aziende che faranno le cose per bene saranno quelle che tratteranno la governance come un prerequisito, non come un ripensamento.
Il Percorso Più Veloce per il Successo
Catherine: Qual è il percorso più veloce che hai visto per un'implementazione di successo di agenti IA senza creare ulteriore proliferazione tecnologica?
Arsalan: Due cose spiccano. Primo, chiarezza su cosa significhi successo prima di iniziare. Sembra ovvio, ma la maggior parte dei team lo salta. Se non puoi definire l'obiettivo specifico che stai perseguendo (come l'aumento della produttività, una nuova capacità di ricavo, la riduzione dei costi, l'evitamento dei rischi), allora non puoi lavorare a ritroso per trovare l'approccio giusto. La tecnologia non è l'obiettivo.
Il secondo è l'isolamento. È veramente difficile trasformare un team ampio e critico dall'interno mentre sta ancora svolgendo il proprio lavoro quotidiano. Quello che vedo funzionare è creare un piccolo team pilota focalizzato con un caso d'uso chiaramente definito, dargli la libertà di iterare rapidamente e tenerlo lontano dal debito tecnico legacy e dai vincoli delle policy esistenti. Non sono vincolati, quindi si muovono velocemente. Impari cosa significa fare bene in un contesto reale. E poi prendi questi apprendimenti e capisci come scalare e abilitare l'organizzazione più ampia. Vuoi essere in grado di scoprire rapidamente cosa funziona, e poi scalare rapidamente una volta che lo fai.
La Verità Scomoda sull'Era Agentiva
Catherine: Qual è la verità scomoda che i leader devono accettare sulla riprogettazione per questo momento?
Arsalan: Dal punto di vista dell'infrastruttura, l'era agentiva richiede un insieme di componenti fondamentali che devono lavorare insieme: un livello analitico governato, un database transazionale in grado di gestire la velocità e la scala richieste dagli agenti, una piattaforma per costruire e monitorare tali agenti e un livello applicativo che le persone possano effettivamente utilizzare.
In Databricks, Lakebase gestisce la parte transazionale. AgentBricks fornisce il livello di sviluppo e monitoraggio per la creazione e la gestione di agenti su larga scala. Databricks Apps offre il livello applicativo per fornire tali esperienze agli utenti finali. E Genie è il modo in cui le persone interagiscono effettivamente con i propri dati: l'interfaccia conversazionale che consente agli utenti aziendali di porre domande e ottenere risposte senza il coinvolgimento di un analista di dati. Se si scala, gestendo non decine ma potenzialmente migliaia di agenti, è necessario un sistema in cui tutti questi componenti siano stati creati per funzionare insieme fin dall'inizio.
Ma la verità più difficile è questa: le aziende che otterranno il massimo da questo momento sono quelle disposte a ripensare il processo sottostante, non solo ad aggiungere l'AI a quello esistente. Esiste un esempio noto della seconda rivoluzione industriale. Le fabbriche che sostituirono i motori a vapore con quelli elettrici ma mantennero lo stesso layout di fabbrica ottennero quasi nessuno dei guadagni di efficienza. La tecnologia cambiò. Il sistema no. È esattamente qui che si trovano molte organizzazioni in questo momento.
I team che iniziano a chiedersi "se costruissimo questo da zero tenendo conto delle capacità dell'AI, come apparirebbe?" Sono quelli che vedranno risultati trasformativi. Richiede gestione del cambiamento, abilitazione e una chiara definizione di cosa significhi fare bene. Nulla di tutto ciò è facile. Ma le organizzazioni di successo stanno affrontando tutto questo insieme, non un pezzo alla volta.
Il Sistema è la Strategia
La domanda che CDO e CTO dovrebbero porsi in questo momento non è se investire nell'AI agentica. Quella decisione è stata in gran parte presa dal mercato. La domanda è se il sistema sottostante, l'architettura dei dati, il livello di governance, l'infrastruttura transazionale, la piattaforma di sviluppo, sia effettivamente costruito per ciò che stanno cercando di fare.
Per saperne di più sullo sviluppo di una roadmap per integrare l'AI nella tua azienda, scarica lo State of AI Agents.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.