13 maggio 2026

La qualità dei dati è la strategia dell'IA

Perché un sistema sanitario accademico ha corretto i dati alla fonte prima di puntare sull'IA

Il principio guida per l'IA di alta qualità sono i dati di alta qualità, e ciò significa prima correggere i sistemi transazionali.
Il supporto decisionale clinico in tempo reale sta già prevenendo diagnosi errate al pronto soccorso.
Gli strumenti e i modelli continueranno a cambiare. Le organizzazioni che si concentrano sulla creazione di valore con dati unificati saranno quelle che ne trarranno maggior beneficio.

La sanità potrebbe essere una delle maggiori beneficiarie dell'IA. Poche industrie generano tanti dati e poche hanno così tanto da guadagnare dall'estrarne informazioni. Ma il divario tra la generazione di dati e il loro effettivo utilizzo per migliorare l'assistenza, accelerare la ricerca e gestire le operazioni in modo più efficiente rimane enorme nella maggior parte dei sistemi sanitari. Coloro che stanno colmando questo divario partono dai dati, non dai modelli.

NYU Langone Health, un sistema sanitario accademico leader, serve la grande area di New York attraverso l'assistenza ai pazienti, la ricerca medica e l'istruzione medica. NYU Langone utilizza Databricks per la sua piattaforma unificata di dati e IA, avendo recentemente dismesso il suo data lake on-premises e ora sta migrando il suo data warehouse aziendale. L'istituzione ha costruito un'ampia comunità di medici, analisti, scienziati e membri della forza lavoro aziendale che utilizzano la piattaforma nell'assistenza, nelle operazioni e nella ricerca.

Nader Mherabi, Chief Digital and Information Officer presso NYU Langone Health, ha guidato la strategia dei dati dell'istituzione ben prima dell'attuale ondata di IA, costruendo le basi per un sistema sanitario basato sui dati. Nel 2017, ha riconosciuto la qualità della raccolta dati di NYU Langone e ha creato un'opportunità per spingersi oltre con le capacità emergenti dell'IA.

La metafora a cui Nader è tornato: Se vuoi acqua pulita, ripara i tubi. Non cercare di filtrarla alla fine.

Ripara la qualità dei tuoi dati alla fonte

Aly McGue: NYU Langone è un'organizzazione guidata da metriche con uno stack di dati maturo. Quando hai già un data warehouse e un data lake funzionanti, qual è il 'pezzo mancante' che rende necessaria la migrazione a una piattaforma dati moderna?

Nader Mherabi: Il nostro percorso è stato un po' diverso da quello di alcune istituzioni. Siamo sempre stati un'organizzazione altamente guidata dai dati e dalle metriche. Avevamo già dati unificati in un data lake e in un data warehouse aziendale, anche nello stack tradizionale. Quindi, il passaggio a una piattaforma moderna è stato più facile per noi di quanto potrebbe essere per altri.

Ma l'imperativo era chiaro. Già nel 2017, abbiamo riconosciuto che il potenziale dell'IA, anche in quella fase molto precoce, significava che dovevamo modernizzare il nostro stack di dati. È una cosa costruire modelli. È un'altra cosa eseguirli 24 ore su 24, 7 giorni su 7, in modo sicuro e affidabile. Avevamo bisogno di una piattaforma che potesse aiutarci a realizzare le nostre ambizioni in termini di qualità, sicurezza, efficienza del paziente e ricerca medica, e che potesse crescere con noi man mano che la tecnologia si evolve.

Un principio guida che abbiamo stabilito oltre un decennio fa è che se vuoi davvero dati di alta qualità nel tuo livello di intelligence, devi correggerli prima nei sistemi transazionali. È come l'acqua che scorre nei tubi. Se hai acqua pulita alla fonte, non devi continuare a filtrarla alla fine. Filtrare l'acqua sporca è costoso. Quindi, l'obiettivo dovrebbe essere sempre l'acqua pulita prima. Alcune cose dovrai ancora filtrarle lungo il percorso, ma il principio dovrebbe essere quello di correggerle a monte.

Aly: In che modo la disciplina di correggere i dati a livello transazionale ha trasformato l'utilità effettiva del tuo livello dati?

Nader: Anni fa, avevamo molti sistemi con dati dei pazienti sparsi in più sedi senza identificatori unificati. Questa è un'enorme sfida per la qualità dei dati e limita ciò che puoi farne. Parte del nostro approccio è stato investire in piattaforme transazionali comuni: un unico sistema di cartelle cliniche elettroniche e un unico sistema ERP. Man mano che acquisivamo nuove pratiche o ospedali, investivamo nel portare tutti su piattaforme comuni e poi creavamo principi guida per i dati.

Ad esempio, non mappare mai i dati a livello di data warehouse. Cerchiamo sempre di correggerli alla fonte. Abbiamo padroneggiato i sistemi e i dati in modo da sapere che questa è la fonte autorevole per i dati dei pazienti, questa è la fonte per i dati finanziari, questa è la fonte per i dati operativi. Una volta fatto ciò, la tua piattaforma dati diventa molto più significativa. Le persone possono incrociare i dati, il che è fondamentale in sanità. Prendi un paziente al centro: devi collegare i suoi dati di assistenza a quali studi clinici sono disponibili, fino al lato finanziario, ai campioni raccolti durante l'intervento chirurgico e a dove si trovano fisicamente. Se non hai quella mappatura, ti manca un'enorme capacità. Il principio guida che lo rende possibile è sempre lo stesso: correggilo a monte.

Cosa sblocca effettivamente i dati unificati

Aly: In sanità, la posta in gioco per l'accuratezza dei dati è alta. In che modo una base dati unificata impedisce il dibattito sui 'metriche contrastanti' tra diversi dipartimenti, e perché quella fiducia è così critica quando ci si muove verso sistemi IA agentivi?

Nader: È enorme. Anche prima dell'IA, i vantaggi dei dati unificati erano enormi. Quando i tuoi dati sono unificati, puoi creare metriche migliori e diverse parti dell'azienda non arrivano dicendo: "Quel numero non ha senso". Se i tuoi dati non sono unificati, le tue metriche non saranno mai allineate.

Con l'IA, ovviamente, la posta in gioco aumenta. Se non hai dati eccellenti, non avrai un'IA eccellente. Le prestazioni dipendono dalla qualità dei dati. E poi c'è la dimensione in tempo reale. Ottenere le informazioni delle persone al momento giusto e nel posto giusto è ciò che conta.

La governance unificata è un imperativo strategico per l'IA

Aly McGue: Una volta che hai dati unificati, la sfida successiva è renderli scopribili e affidabili su larga scala. Come si inserisce la governance dei dati in questo contesto?

Nader Mherabi: È fondamentale. Hai bisogno di un catalogo per operare su dati e modelli IA. Usiamo Unity Catalog e continuiamo a spingerlo oltre.

Ma l'investimento non è solo nello strumento, è nella strategia che lo circonda. Devi definire le tue fonti di dati principali, decidere chi possiede ogni parte del catalogo e poi considerare attentamente come esporlo alla comunità più ampia in modo che le persone possano trovare ciò di cui hanno bisogno senza duplicare il lavoro. È una cosa avere un enorme programma dati. È un'altra cosa che le persone trovino effettivamente i dati giusti al suo interno. Se stai adottando una piattaforma come questa, suggerirei sempre di ottenere il catalogo fin dall'inizio. Sottende tutto il resto.

Costruire una comunità data-literate

Aly McGue: Una piattaforma unificata fornisce valore solo se le persone in tutta l'istituzione la utilizzano effettivamente. Come hai affrontato la costruzione di quella comunità oltre il team di data engineering?

Nader: Quando investi in una piattaforma come questa, devi ottimizzare l'investimento. Per noi, ciò significa evangelizzare ciò che può fare in tutta l'istituzione. L'obiettivo è diventare un sistema sanitario di apprendimento, uno che impara da ogni interazione con il paziente e restituisce tale intuizione alla pratica. Ciò funziona solo se la comunità che utilizza la piattaforma si estende ben oltre l'IT. Abbiamo costruito un'ampia base di utenti di medici, analisti e scienziati, tutti operanti all'interno di controlli di accesso adeguati, e abbiamo investito in programmi di alfabetizzazione e formazione per garantire che le persone nell'assistenza, nelle operazioni e nella ricerca possano trarne vantaggio. Far entrare l'IT nella piattaforma è scontato. La vera misura del successo è se anche il resto dell'istituzione può utilizzarla.

Informazioni in tempo reale dove contano di più

Aly: In un ambiente ad alta criticità come un pronto soccorso, 'informazioni del giorno dopo' sono effettivamente inutili. Quali sono i requisiti architetturali per una piattaforma che passi dal reporting retrospettivo al supporto decisionale clinico in tempo reale che possa effettivamente prevenire una diagnosi errata?

Nader: Nell'assistenza, l'impatto è diretto. Abbiamo modelli in esecuzione nel pronto soccorso che cercano determinate condizioni critiche e forniscono supporto decisionale ai medici. L'obiettivo è garantire che se un paziente viene dimesso, il sistema possa segnalare: hai identificato questa diagnosi? Ci hai pensato? Perché ciò che non vogliamo è un paziente che lascia il pronto soccorso con una condizione che potrebbe avere gravi conseguenze se non viene diagnosticata.

Sentiamo tutti parlare di casi in altre istituzioni in cui una diagnosi errata porta a un esito negativo. Vogliamo modelli in tempo reale che funzionino continuamente e forniscano il miglior consiglio ai medici. Non sostituire il loro giudizio, ma dire: "Ehi, potresti aver trascurato questo. Per favore, dai un'altra occhiata." Affinché ciò funzioni, i modelli necessitano di dati in tempo reale. E ciò richiede che la piattaforma dati supporti flussi di dati in tempo reale in modo che i modelli possano operare su informazioni correnti e fornire informazioni just-in-time.

Tre livelli di analisi dei dati

Aly: In che modo l'IA ha trasformato l'approccio della tua organizzazione all'analisi e alla strategia BI?

Nader: Credo che l'analisi sia a tre livelli. Primo, devi fornire alcune visualizzazioni di base. Non puoi semplicemente dire: "Cosa vuoi guardare?" Le persone hanno bisogno di alcuni punti di partenza strutturati. Secondo, aggiungi il livello conversazionale, strumenti come Genie, dove le persone possono essere curiose e porre domande più approfondite. E terzo, devi essere in grado di fornire la risposta in forme diverse a seconda dell'utente: a volte è un fatto diretto, a volte è una visualizzazione e a volte sono alcuni numeri su uno schermo.

Ciò che è potente in dove siamo ora è che per la prima volta nella storia uomo-macchina, possiamo effettivamente parlare con le macchine in termini umani, nel modo in cui chiederesti a un collega. Questo ha chiaramente un posto. Ma consiglierei a tutti di pensare a dove ha senso e in quale misura. Non sostituire completamente la tua visualizzazione. Aggiungi il livello conversazionale in modo che le persone possano essere curiose, fare più domande e aiutarsi in modo semplice.

Aly: Il ritmo dello sviluppo dell'IA può essere paralizzante per molti leader. Come bilanciate la necessità di una strategia stabile a lungo termine con la realtà che la tecnologia potrebbe apparire completamente diversa tra sei mesi?

Nader: Innanzitutto, accettate l'imprevedibilità dell'IA. Vi sveglierete domani e sarà arrivato qualcosa di nuovo. Gli strumenti e la tecnologia continueranno a cambiare. Non bloccatevi su questo. Trovate buoni partner che possano far crescere la loro piattaforma come parte del cambiamento e concentratevi sulla creazione di valore.

Che si tratti di fornire assistenza sicura e di alta qualità, migliorare l'efficienza operativa o migliorare l'esperienza del paziente, questo è il valore. Perseguite questo obiettivo con le capacità esistenti oggi e poi continuate a evolvervi. E l'altra parte è educarsi. Parte di ciò che rende le persone esitanti è che non si sentono di capire cosa sta succedendo. Dovete rimanere informati al meglio delle vostre possibilità, perché questo vi aiuta a prendere decisioni migliori man mano che il mercato si evolve, specialmente al ritmo attuale.

Considerazioni finali

L'approccio precoce e intenzionale della NYU Langone è il punto chiave da cui partire in questa discussione. La metafora dell'acqua pulita cattura qualcosa di importante. Le organizzazioni che investono nel filtrare i dati sporchi a valle giocano sempre all'inseguimento. Quelle che li risolvono a livello transazionale, anche se richiede più tempo e costa di più all'inizio, costruiscono una base su cui ogni investimento successivo, dall'analisi all'IA al supporto decisionale clinico in tempo reale, può costruire in modo affidabile. In un contesto in cui la posta in gioco è la sicurezza del paziente, quella disciplina non è facoltativa.

Per ascoltare i leader del settore e definire il vostro percorso per operazionalizzare l'IA, scaricate il report Economist Enterprise, “Making AI Deliver.”

(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale

Ricevi gli ultimi articoli nella tua casella di posta

Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.

Visualizza tutti i blog