Passa al contenuto principale
Servizi finanziari

Conformità BSA/AML moderna su Databricks

In che modo la Databricks Data Intelligence Platform unifica i sistemi AML isolati, lo scoring del rischio basato su ML e una flotta di agenti AI in un unico workflow governato: dall'alert alla presentazione del SAR.

di Kateryna Savchyn , Pavithra Rao, Mimi Park e Emerson Bayuk

  • Di cosa si tratta? Un'esperienza unificata, potenziata da agenti AI e machine learning, per gli analisti AML e la leadership, integrata sulla Databricks Data Intelligence Platform.
  • Quale problema risolve? Consolida i sistemi isolati che consumano la maggior parte del tempo degli analisti durante un'indagine AML, potenzia il rilevamento basato su regole con lo scoring del rischio guidato da ML e accelera la creazione di report SAR da ore a minuti, il tutto in un unico ambiente governato.
  • Quali risultati possono aspettarsi i team AML? Tempi di elaborazione dei casi da 8 a 10 volte più rapidi, una riduzione del 75% dei falsi positivi e risparmi annuali compresi tra 50 e 150 milioni di dollari per gli istituti di medie e grandi dimensioni.

La funzione antiriciclaggio (AML) nei servizi finanziari è stata storicamente organizzata intorno a due responsabilità: la gestione degli alert di potenziali attività di riciclaggio di denaro e la documentazione dell'esito di ogni caso, inclusa la presentazione di Suspicious Activity Reports (SAR) quando giustificato, il tutto mantenendo l'efficacia del programma e l'auditabilità dei processi. Questo modello è ora sotto pressione. L'evoluzione delle tipologie di reati finanziari, le aspettative normative in materia di spiegabilità in tempo reale e la maturità dell'AI generativa stanno ridefinendo l'aspetto di una moderna pratica AML. Dai leader AML ci si aspetta sempre più che indirizzino il tempo degli analisti verso una reale intelligence sui reati finanziari, piuttosto che verso la raccolta di dati, il triage dei falsi positivi e la stesura di relazioni che oggi dominano i carichi di lavoro.

Il vincolo raramente è rappresentato dal talento o dall'intenzione. Si tratta del freno strutturale imposto a ogni alert da sistemi frammentati, punteggi dei fornitori opachi e assemblaggio manuale delle prove. Fino a quando questo freno non verrà rimosso, i programmi AML, per quanto ben finanziati, rimarranno bloccati nella modalità di smaltimento degli arretrati.

Perché le operazioni AML si scontrano con un muro di produttività

L'attuale ciclo tipico di investigazione AML è manuale e soggetto a errori. Gli analisti dedicano da tre a sei ore per caso all'estrazione e alla correlazione dei dati tra 10 o più sistemi isolati, tra cui: Know Your Customer (KYC), monitoraggio delle transazioni, screening delle sanzioni, gestione dei casi, media avversi, titolarità effettiva, CRM interno, log di filiale e basi di conoscenza normativa, il tutto unito in fogli di calcolo e modelli Word. La maggior parte di questo tempo viene spesa per i falsi positivi: PwC stima che tra il 90 e il 95 percento di tutti gli alert generati dai sistemi di monitoraggio delle transazioni non siano utilizzabili, eppure ognuno di essi consuma lo stesso sforzo investigativo di un vero positivo perché nulla collega le prove in modo automatico. Il monitoraggio basato su regole di prima generazione è sempre più superato dalle moderne tecniche di frode basate sull'AI.

Questo freno si manifesta in quattro aree:

  • Oltre 10 sistemi isolati. Gli analisti sono lo strato di integrazione de facto. Ogni alert richiede di autenticarsi nuovamente in molteplici portali dei fornitori, copiare i valori in un documento di lavoro e riconciliare gli identificativi a mano.
  • Alto tasso di falsi positivi. Le regole e i modelli di rilevamento che non vengono aggiornati continuamente in base all'evoluzione delle tipologie di reati finanziari possono perdere il passo rispetto ai reali pattern di attività, generando alert su transazioni che alla fine si rivelano legittime. Ogni alert consuma comunque le stesse 3-6 ore di sforzo investigativo, indipendentemente dall'esito.
  • Documentazione manuale dei casi. Ogni caso richiede una disposizione scritta (escalation, archiviazione come falso positivo o presentazione di un SAR) documentata e archiviata per l'audit normativo. Gli analisti creano questi report a mano da zero, citando le stesse normative e strutturando gli stessi pacchetti di prove caso dopo caso. I dati del sondaggio del Bank Policy Institute stimano lo sforzo delle banche per la sola presentazione dei SAR a circa 21,4 ore per pratica, più di dieci volte la stima del Paperwork Reduction Act dello stesso FinCEN.
  • Punteggi dei fornitori opachi. Le piattaforme AML pacchettizzate in genere espongono le soglie degli scenari per la calibrazione, ma gli artefatti del modello sottostante, la feature engineering e la cadenza di riaddestramento spesso risiedono all'interno dell'ambiente del fornitore, rendendo più difficile per gli istituti soddisfare gli standard di gestione del rischio di modello (ad es. SR 11-7) e rispondere rapidamente quando le autorità di regolamentazione chiedono come sia stato generato un determinato punteggio.

L'effetto cumulativo è un arretrato che cresce più velocemente di quanto il personale riesca a smaltirlo. Nel PwC EMEA AML Survey 2024, il 44% degli istituti finanziari cita l'inasprimento delle normative sui reati finanziari come il singolo fattore più pressante che complica le operazioni di conformità, e le tipologie del prossimo decennio (pagamenti in tempo reale, finanza integrata, ponti crypto-fiat, identità sintetiche su larga scala) non faranno che ampliare questo divario.

La soluzione: Databricks Data Intelligence Platform

Per passare dallo smaltimento degli arretrati all'investigazione, i team AML hanno bisogno di una piattaforma che non si limiti a memorizzare gli alert, ma che ragioni su di essi e lo faccia nel rispetto della governance che un'autorità di regolamentazione si aspetta di vedere. Databricks Data Intelligence Platform riunisce il monitoraggio delle transazioni, il KYC, lo screening delle sanzioni, la conoscenza normativa e gli agenti AI sotto la governance di Unity Catalog, con una lineage completa dalla transazione grezza al SAR presentato. Ogni componente è componibile anziché "tutto o niente": gli istituti possono adottare l'intero stack end-to-end o integrare singoli elementi nei flussi di lavoro esistenti, il che è particolarmente utile per i team che hanno appena iniziato a modernizzarsi. Sei funzionalità distinguono questo approccio dagli stack AML tradizionali:

1. Un livello di dati di conformità unificato governato da Unity Catalog

Unity Catalog consolida oltre 10 sistemi isolati in un unico lakehouse governato. Il core banking, i flussi di monitoraggio delle transazioni, i profili KYC, i riscontri delle sanzioni, la cronologia dei casi e la libreria dei documenti di policy AML dell'istituto vengono inseriti tramite Lakeflow Connect in un'architettura medaglione Bronze → Silver → Gold, con qualità dei dati applicata da Delta, mascheramento delle colonne per i PII dei clienti e sicurezza a livello di riga legata al team e al ruolo. Ogni artefatto a valle (il punteggio di rischio, la catena di prove dell'agente, il report SAR) è tracciato tramite lineage fino alla riga di origine e al timestamp di inserimento. Quando l'esaminatore chiede cosa ha scatenato l'alert, quali prove hanno supportato la presentazione o come l'istituto ha gestito casi strutturalmente simili, la risposta è una query riproducibile anziché il ricordo di un analista. La governance, la lineage e l'applicazione della qualità sono proprietà della piattaforma, non un livello sovrapposto.

2. ML end-to-end per il rilevamento e il punteggio di rischio

I motori di regole statiche vengono potenziati, non sostituiti. Databricks Data Intelligence Platform offre ai team di data science e criminalità finanziaria le fondamenta per sviluppare, addestrare e servire modelli ML all'avanguardia personalizzati in base alla cronologia delle transazioni, alla base clienti e al profilo di rischio dell'istituto, inserendo segnali più ricchi sia nella coda degli alert che nel contesto dell'investigazione. I modelli vengono registrati in MLflow con alias champion/challenger e tracciamento completo degli esperimenti; Model Serving espone il modello attivo; Lakehouse Monitoring osserva il drift e le prestazioni in produzione; e le tabelle di inferenza acquisiscono il feedback degli analisti che alimenta il riaddestramento del challenger. Man mano che i challenger si dimostrano superiori, i team li promuovono attraverso la gestione del ciclo di vita di MLflow. Ogni alert può mostrare una spiegazione delle regole aziendali e dei segnali ML che lo hanno generato, in modo che l'analista apra un caso sapendo già perché è finito in coda. Il risultato è una riduzione del 75% dei falsi positivi che raggiungono la coda degli analisti, senza dover sostituire completamente il motore di regole di monitoraggio delle transazioni esistente.

3. Una flotta di agenti AI specializzati che lavorano di concerto

Il cuore della modernizzazione è un assistente di chat multi-agente che coordina una flotta di sotto-agenti specializzati durante un'investigazione, basato su Agent Bricks. Invece di accedere a molteplici sistemi per correlare manualmente i dati, l'analista lavora da un'unica pagina di investigazione che mostra in un'unica vista le note di due diligence passate, le note sul caso, le precedenti presentazioni di SAR, i pattern delle transazioni e le relazioni tra entità. La flotta di agenti analizza l'intera rete di dati disponibili e restituisce una raccomandazione informata su come gestire il caso, con l'intervento umano fondamentale per la decisione finale: escalation a un team di specialisti, archiviazione come falso positivo o procedere alla presentazione del SAR. L'effetto end-to-end: un'investigazione che in precedenza richiedeva da tre a sei ore di lavoro manuale si riduce a pochi minuti di revisione supportata dagli agenti.

4. Generazione di SAR assistita dall'AI, da ore a minuti

Quando l'analista procede alla presentazione della segnalazione SAR, la stessa flotta di agenti precompila i metadati contestuali raccolti durante l'indagine e redige una panoramica e una descrizione personalizzate per il report. L'analista verifica le informazioni, personalizza e genera il PDF; l'IA struttura il documento per rispettare le specifiche di formato richieste dall'istituto prima dell'invio. I report inviati vengono trasmessi al backend con un record completamente tracciabile dal punto di vista dell'audit. La creazione dei report SAR, che tradizionalmente richiedeva ore, si completa ora in pochi minuti. Inoltre, questo chiude automaticamente il cerchio e rende immediatamente disponibile la segnalazione come contesto ed evidenza aggiuntivi per i casi analizzati attivamente in parallelo dal resto del team AML.

5. Visualizzazione a grafo per il rilevamento di pattern di rete

Un layer a grafo, reso disponibile tramite visualizzazioni interattive nel workbench dell'analista, consente di passare dalla pagina di indagine a una visualizzazione a grafo completa, porre domande in linguaggio naturale al grafo stesso o passare a qualsiasi singola entità per esplorare le relazioni con le controparti. Questo scopre i pattern di rete nascosti che i sistemi basati su regole non rilevano: società di comodo, strutture di stratificazione e flussi di fondi circolari.

6. Reportistica direzionale con interfaccia in linguaggio naturale

I responsabili AML accedono a una vista direzionale che mostra i KPI sul volume dei casi, le ore impiegate e gli avvisi scaduti; linee di tendenza per il rilevamento e l'anzianità dei casi; una visualizzazione del flusso di processo dal rilevamento all'assegnazione al team fino alla risoluzione; e suddivisioni per scenario e criticità. La vista sulle prestazioni del team analizza nel dettaglio la produttività degli incidenti, la pressione sulle scadenze e il tempo medio di risposta per tipo di rilevamento e team, semplificando l'identificazione dei colli di bottiglia nel processo e le opportunità di ridistribuire il lavoro nel team per rispettare le scadenze critiche. La chat in linguaggio naturale sugli stessi dati regolamentati consente approfondimenti self-service sui trend senza dover attendere il team di analytics: Genie consente ai responsabili AML di chiedere: "Quali relazioni con i consulenti hanno generato il maggior numero di avvisi di strutturazione nell'ultimo trimestre e qual è il tasso di falsi positivi per team?" e ricevere una risposta pronta per l'audit in pochi secondi.

Conclusione: un nuovo standard per la leadership AML

I team AML non devono più scegliere tra la produttività degli analisti e la difendibilità normativa. Una Data Intelligence Platform regolamentata, in cui avvisi, evidenze, agenti e audit trail risiedono nello stesso ambiente tracciato tramite lineage, offre entrambe le cose. Il vecchio approccio basato su "più analisti, più fornitori, più fogli di calcolo" non è più competitivo rispetto agli istituti che hanno unificato i propri dati di conformità e lasciano che gli agenti IA si facciano carico delle indagini multi-fonte. Questo cambiamento non è un'aspirazione per il futuro; è una decisione operativa disponibile oggi.

L'architettura in breve

La soluzione è composta da cinque funzionalità disponibili sulla Data Intelligence Platform di Databricks:

  • Ingestione e governance. Lakeflow Connect inserisce i dati bancari principali, i flussi di monitoraggio delle transazioni, i profili KYC, i riscontri delle sanzioni, la cronologia dei casi e i documenti sulle policy in un'architettura medallion Bronze → Silver → Gold in Delta, con Unity Catalog che applica il mascheramento delle colonne, la sicurezza a livello di riga e il lineage end-to-end.
  • Scoring. I modelli di rilevamento — ottimizzati in base alla cronologia delle transazioni e al profilo di rischio dell'istituto — vengono addestrati e distribuiti tramite MLflow con alias champion/challenger; Model Serving espone il modello attivo; Lakehouse Monitoring monitora il drift; e le tabelle di inferenza acquisiscono il feedback degli analisti che alimenta il riaddestramento del modello challenger.
  • Ragionamento. Un assistente multi-agente basato su Agent Bricks orchestra gli agenti Genie per query strutturate, assistenti di conoscenza RAG supportati da Vector Search sulla libreria normativa e sulle policy dell'istituto, agenti esterni resi disponibili tramite l'MCP Marketplace e un layer a grafo che risolve le entità e scopre strutture di controparti nascoste.
  • Stato operativo. Databricks Lakebase — un database Postgres gestito e completamente integrato con il lakehouse — funge da backend operativo per gli agenti e le applicazioni. Lo stato dei casi, le note degli analisti, la cronologia delle conversazioni degli agenti, le bozze dei report SAR e lo stato del flusso di lavoro vengono salvati in modo persistente in Lakebase con letture e scritture a bassa latenza, rimanendo sincronizzati con le tabelle Delta sotto la stessa governance di Unity Catalog, lo stesso lineage e gli stessi controlli di accesso applicati ai dati analitici.
  • Esperienza per analisti ed executive. Databricks Apps fornisce il workbench per le indagini degli analisti, la vista direzionale, l'esploratore di grafi e l'interfaccia di invio dei report SAR, leggendo e scrivendo lo stato operativo tramite Lakebase con una tracciabilità di audit completa sui report inviati.

Distribuzione modulare

I cinque livelli possono essere distribuiti in modo indipendente o come stack completo. Una banca che dispone già di un proprio motore di monitoraggio delle transazioni può adottare solo i livelli di scoring o di ragionamento per aggiungere lo scoring del rischio tramite ML e indagini potenziate dall'IA agli avvisi esistenti; una banca con una gestione dei casi matura ma dati frammentati può iniziare con il livello di ingestione e governance per consolidare innanzitutto le fonti. Poiché ogni componente condivide la stessa Data Intelligence Platform e la stessa governance di Unity Catalog, le distribuzioni parziali si integrano fino a raggiungere l'architettura completa senza dover cambiare piattaforma.

Distribuzione modulare

I cinque livelli possono essere distribuiti in modo indipendente o come stack completo. Una banca che dispone già di un proprio motore di monitoraggio delle transazioni può adottare solo i livelli di scoring o di ragionamento per aggiungere lo scoring del rischio tramite ML e indagini potenziate dall'IA agli avvisi esistenti; una banca con una gestione dei casi matura ma dati frammentati può iniziare con il livello di ingestione e governance per consolidare innanzitutto le fonti. Poiché ogni componente condivide la stessa Data Intelligence Platform e la stessa governance di Unity Catalog, le distribuzioni parziali si integrano fino a raggiungere l'architettura completa senza dover cambiare piattaforma.

Scoprilo in azione

Guarda la demo!

Distribuisci la soluzione nel tuo workspace

▸ Contattaci: rivolgiti oggi stesso al team del tuo account Databricks per integrare questa soluzione nel tuo flusso di lavoro AML esistente!

(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale

Ricevi gli ultimi articoli nella tua casella di posta

Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.