Passa al contenuto principale
Coinbase logo

REFERENZA

Databricks supporta il rilevamento delle frodi in tempo reale in Coinbase

<100 ms

Latenza P99 raggiunta su larga scala

99%

Coerenza tra feature online e offline nei modelli

51%

Riduzione stimata annua dei costi di calcolo

Databricks powers real-time fraud detection at Coinbase

La missione di Coinbase è aumentare la libertà economica nel mondo offrendo una piattaforma affidabile per gli asset di criptovalute che include trading, staking, custodia, pagamenti e trasferimenti globali veloci e gratuiti. Per proteggere gli utenti dalle frodi e fornire raccomandazioni personalizzate, Coinbase necessita di modelli di machine learning con precisione inferiore al secondo. Tuttavia, le architetture microbatch, pensate principalmente per casi d'uso ETL, introducevano latenza, compromettendo l'accuratezza dei modelli e aumentando i costi di calcolo. Migrando a Spark Structured Streaming Real-Time Mode su Databricks, Coinbase ha trasformato la propria infrastruttura dati, riducendo la latenza di calcolo delle feature a pochi millisecondi, raggiungendo una coerenza delle feature del 99% e risparmiando centinaia di migliaia di dollari in costi infrastrutturali per abilitare un rilevamento delle frodi in tempo reale più accurato e su larga scala.

Dati obsoleti lasciavano i modelli antifrode sempre un passo indietro

Coinbase utilizza il machine learning per supportare casi d'uso chiave, come il rilevamento delle frodi, l'individuazione di transazioni sospette e la mitigazione dei rischi legati all'antiriciclaggio. Per fornire queste funzionalità sono necessari modelli di ML estremamente accurati che operino quasi in tempo reale.

Prima di adottare il Real-Time Mode (RTM), il team di piattaforma di Coinbase aveva ottimizzato Spark Structured Streaming in modalità microbatch (MBM) fino ai limiti consentiti dall'architettura. Nello specifico, il team aveva sviluppato soluzioni innovative per sfruttare ogni millisecondo di MBM, arrivando a un aggiornamento dei dati inferiore al secondo (~800-900 ms), ma a fronte di un oneroso carico operativo. Quando si verificavano ritardi, la coerenza tra feature online e offline dei modelli ne risentiva, compromettendo l'accuratezza di diversi modelli di rischio.

Precisione sub-secondo con Spark Real-Time Mode

Per superare questi limiti di latenza e di costo, Coinbase ha migrato i propri modelli di rischio critici a Spark Real-Time Mode (RTM) su Databricks. L'adozione di RTM è stata semplice: il team di ingegneria ha dovuto solo aggiornare il tipo di trigger, mantenendo invariata la logica di business. Il passaggio a RTM ha portato a un significativo miglioramento delle prestazioni, passando dall'elaborazione microbatch allo streaming in tempo reale e riducendo la latenza da oltre 800 ms a 100-250 ms su larghissima scala.

Questa transizione ha immediatamente migliorato la freschezza dei dati nelle pipeline ML, aumentando la coerenza e producendo modelli allineati ai sistemi operativi aggiornati in tempo reale. Per garantire un'adozione senza attriti, il team di piattaforma ha implementato guardrail di Continuous Integration (CI) e creato agenti AI per automatizzare la configurazione delle feature in streaming, integrando RTM senza soluzione di continuità nel feature store esistente.

"I nostri ingegneri di machine learning non hanno dovuto imparare le complessità del Real-Time Mode", ha osservato Kamila Wickramarachchi, Software Engineer di Coinbase. "Noi abbiamo semplicemente introdotto enormi miglioramenti in termini di freschezza e coerenza dei dati, e loro hanno subito riconosciuto il valore dei risultati."

Insight più rapidi a una frazione del costo

Con l'implementazione di RTM, Coinbase ha migliorato la propria capacità di mitigare le frodi, garantendo che i modelli di rischio operino sui dati di transazione più aggiornati. La latenza è scesa a livelli di aggiornamento inferiori al secondo, raggiungendo 150 ms per le aggregazioni di feature in streaming stateless e 250 ms per quelle in streaming stateful. La coerenza tra feature online e offline è migliorata di fino al 98%.

Questo cambiamento architetturale ha permesso al team di raggiungere notevoli livelli di scala e velocità. Come ha spiegato Daniel Zhou, Senior Staff Machine Learning Platform Engineer di Coinbase, "Grazie al Real-Time Mode in Spark Structured Streaming, abbiamo ottenuto una riduzione di oltre l'80% delle latenze end-to-end, raggiungendo P99 inferiori a 100 ms e ottimizzando la nostra strategia di ML in tempo reale su larghissima scala. Queste prestazioni ci permettono di calcolare oltre 250 feature di ML utilizzando un unico motore Spark."

Oltre a migliorare le prestazioni, RTM ha consentito a Coinbase di dismettere i cluster specializzati e fortemente dimensionati precedentemente necessari per la modalità microbatch. Questo ha trasformato radicalmente la struttura dei costi, permettendo al team di dimezzare i costi di calcolo.

"Oltre agli enormi miglioramenti in termini di freschezza e coerenza dei dati, abbiamo ottenuto un'incredibile riduzione dei costi", ha aggiunto Wickramarachchi. "Stimiamo che questo cambiamento architetturale ci permetterà di risparmiare il 51% sui costi di calcolo già nel corso di quest'anno."

Scopri di più