Potenziare l'auto connessa con l'AI
Estrazione di informazioni più veloce grazie al miglioramento dell'operatività IT
Elaborazione più rapida dei dati veicolari e stradali
Riduzione del time-to-market per le innovazioni
wejo è nata con l'ambizione di diventare il più grande produttore mondiale di auto connesse. A oggi, wejo ha gestito oltre 140 miliardi di miglia di dati e prevede di portare sulla propria piattaforma 17 milioni di auto entro la fine dell'anno. Con oltre 15 miliardi di data point al giorno, in continuo aumento, wejo si affida a Databricks per fare innovazione nell'industria automobilistica sfruttando il machine learning e per offrire esperienze di guida migliori.
Pipeline per 3.000 miliardi di data point al mese
Per offrire valore al cliente, wejo acquisisce dati in streaming da 50 milioni di veicoli connessi, elaborando i dati delle case costruttrici e dei navigatori satellitari ogni tre secondi. Questi dati forniscono informazioni approfondite per migliorare i flussi di traffico, ridurre gli incidenti, gestire gli avvisi di sicurezza e i servizi di emergenza, fino alle innovazioni più recenti nell'ottimizzazione dei parcheggi. Con svariati flussi di dati che giungono dalle sorgenti più disparate, sfruttare le informazioni ricavate dai dati attraverso la data science è molto difficile e richiede molte risorse.
Volumi di dati enormi: l'azienda elabora oltre tremila miliardi di data point al mese, in un ambiente di streaming che va dall'auto al mercato in meno di 40 secondi; per farlo, serve grande capacità di elaborazione in un ambiente a bassa latenza.
Problemi di scalabilità: con una tale quantità di dati, wejo aveva difficoltà con i cluster di Mapreduce, che hanno dimensioni rigide e librerie limitate. Si verificano così ritardi di giorni per l'installazione dei moduli Python corretti, rallentando il ciclo di innovazione.
Prestazioni lente: l'esecuzione dei lavori richiedeva ore, se non giorni, di elaborazione.
Pipeline di dati affidabili con prestazioni elevate su larga scala con Delta Lake
Databricks mette a disposizione di wejo una piattaforma di analisi unificata dalla quale è nato un ambiente di data science e data engineering scalabile e collaborativo, che aiuta i team a innovare più velocemente e a proporre all'industria automobilistica innovazioni basate sul ML.
La piattaforma gestita in cloud semplifica l'attivazione di cluster di calcolo di qualsiasi dimensione.
Il supporto di diversi linguaggi (SQL, Scala, Python, R) migliora la collaborazione fra data engineering, data science e analisti.
Il supporto nativo di Delta Lake consente al team di data engineering di eseguire e modulare in maniera affidabile le pipeline di dati in batch e in streaming sugli stessi dati.
Strade più sicure con le innovazioni del ML
Grazie a Databricks, wejo è ora in grado di elaborare dati su larga scala e sfruttare il machine learning con tempi più rapidi e costi inferiori. Ma, soprattutto, l'azienda può condividere facilmente i risultati con il team e l'intera organizzazione, consentendo ad altri di portare innovazioni sul mercato.
Maggiore efficienza operativa: funzionalità come l'autoscalabilità dei cluster hanno migliorato le attività di data engineering, accelerando le pipeline di analisi a valle da settimane a minuti.
Migliore collaborazione fra i team: l'ambiente dei notebook condivisi con supporto di diversi linguaggi ha aumentato la produttività dei team.
Estrazione di informazioni più veloce: l'azienda ha ottenuto prestazioni 20 volte superiori rispetto a Spark open-source con Databricks e una riduzione del time-to-market del 90%.