Direkt zum Hauptinhalt
Kundenbericht

Vernetzen von Fahrzeugen mit KI

50-mal

schnellere Einblicke durch verbesserten IT-Vorgänge

20-mal

schnellere Verarbeitung von Fahrzeug- und Straßendaten

90%

kürzere Markteinführungszeit von neuen Innovationen

wejo header image
INDUSTRY: Automotive
CLOUD: AWS

"Vor Databricks wäre die Markteinführungszeit Wochen gekommen, wenn nicht Monate, um die Analyseanforderungen für einige unserer Kunden zu erfüllen. Jetzt dauert es Stunden.“

– Steve Pimblett, Chief Information Officer und Data Officer, wejo

wejo wurde mit dem globalen Ziel gegründet, das weltweit größte Unternehmen für vernetzte Fahrzeuge zu sein. Bis heute hat wejo Daten von über 140 Milliarden Meilen kuratiert und erwartet, bis Ende des Jahres 17 Millionen Autos auf seiner Plattform zu haben. Mit täglich mehr als 15 Milliarden Datenpunkten vertraut wejo darauf, dass Databricks ML-basierte Innovationen für die Automobilindustrie liefert und bessere Fahrerlebnisse bietet.

Pipelines wurden erweitert, um 3 Billionen monatliche Datenpunkte aufzunehmen

Um Kunden noch mehr zu bieten, erfasst wejo Streaming-Daten von über 50 Millionen vernetzten Fahrzeugen und verarbeitet alle drei Sekunden Daten von OEMs und Satellitennavigationssystemen. Diese Daten bieten Einblicke, mit denen der Verkehrsfluss verbessert werden kann, wodurch Unfälle, Sicherheitsalarme und Rettungsdiensteinsätze reduziert werden können, bis hin zu neuen Innovationen bei der Optimierung des Parkens. Da verschiedene Datenströme aus mehreren unzusammenhängenden Quellen stammen, ist es sehr schwierig und ressourcenintensiv, die Erkenntnisse aus den Daten durch Data Science zu nutzen.

  • Riesige Datenvolumen: Das Unternehmen verarbeitet über drei Billionen Datenpunkte pro Monat, alles in einer Streaming-Umgebung vom Auto zum Marketplace in weniger als 40 Sekunden. Dies erfordert eine erhebliche Skalierung in einer Umgebung mit geringer Latenz.

  • Herausforderungen bei der Skalierung: Da so viele Daten aufgenommen werden mussten, hatte wejo Schwierigkeiten, sich auf Mapreduce-Cluster zu verlassen, deren Größe starr und in den verfügbaren Bibliotheken begrenzt war. Dies führte zu tagelanger Verzögerung, bis die richtigen Python-Module installiert waren, was Innovationen verlangsamte.

  • Geringe Leistung: Die Verarbeitung von Aufträgen mit langer Laufzeit kann Stunden, wenn nicht Tage dauern.

Zuverlässige, leistungsstarke Daten-Pipelines im großen Maßstab mit Delta Lake

Databricks bietet wejo eine einheitliche Datenanalyseplattform, die eine skalierbare und kollaborative Umgebung in den Bereichen Data Science und Engineering gefördert hat. Diese Plattform ermöglicht Datenteams schnellere Innovationen. Außerdem können sie ML-gestützte Innovationen für die Automobilindustrie bereitstellen.

  • Die verwaltete Plattform in der Cloud vereinfacht die Bereitstellung von Computerclustern beliebiger Größe.

  • Die Unterstützung mehrerer Sprachen (SQL, Scala, Python, R) verbessert die Zusammenarbeit zwischen Data Engineering, Data Science und Analysten.

  • Dank der systemeigenen Unterstützung von Delta Lake kann das Data Engineering-Team sowohl Batch- als auch Streaming-Pipelines zuverlässig mit denselben Daten betreiben und skalieren.

Mit ML-Innovationen die Straßen sicherer machen

Mit Databricks ist wejo jetzt in der Lage, Datenverarbeitung und Machine Learning in großem Maßstab schneller und günstiger durchzuführen. Am wichtigsten ist jedoch, dass das Unternehmen jetzt in der Lage ist, die Ergebnisse über das gesamte Team und das gesamte Unternehmen hinweg einfach zu teilen, sodass andere Beteiligte Innovationen auf den Markt bringen können.

  • Verbesserte betriebliche Effizienz: Funktionen wie die automatische Skalierung von Clustern haben Data Engineering-Vorgänge verbessert und Pipelines für nachgelagerte Analytics von Wochen auf Minuten beschleunigt.

  • Bessere teamübergreifende Zusammenarbeit: Die gemeinsame Notebook-Umgebung mit Unterstützung für mehrere Sprachen hat die Teamproduktivität verbessert.

  • Schnellere Gewinnung von Einblicken: Mit Databricks erzielen wir jetzt einen über 20-fachen Leistungsvorteil gegenüber Open-Source-Spark und eine Verkürzung der Markteinführungszeit um 90 %.