schnellere Einblicke durch verbesserten IT-Vorgänge
schnellere Verarbeitung von Fahrzeug- und Straßendaten
kürzere Markteinführungszeit von neuen Innovationen
"Vor Databricks wäre die Markteinführungszeit Wochen gekommen, wenn nicht Monate, um die Analyseanforderungen für einige unserer Kunden zu erfüllen. Jetzt dauert es Stunden.“
Um Kunden noch mehr zu bieten, erfasst wejo Streaming-Daten von über 50 Millionen vernetzten Fahrzeugen und verarbeitet alle drei Sekunden Daten von OEMs und Satellitennavigationssystemen. Diese Daten bieten Einblicke, mit denen der Verkehrsfluss verbessert werden kann, wodurch Unfälle, Sicherheitsalarme und Rettungsdiensteinsätze reduziert werden können, bis hin zu neuen Innovationen bei der Optimierung des Parkens. Da verschiedene Datenströme aus mehreren unzusammenhängenden Quellen stammen, ist es sehr schwierig und ressourcenintensiv, die Erkenntnisse aus den Daten durch Data Science zu nutzen.
Riesige Datenvolumen: Das Unternehmen verarbeitet über drei Billionen Datenpunkte pro Monat, alles in einer Streaming-Umgebung vom Auto zum Marketplace in weniger als 40 Sekunden. Dies erfordert eine erhebliche Skalierung in einer Umgebung mit geringer Latenz.
Herausforderungen bei der Skalierung: Da so viele Daten aufgenommen werden mussten, hatte wejo Schwierigkeiten, sich auf Mapreduce-Cluster zu verlassen, deren Größe starr und in den verfügbaren Bibliotheken begrenzt war. Dies führte zu tagelanger Verzögerung, bis die richtigen Python-Module installiert waren, was Innovationen verlangsamte.
Geringe Leistung: Die Verarbeitung von Aufträgen mit langer Laufzeit kann Stunden, wenn nicht Tage dauern.
Databricks bietet wejo eine einheitliche Datenanalyseplattform, die eine skalierbare und kollaborative Umgebung in den Bereichen Data Science und Engineering gefördert hat. Diese Plattform ermöglicht Datenteams schnellere Innovationen. Außerdem können sie ML-gestützte Innovationen für die Automobilindustrie bereitstellen.
Die verwaltete Plattform in der Cloud vereinfacht die Bereitstellung von Computerclustern beliebiger Größe.
Die Unterstützung mehrerer Sprachen (SQL, Scala, Python, R) verbessert die Zusammenarbeit zwischen Data Engineering, Data Science und Analysten.
Dank der systemeigenen Unterstützung von Delta Lake kann das Data Engineering-Team sowohl Batch- als auch Streaming-Pipelines zuverlässig mit denselben Daten betreiben und skalieren.
Mit Databricks ist wejo jetzt in der Lage, Datenverarbeitung und Machine Learning in großem Maßstab schneller und günstiger durchzuführen. Am wichtigsten ist jedoch, dass das Unternehmen jetzt in der Lage ist, die Ergebnisse über das gesamte Team und das gesamte Unternehmen hinweg einfach zu teilen, sodass andere Beteiligte Innovationen auf den Markt bringen können.
Verbesserte betriebliche Effizienz: Funktionen wie die automatische Skalierung von Clustern haben Data Engineering-Vorgänge verbessert und Pipelines für nachgelagerte Analytics von Wochen auf Minuten beschleunigt.
Bessere teamübergreifende Zusammenarbeit: Die gemeinsame Notebook-Umgebung mit Unterstützung für mehrere Sprachen hat die Teamproduktivität verbessert.
Schnellere Gewinnung von Einblicken: Mit Databricks erzielen wir jetzt einen über 20-fachen Leistungsvorteil gegenüber Open-Source-Spark und eine Verkürzung der Markteinführungszeit um 90 %.