Kundenbericht

Der Umstieg in die Cloud läutet eine neue Ära des datengesteuerten Einzelhandels ein

70 %

Reduction in data pipeline creation time

48x

Faster ETL workloads

Hintergrundbild

“More business units are using the platform in a self-service manner that was not possible before. I can’t say enough about the positive impact that Databricks has had on Columbia.”

— Lara Minor, Senior Enterprise Data Manager, Columbia Sportswear

Columbia ist ein datengesteuertes Unternehmen, das Daten aus allen Systemen seiner Geschäftssparten integriert, um seine Groß- und Einzelhandelsgeschäfte über alle seine Marken hinweg zu verwalten. Seine veraltete ETL- und Analytics-Infrastruktur konnte jedoch weder Batch- noch Echtzeit-Anwendungsfälle im großen Maßstab unterstützen, wodurch es nicht in der Lage war, die Anforderungen der Geschäfts- und Datenteams zu erfüllen. Nach der Migration zu Databricks können Daten nun effizienter und zuverlässiger verarbeitet und aufbereitet werden. Dies ermöglicht wertvolle Einblicke, die für intelligentere Geschäftsentscheidungen erforderlich sind.

Ältere Analytics-Systeme, die teuer und langsam waren

Während der Einzelhandel über alle Kanäle hinweg weiter digitalisiert, nimmt Columbia eine führende Position bei der Nutzung von Daten in allen Geschäftsbereichen ein, um Umsatz, Einkauf, Lieferkette und Produktoptimierung zu beeinflussen. Das Unternehmen wollte beispielsweise verstehen, wie Einblicke in Bezug auf Geografie, Markenaffinität, Bruttomargen und Kosten genutzt werden können, um den Betrieb zu verbessern und intelligentere Entscheidungen zu treffen. Oder wie es Kundeninteraktionsdaten aus Produktbewertungen und Kommentaren nutzen kann, um Marketingkampagnen zu optimieren und den Kundenservice zu verbessern.

Mit einer riesigen Menge verfügbarer Daten war die Verarbeitungseffizienz von Batch- und Echtzeitdaten für nachgelagerte Analysen und Berichte nicht ausreichend, um interne Service Level Agreements zu erfüllen. Das EIM-Team (Enterprise Information Management) wurde durch spezielle ETL-Tools und veraltete Data Warehouses ausgebremst, die isoliert und komplex zu skalieren waren. Außerdem hatte es Schwierigkeiten, Datenpipelines effizient zu erstellen, die den Zugriff auf kuratierte Daten für verschiedene Datenteams und Geschäftsbeteiligte ermöglichen. Darüber hinaus war die Infrastruktur starr und kostspielig zu verwalten und zu skalieren, was problematisch war, da die Anzahl der Personen, die Zugriff auf Daten brauchten, gestiegen ist.

„Mit unseren Legacy-Systemen brauchten wir Wochen, um Daten für Analytics und Berichterstattung zu erhalten“, erklärte Lara Minor, Senior Enterprise Data Managerin bei Columbia Sportswear. „Infolgedessen konnten wir eine Vielzahl von Anwendungsfällen nicht unterstützen, was sich auf die Zufriedenheit von Analysten und Geschäftsbereichen auswirkte.“

Das Unternehmen mit seinen verschiedenen Teams von Führungskräften über Datenanalysten bis hin zu Data Scientists, die alle um unternehmensweite Daten wetteiferten, erkannte, dass es sein Analytics-System in die Cloud umstellen musste, um mehr Agilität und Kosteneffizienz im großen Maßstab zu ermöglichen. Außerdem musste es die Datenvorbereitung und ETL optimieren und gleichzeitig den Zugriff auf die Daten, die es für intelligentere Entscheidungen benötigte, einfacher und sicherer gestalten.

Daten so schnell wie möglich an diejenigen weitergeben, die sie benötigen

Das EIM-Team von Columbia entschied sich für einen Wechsel zu Microsoft Azure, womit Azure Databricks und Delta Lake zur Aktualisierung seiner Datenverarbeitungs- und Analytics-Funktionen verwenden kann. „Wir suchten nach etwas, das skalierbar, elastisch und kostengünstiger war“, sagte Minor. „Azure und Databricks erfüllten diese Anforderungen.“

Mit Databricks kann Columbia jetzt leistungsstarke ETL-Pipelines erstellen, die Batch- und Echtzeit-Workloads unterstützen. Die Pipelines speisen Delta Lake, der einen sicheren Zugriff auf kuratierte Daten bietet. „Delta Lake bietet ACID-Funktionen, mit denen sich der Betrieb von Datenpipelines vereinfachen lässt. Dadurch konnten wir die Zuverlässigkeit der Pipelines und die Datenkonsistenz verbessern“, so Minor. „Gleichzeitig ermöglichen Funktionen wie Caching und Auto-Indizierung einen effizienten und leistungsstarken Zugriff auf die Daten.“

Sobald die Daten aufgenommen sind, können sie je nach Endbenutzer und Anwendungsfall an verschiedene Endpunkte im Unternehmen weitergeleitet werden. Geschäftsanalysten können beispielsweise eine direkte Verbindung zu PowerBI herstellen, um Vertriebsberichte zu erstellen, für die Informationen nahezu in Echtzeit und auf Abruf erforderlich sind. Sie können Daten über die interaktiven Notebooks von Databricks zugänglich machen, damit Data Scientists Modelle untersuchen und trainieren können. Oder sie können Daten für Anwendungsfälle mit geringer Latenz und hohen Gleichzeitigkeitsanforderungen an ihr Data Warehousing-Tool senden. Unabhängig davon, welches Datenteam Zugriff auf die Daten benötigt, kann es davon ausgehen, dass die Daten zuverlässig und konsistent sind.

Schnellere Datenpipelines, Einblicke in kürzerer Zeit

Kürzere Datenverarbeitungszeiten sind entscheidend, damit das Unternehmen schnell Dateneinblicke erhält. Databricks hat das EIM-Team von Columbia dabei unterstützt, ETL und Datenvorbereitung zu beschleunigen und die Erstellungszeit von ETL-Pipelines um 70 % zu reduzieren. Gleichzeitig konnte die Zeit für die Verarbeitung von ETL-Workloads von 4 Stunden auf nur 5 Minuten reduziert werden, was einer 48-fachen Verbesserung entspricht.

Mit einer skalierbaren und leistungsfähigen Plattform, die Batch- und Echtzeit-Workloads besser unterstützt, können verschiedene Datenbenutzer nun intelligentere Entscheidungen mit Auswirkung auf den Geschäftsbetrieb treffen, ohne übermäßig vom EIM-Team abhängig zu sein.

„Einer der Vorteile dieser Plattform ist der schnelle Zugriff für unsere Mitarbeiter. All diese Daten kommen rein, und immer mehr Geschäftsbereiche nutzen sie im gesamten Unternehmen auf eine Selfservice-Weise, die zuvor nicht möglich war“, sagte Minor. „Ich kann den positiven Einfluss nicht genug loben, den Databricks auf Columbia hatte.“

Mit kuratierten Daten werden Anwendungsfälle – von der Prognose der Verbrauchernachfrage bis hin zur Analyse von Produktbewertungen zur Steigerung der Kundenzufriedenheit – von Daten bestimmt. Minor ist sich sicher, dass das Team von Columbia Daten in immer größerem Umfang nutzen wird, um intelligentere Entscheidungen zu treffen und das Unternehmen in die Zukunft zu führen.