Témoignage de client

La migration vers le cloud s'impose dans une nouvelle ère de la vente au détail data-driven

70 %

Reduction in data pipeline creation time

48x

Faster ETL workloads

image d'arrière-plan

“More business units are using the platform in a self-service manner that was not possible before. I can’t say enough about the positive impact that Databricks has had on Columbia.”

— Lara Minor, Senior Enterprise Data Manager, Columbia Sportswear

Columbia est une entreprise data-driven : elle intègre les données de tous les systèmes métier pour gérer les activités de gros et de détail de l'ensemble de ses marques. Son infrastructure héritée d'ETL et d'analytique ne suffisait pas pour prendre en charge à la fois les cas d'usage par lots et en temps réel à grande échelle, ce qui l'empêchait de répondre aux exigences des équipes métier et de données. Depuis la migration vers Databricks, l'entreprise traite et prépare les données avec davantage d'efficacité et de fiabilité : elle produit ainsi de précieux insights qui permettent de prendre des décisions commerciales plus judicieuses

Des systèmes d'analytique hérités à la fois lents et coûteux

Alors que le secteur du retail se numérise rapidement sur tous les canaux, Columbia fait figure de pionnier dans l'exploitation des données sur l'ensemble des domaines d'activité : ventes, achats, chaîne logistique et optimisation des produits. L'entreprise voulait par exemple comprendre comment exploiter les insights liés à la géographie, l'affinité de marque, les marges brutes et les coûts pour améliorer ses opérations et prendre des décisions plus intelligentes. Elle cherchait également à utiliser les données d'engagement client provenant des avis et des commentaires pour améliorer les campagnes marketing et le support client.

L'entreprise avait des trésors de données à portée de main. Mais le traitement des données – que ce soit par lot ou en temps réel – n'était pas à la hauteur des accords de niveau de service internes pour l'analytique et le reporting. L'équipe de gestion des informations de l'entreprise (EIM) était freinée par un outillage ELT trop spécialisé et des data warehouses obsolètes, segmentés et peu évolutifs. Elle voulait libérer l'accès à des données organisées pour répondre aux besoins des différentes équipes de données et des décideurs métier, mais elle parvenait difficilement à mettre en place les pipelines de données nécessaires. Très rigide, l'infrastructure coûtait cher à gérer et élargir, ce qui constituait un problème face à l'augmentation des demandes d'accès aux données.

« Il fallait parfois des semaines à nos systèmes hérités pour traiter les données à des fins d'analytique et de reporting, » explique Lara Minor, senior enterprise data manager chez Columbia Sportswear. « Nous étions donc incapables de prendre en charge certains cas d'usage, une vraie source d'insatisfaction pour les analystes et les fonctions métier. »

Des décideurs aux data analysts et data scientists, beaucoup d'équipes convoitent les données de toute l'entreprise. Il fallait donc changer la plateforme du système d'analytique et migrer vers le cloud pour gagner en agilité et en rentabilité à grande échelle. Il fallait également rationaliser la préparation des données et l’ETL, tout en offrant aux parties prenantes un accès plus facile et plus sûr aux données indispensables pour prendre des décisions plus intelligentes.

Mettre les données à disposition de ceux qui en ont besoin, le plus rapidement possible

En adoptant Microsoft Azure, l’équipe EIM de Columbia a eu accès à Azure Databricks et Delta Lake pour mettre à niveau ses capacités de traitement et d’analytique des données. « Nous voulions une solution évolutive, élastique et plus économique, » explique Lara Minor. « Azure et Databricks remplissent ces trois critères. »

Avec Databricks, l'équipe crée désormais des pipelines ETL hautes performances capables de traiter les charges de travail par lots et en temps réel. Les pipelines alimentent le Delta Lake qui offre un accès sécurisé aux données organisées. « Delta Lake offre des fonctionnalités ACID qui simplifient les opérations de pipeline de données afin d'améliorer leur fiabilité et leur cohérence, » détaille Lara Minor. Parallèlement à cela, des fonctionnalités telles que la mise en cache et l'indexation automatique permettent un accès efficace et performant aux données. »

Une fois les données ingérées, elles sont acheminées vers différents points de terminaison de l’entreprise en fonction de l’utilisateur final et du cas d’usage. Des analystes métier peuvent par exemple se connecter directement à PowerBI pour produire des rapports de vente nécessitant des informations à la demande en temps presque réel. Ils peuvent ensuite créer des notebooks Databricks interactifs pour mettre ces données à la disposition des data scientists qui vont explorer et entraîner des modèles. Les données peuvent aussi être envoyées dans un outil d'entreposage des données pour les cas d'usage combinant faible latence et haute simultanéité. Toutes les équipes qui ont besoin d'accéder à des données peuvent désormais avoir pleinement confiance dans leur fiabilité et leur cohérence.

Des pipelines de données et des insights plus rapides

Il est indispensable de réduire les temps de traitement pour fournir rapidement des insights à l'entreprise. Databricks a permis à l’équipe EIM de Columbia d'accélérer l'ETL et la préparation des données, en réduisant de 70 % le temps de création du pipeline ETL et le temps de traitement des charges de travail ETL de 4 heures à seulement 5 minutes – c'est 48 fois plus rapide qu'auparavant.

Munis d'une plateforme évolutive et performante capable de traiter les charges par lot et temps réel, toutes les catégories d'utilisateurs de données ont maintenant la possibilité de prendre de meilleures décisions qui bénéficient aux opérations de l'entreprise, sans dépendre de l'équipe EIM.

« Cette plateforme présente un grand avantage : les utilisateurs la prennent en main très rapidement. Toutes les données y sont rassemblées, et de plus en plus d'unités commerciales l'utilisent en self-service, alors que c'était impossible auparavant, » affirme Lara Minor. « Je suis extrêmement impressionnée par l'impact positif qu'a eu Databricks sur Columbia. »

La disponibilité immédiate de données triées et organisées permet d'axer de nombreux cas d'usage sur les données : prévision de la demande des clients, analyse des avis sur les produits et amélioration de la satisfaction des clients. Comme le pense également Lara Minor, il n'y a pas de limite aux usages que l'équipe peut faire des données pour prendre des décisions plus judicieuses et façonner l'avenir de l'entreprise.