Revenir au contenu principal
PLEIN FEUX SUR UN PRODUIT LAKEHOUSE : UNITY CATALOG

Des insights plus rapidement grâce à la gouvernance des données unifiée

Plus rapide

L'onboarding des nouveaux collaborateurs se fait en quelques minutes au lieu de plusieurs jours

Plus simple

Rationalisez la gestion des accès et des contrôles d'audit

Plus puissant

Libérez tout le potentiel des données d'IoT

CAS D’USAGE PLATEFORME: Lakehouse,Delta Lake,Unity Catalog
Cloud: AWS

« Avec Unity Catalog, nous mettons rapidement et facilement les données à disposition de tous les membres de l'entreprise qui traitent des charges de travail BI et ML, et ce en toute sécurité. La gestion des accès est centralisée et nous appliquons des contrôles d'audit à l'aide d'autorisations SQL classiques et standardiséss. »

– Eric Barault, Solutions Architect and DevOps Lead, GreenFlex

GreenFlex est un leader européen dans le domaine de la gestion environnementale, de l'efficacité énergétique et de la gestion de l'impact environnemental. GreenFlex accompagne ses clients dans la transition vers un développement plus durable, la décarbonation et l'efficacité énergétique. Pour cela, l'entreprise recueille les données de consommation de ses clients et s'appuie sur le machine learning pour identifier les anomalies et élaborer les stratégies énergétiques les mieux adaptées à leurs besoins. Avec les années, la quantité de données collectées et analysées par l'entreprise a augmenté de façon exponentielle. Il fallait à GreenFlex un moyen plus simple de gérer et administrer les données collectées, de les sécuriser et de les rendre exploitables à des fins d'exploration, de business intelligence et d'autres cas d'utilisation du ML. Grâce à la plateforme Databricks Lakehouse, GreenFlex a pu moderniser son infrastructure de données. L'entreprise exploite des téraoctets de données de consommation pour élaborer des stratégies d'optimisation énergétique data-driven. L'objectif : aider ses clients à réduire leur consommation énergétique.

Une gestion plus simple de l'accès aux données avec Unity Catalog

GreenFlex s'appuie sur la plateforme lakehouse Databricks pour importer des téraoctets de données IoT touchant à la consommation énergétique de ses clients, puis réaliser des analyses et des opérations de ML. Cependant, pour mettre les données à la disposition de son équipe, l'entreprise a maintenu trois espaces de travail non connectés dédiés aux charges de travail de développement, de préparation et de production. Les données étaient inscrites dans le metastore Hive local de chaque espace de travail avec un bucket AWS S3 séparé. Cette approche était complexe et les contrôles d'accès et de sécurité sur les tables de chaque espace de travail étaient pénibles à gérer. Cela créait également des problèmes en termes de disponibilité des données sur les trois espaces de travail.

Unity Catalog a permis à GreenFlex de simplifier la gestion des accès en fournissant une interface unique pour le pilotage des autorisations d'accès grâce à une base de données SQL classique et standardisée. En utilisant un seul metastore Unity Catalog pour tous leurs espaces de travail, les administrateurs de données GreenFlex définissent désormais des politiques d'accès une fois pour toutes au niveau du compte et ils les appliquent à tous les espaces de travail. La gestion des données s'en trouve considérablement simplifiée : l'entreprise n'a plus besoin de gérer des buckets AWS S3 pour chaque espace de travail. Par ailleurs, en centralisant les contrôles d'audit, les administrateurs de données GreenFlex peuvent suivre l'utilisation des données sur les différents espaces de travail – un vrai point fort pour la conformité et la préparation aux audits.

« Associé à Unity Catalog, Delta Lake a permis de résoudre de nombreux problèmes et a considérablement amélioré la performances de requêtes portant sur des téraoctets de données. Nous pouvons désormais auditer les accès aux données et remonter dans le temps. Grâce à des partitions bien définies, nous exploitons tout le potentiel de nos données. Un processus de raffinement les fait passer du statut de tables Bronze à celui de tables Gold, et de l'exploration à la business intelligence et à la data science, » explique Eric Barault, Solutions Architect and DevOps Lead chez GreenFlex.

Rationaliser la disponibilité des données, un moteur pour l'innovation

Grâce au Unity Catalog, GreenFlex a centralisé la gouvernance de ses données et la gestion des accès. Pour l'entreprise, cela se traduit par un onboarding bien plus rapide des nouveaux collaborateurs, qui reçoivent leurs accès en quelques minutes et non plus en une semaine. Les data engineers et les data scientists de GreenFlex ont ainsi bien plus de temps à consacrer à des tâches à valeur ajoutée telles que l'expérimentation avec des données ou le développement de nouvelles solutions.

Les développeurs de GreenFlex ont également la possibilité de créer des tables à partir de nouvelles données et d'en gérer plus rapidement les permissions – un vrai gain de temps pour les opérations data. Alors qu'il fallait auparavant des jours pour bien comprendre et réaliser les tâches liées aux permissions, les administrateurs de données de GreenFlex peuvent désormais y parvenir en quelques minutes, tout en maîtrisant parfaitement l'impact des changements. Cela permet à l'entreprise de consacrer plus de temps à aider ses clients à réduire leur consommation d'énergie et à améliorer leurs indicateurs de développement durable.