Revenir au contenu principal

Le rôle essentiel de la gouvernance des données dans les communications, les médias et le divertissement

par Bryan Saftler

La gouvernance des données, de l'analytique et de l'IA est peut-être l'aspect le plus important et le plus difficile de tout effort de démocratisation des données et de l'IA. Pour vos besoins en données, analytique et IA, vous avez probablement déployé deux systèmes différents : des entrepôts de données pour la business intelligence et des lacs de données pour l'IA. Et maintenant, vous avez créé des silos de données avec des mouvements de données entre deux systèmes, chacun avec un modèle de gouvernance différent.

Mais les données ne se limitent pas aux fichiers ou aux tables. Vous disposez également d'actifs tels que des tableaux de bord, des modèles ML et des notebooks, chacun avec ses propres modèles d'autorisation, ce qui rend difficile la gestion cohérente des autorisations d'accès pour tous ces actifs. Le problème s'aggrave lorsque vos actifs de données existent sur plusieurs clouds avec différentes solutions de gestion des accès. Bonne nouvelle, il existe un moyen d'unifier la gouvernance des données. Mais pourquoi devriez-vous vous en soucier ?

Sans une gouvernance des données robuste, les équipes des entreprises ne peuvent pas comprendre pleinement leur public, générer de meilleurs résultats commerciaux sur le plan opérationnel et tout au long du cycle de vie du consommateur, ou contrôler les biais algorithmiques et axés sur les données. À mesure que les modèles d'IA deviennent plus complexes, il est essentiel de comprendre comment ils sont gouvernés et comment ils interagissent avec les actifs de données internes et externes.

Les DSI comprennent cela. En fait, 98 % des DSI déclarent que l'évolution vers une approche unifiée et cohérente de la gouvernance est importante, comme le révèle le MIT Technology Report co-développé par Databricks : Bringing Breakthrough Data Intelligence to Industries.

Pas d'expériences personnalisées sans données gouvernées

Dans le monde trépidant des communications, des médias et du divertissement, les publics exigent des expériences personnalisées adaptées à leurs préférences uniques. Cela nécessite une compréhension approfondie des données utilisateur, de leurs habitudes de consommation de contenu et de leur engagement sur les flux de clics, ainsi que des informations démographiques, des achats passés et des transactions. Cependant, ces données sont souvent cloisonnées dans divers systèmes et plateformes, ce qui rend difficile l'obtention d'une vue unifiée du client. Une gouvernance des données efficace est essentielle pour consolider et harmoniser ces données disparates, permettant aux entreprises de médias de construire un profil à 360 degrés de leur public. À partir de ce profil à 360 degrés, les équipes peuvent mieux construire des modèles et des systèmes d'IA autour d'expériences hyper-personnalisées, de recommandations de contenu, et plus encore, qui maintiennent l'engagement du public et le fidélisent.

À mesure que les modèles d'IA deviennent plus complexes, il est crucial de comprendre comment ils interagissent avec les données qui les alimentent. Des pratiques de gouvernance des données robustes garantissent la transparence et l'explicabilité des informations alimentées par l'IA. Ceci est réalisé en maintenant une lignée de données détaillée, une provenance et des métriques de qualité qui permettent aux équipes de données de retracer les origines et les transformations des données utilisées pour entraîner les modèles d'IA.

Établir une stratégie de gouvernance des données prête pour l'IA

Cela signifie qu'une gouvernance des données robuste n'est plus une option, mais une nécessité. Selon McKinsey & Company, les entreprises qui manquent d'une gouvernance des données efficace perdent jusqu'à 29 % du temps de leur personnel en tâches improductives en raison d'une mauvaise qualité des données. Pourtant, malgré son rôle essentiel dans l'amélioration de la qualité des données et de la prise de décision, la gouvernance des données n'augmente souvent pas directement les profits, ce qui amène certaines entreprises à la reléguer aux départements informatiques plutôt qu'à la traiter comme une priorité stratégique.

Pour que la gouvernance des données transforme une organisation, elle doit être dirigée par les cadres supérieurs. Avec l'augmentation des mandats gouvernementaux, des rôles tels que Chief AI Officer et Chief Data Officer (CDO) pilotent désormais l'initiative. Ceci est particulièrement important pour l'IA, qui repose sur le contexte commercial en plus des données sous-jacentes. Lors du lancement d'un programme de gouvernance des données, la première étape du CDO est d'obtenir le soutien de l'entreprise. Cela implique la mise en place de deux entités clés : le Bureau de gestion des données (DMO) pour établir les politiques, et un Conseil des données composé de chefs d'entreprise pour définir les priorités et assurer la conformité. Une stratégie cruciale consiste à se concentrer sur des domaines de données spécifiques, tels que les données clients ou produits, pour rendre l'initiative gérable et alignée sur les objectifs stratégiques. Cette approche ciblée permet d'éviter que la portée écrasante de la gouvernance des données ne fasse dérailler le programme. Démontrer les avantages commerciaux tangibles de la gouvernance des données est essentiel pour maintenir le financement et le soutien des dirigeants. Le DMO joue un rôle essentiel dans la documentation des succès et la communication de la valeur d'un investissement continu, garantissant que la gouvernance des données reste une priorité même après la résolution des problèmes immédiats.

Unity Catalog prend en charge la gouvernance des données

Lors de la définition des normes de gouvernance des données, le DMO doit examiner attentivement la manière dont les données sont créées et accessibles dans toute l'entreprise. Bien qu'un certain niveau de redondance des données soit souvent inévitable, notamment à des fins opérationnelles, les avancées des capacités d'analyse permettent désormais aux organisations de consolider leur infrastructure d'analyse. Plutôt que de maintenir un paysage fragmenté d'entrepôts de données autonomes, de data marts, de lacs de données et de plateformes de science des données spécialisées, les organisations devraient envisager de consolider ces environnements disparates dans une plateforme de données unifiée à l'échelle de l'entreprise. Cette approche centralisée peut mieux soutenir l'ensemble des besoins analytiques de l'entreprise.

La plateforme Databricks Data Intelligence Platform a été construite dès le départ avec cette vision d'une approche unifiée des données et de l'analytique. Alimentée par une couche de gestion des données dans Delta Lake capable de travailler avec des données structurées et non structurées provenant de sources internes et externes avec performance et rentabilité, Databricks permet aux organisations de consolider tous leurs actifs d'information orientés analytique au sein d'une plateforme unique et unifiée.

Avec la prise en charge du traitement en temps réel et par lots, la plateforme Databricks permet aux ingénieurs de données de traiter et de fournir des informations à l'entreprise à la vitesse nécessaire pour soutenir un résultat commercial souhaité. Avec une intégration avec toutes les plateformes modernes de business intelligence et de découverte de données du marché actuel, ainsi qu'une prise en charge robuste des charges de travail de machine learning et d'IA, y compris l'IA générative, Databricks est capable de répondre à l'ensemble des besoins analytiques de l'organisation.

La plateforme Databricks Data Intelligence Platform devient rapidement la norme de l'industrie pour la gestion innovante des données. C'est là qu'intervient Unity Catalog. Unity Catalog révolutionne la gouvernance des données en offrant une couche unifiée et transparente pour la gestion des données structurées et non structurées, des modèles de machine learning et divers autres actifs numériques sur n'importe quel cloud ou plateforme. En conséquence, Unity Catalog permet aux professionnels des données d'accéder et de collaborer en toute sécurité sur des données fiables, en tirant parti de l'intelligence artificielle pour améliorer la productivité et exploiter pleinement les capacités de l'architecture lakehouse. Ceci est particulièrement important en raison des réglementations sur la confidentialité des données telles que le Règlement Général sur la Protection des Données (RGPD) et le California Consumer Privacy Act (CCPA), où la lignée des données est une considération critique lors de la prise en compte du « droit à l'oubli ». Ces réglementations exigent que les organisations soient capables d'identifier l'origine et le flux des données personnelles, afin de pouvoir les localiser et les supprimer sur demande.

Les organisations de médias et de divertissement opèrent souvent dans un environnement multi-cloud, avec des données et des applications réparties sur diverses plateformes cloud. Databricks Unity Catalog simplifie le modèle d'autorisation et la gouvernance des actifs de données, quelle que soit leur localisation, en fournissant une couche unique et unifiée pour la gestion des données structurées et non structurées, des modèles de machine learning et d'autres actifs numériques sur n'importe quel cloud ou plateforme.

Les principaux facilitateurs disponibles via Unity Catalog comprennent :

  • Visibilité unifiée sur les données et l'IA
  • Modèle d'autorisation unique pour les données et l'IA
  • Audit intégré, lignée et application de la qualité des données
  • Surveillance et observabilité basées sur l'IA
  • Partage de données ouvert sans copie, sans ETL, au sein et entre les limites de l'entreprise

Cette approche unifiée de la gouvernance accélère les initiatives de données et d'IA tout en simplifiant la conformité réglementaire. Pour un nombre croissant d'organisations, Unity Catalog, en tant que composant central de la plateforme Databricks, est devenu la pierre angulaire de leur stratégie de gouvernance des données d'entreprise.

Libérer tout le potentiel de l'IA générative

Alors que l'industrie des médias et du divertissement continue d'adopter la puissance de l'IA générative, la gouvernance des données sera la clé pour en libérer tout le potentiel. En garantissant la qualité, la sécurité et l'accessibilité des données qui alimentent ces modèles d'IA, les organisations peuvent stimuler l'innovation, créer du contenu plus attrayant et offrir des expériences exceptionnelles à leur public.

La gouvernance des données n'est pas seulement une exigence de conformité, c'est un impératif stratégique. En adoptant une approche de gouvernance axée sur les données et dirigée par l'entreprise, les organisations peuvent libérer tout le potentiel de leurs initiatives de données et d'IA, en offrant des expériences personnalisées, en stimulant l'innovation et en assurant le succès à long terme dans le paysage médiatique en constante évolution.

Télécharger l'ebook

(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original

Recevez les derniers articles dans votre boîte mail

Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.