Le CDO de Howden Group explique pourquoi le modèle de produit de données s'effondre au rythme des acquisitions — et à quoi ressemble plutôt une couche de données prête pour les agents
par Aly McGue
Le guide traditionnel des données d'entreprise suppose un certain rythme. Vous concevez une stratégie, vous construisez la plateforme, vous intégrez les sources méthodiquement et vous déployez des produits pour chaque cas d'usage majeur. Le plan est l'artefact, et l'artefact est conçu pour durer.
Ce guide est aujourd'hui mis à l'épreuve d'une manière pour laquelle il n'a pas été conçu. Les entreprises qui se développent par acquisition, créent des flux de travail basés sur des agents et absorbent de nouvelles sources de données à grande vitesse découvrent que les stratégies conçues pour une époque plus lente deviennent des contraintes pour l'entreprise elle-même. L'architecture, la taxonomie et le modèle opérationnel qui fonctionnaient à un certain rythme commencent à s'opposer activement au suivant.
Barry Panayi est Group Chief Data Officer chez Howden, un courtier d'assurance, souscripteur et réassureur mondial présent dans plus de 50 pays et employant 25 000 personnes. Il y a cinq ans, l'entreprise comptait 10 000 collaborateurs. L'année dernière, elle a acquis plus d'une entreprise par semaine. Howden gère sa plateforme de données d'entreprise sur Databricks, consolidant plus de 100 sources de référence dans une architecture unifiée qui prend tout en charge, du reporting réglementaire aux analyses conversationnelles via Databricks Genie.
Dans ce blog, Barry explique pourquoi les choix de conception traditionnels ne sont plus adaptés à l'évolution de la consommation d'AI. Le modèle produit devient lourd. Le cycle de réconciliation devient coûteux. Le backlog de tableaux de bord devient le goulot d'étranglement. Ci-dessous, Barry présente ses arguments sur ce qu'il convient de construire à la place.
Aly McGue : Vous avez mentionné que le modèle d'un produit par cas d'usage commence à s'essouffler à un certain stade. Qu'entendez-vous par là, et par quoi est-il remplacé ?
Barry Panayi : J'ai commencé à constater que ce modèle devenait lourd. Si vous considérez votre couche de données comme un ensemble de services ouverts et gouvernés, elle devient beaucoup plus adaptable aux futures exigences de l'AI.
Nous allons fournir des données à des agents qui les feront circuler dans l'entreprise, et cela nécessite une mentalité de conception différente. Vous ne pouvez pas prédéfinir chaque cas d'usage lorsque les consommateurs ne sont plus seulement des tableaux de bord et des analystes. Les agents composeront les données de manière imprévue. Une couche de services anticipe cela. Un catalogue de produits, non.
C'est aussi pourquoi je conseille d'impliquer très tôt les personnes qui dirigent les processus et le travail sur les agents dans votre organisation. Pas après la construction de la plateforme.
Aly : Howden a acquis plus d'une entreprise par semaine l'année dernière. Quel est l'impact de ce rythme sur une organisation de données, et qu'est-ce qui a dû changer sur le plan de l'architecture ?
Barry : À mon arrivée, nous avions ingéré environ 80 sources de données, et il fallait environ six mois pour intégrer les données après une acquisition. Au rythme où nous acquérons des entreprises, cela signifiait que les gens créaient des silos ou récupéraient des données ailleurs parce qu'ils avaient besoin de résultats immédiatement. L'adoption était limitée au sein de nos divisions car nous n'avions tout simplement pas la couverture nécessaire.
Il ne s'agissait pas seulement d'une modernisation technique. Il s'agissait d'éliminer le coût de la fragmentation, de la lenteur de l'intégration et des doublons d'efforts. Sur le plan architectural, nous avons pris une direction différente. La configuration précédente gérait la masterisation des données et les contrôles de qualité plus en aval, plus près de la couche de reporting. Nous avions besoin que cela se produise le plus près possible de l'ingestion afin que les données soient exploitables plus rapidement. Ce changement modifie complètement le calendrier.
L'une des plus grandes forces de Howden est la collaboration entre les différentes entités de l'entreprise. Et ce qui alimente cela, ce sont les données. Vous devez savoir ce que votre collègue possède qui pourrait vous aider, et comment vous pourriez l'aider. Il y avait tellement d'opportunités commerciales que nous pouvions débloquer simplement en rendant les données visibles, même sans qu'elles soient entièrement ingérées et maîtrisées, juste visibles.
Aly : Lorsque vous disposez d'autant de sources, une même métrique peut exister sous plusieurs versions correctes. Comment avez-vous arrêté de faire perdre du temps à votre équipe en réconciliations manuelles ?
Barry : Nous pouvions avoir jusqu'à quatre versions d'un même point de données, et toutes étaient correctes dans leur propre contexte. Il n'y avait pas de modèle de données ou de taxonomie commune, de sorte que mon équipe consacrait beaucoup d'efforts à déterminer quelle version était la bonne pour une réponse donnée.
Les dirigeants obtenaient toujours ce dont ils avaient besoin. Nous nous assurions que les chiffres concordaient. Mais la réconciliation manuelle prenait du temps et des ressources qui auraient pu être consacrées à des tâches à plus forte valeur ajoutée. Depuis, nous avons construit un modèle de données standard, le modèle de données Accord, parallèlement à la plateforme. Cela codifie la logique de sorte que la réconciliation soit intégrée plutôt que de dépendre de la vigilance des collaborateurs à chaque fois.
C'est là le point essentiel. Si votre taxonomie n'est pas codifiée, votre équipe devient le moteur de réconciliation. C'est une taxe que vous payez à chaque cycle de reporting, et elle se développe avec l'entreprise, mais exactement dans la mauvaise direction.
Aly : De nombreuses entreprises disposent d'un portefeuille de pilotes d'AI qui ne passent jamais à l'échelle. Qu'est-ce qui a changé chez Howden ?
Barry : Comme pour beaucoup d'organisations, nos débuts ont été consacrés à l'exploration, ce qui signifie que nous construisions des cas d'usage uniques à partir de zéro. C'était une phase nécessaire pour voir ce qui était possible, mais pour passer véritablement à l'échelle, nous devions arrêter de tout reconstruire pour chaque division. Aujourd'hui, grâce à notre utilisation de la plateforme Databricks, nous disposons de pipelines standardisés, de code partagé et d'actifs de données réutilisables. Nous pouvons réaliser des analyses cross-domaines, en mélangeant les données clients, les données de risque et les données de marché, en les construisant une seule fois au lieu de les recréer par division.
Nous disposons désormais d'un pipeline de cas d'usage d'AI à l'échelle du groupe. Nous travaillons encore sur la mise en production des modèles afin qu'ils puissent être consommés comme des services cohérents, et c'est une lacune que j'admets volontiers. Mais la transition entre des expérimentations isolées et une capacité évolutive est bien réelle. Nous ne serions capables de rien faire de tout cela sans cette vue unifiée.
Aly : Dans un secteur qui n'évolue pas à la vitesse transactionnelle du commerce de détail, en quoi des données plus rapides changent-elles réellement la donne ?
Barry : Ce qui importe énormément, c'est de réduire ce que j'appelle le délai d'obtention des insights (insight lag), c'est-à-dire l'écart entre le moment où une donnée existe quelque part dans l'entreprise et celui où quelqu'un peut réellement l'utiliser.
Notre activité est principalement le courtage. Cela signifie qu'il faut donner aux courtiers les insights les plus récents possibles avant qu'ils ne s'entretiennent avec un client. Auparavant, nos rapports étaient lents et basés sur des traitements par lots (batch). Les données n'étaient pas fausses, mais le temps que vous les voyiez, elles étaient déjà obsolètes. Cela ne crée pas un problème de confiance, mais un problème d'utilité. Vous pilotez en regardant dans le rétroviseur.
Désormais, lorsqu'un courtier se rend chez un client, il peut lui dire : "Voici ce que nous constatons actuellement dans notre portefeuille, voici le benchmarking, voici notre vision interne." Nos données constituent notre IP. Peu d'entreprises opèrent sur l'ensemble de la chaîne de valeur de l'assurance comme nous le faisons. Je serais fou de ne pas m'assurer que nous diffusons ces insights rapidement, et il nous serait impossible de le faire avec la fragmentation que nous connaissions auparavant.
Aly : Quel a été le catalyseur du déploiement de Genie, et qu'est-ce qui a changé dans la façon dont les utilisateurs obtiennent des réponses ?
Barry : La question que l'on m'a posée, peut-être même lors de mon entretien d'embauche, était : pourquoi ne pouvons-nous pas simplement discuter avec nos données ? La logique était simple. Les gens discutent avec l'internet tout entier via ChatGPT. Alors pourquoi ne pourraient-ils pas poser une question sur les données de leur propre entreprise et obtenir une réponse rapide ?
Il y a deux aspects à cela. Le premier est la vitesse pure. Quelqu'un se pose une question, la réponse consiste en quelques chiffres ou un graphique rapide, et Genie s'en charge. L'autre aspect est ce que cela libère. Sans cela, quelqu'un demande le top 10 des clients selon une métrique. Un analyste s'en empare, clarifie la question, écrit une requête, construit un tableau de bord qui devient inévitablement plus complexe qu'il ne devrait l'être. Ce cycle est lent. Dans notre activité de vente au détail aux US, qui était un projet greenfield à mon arrivée, nous avons mis en place l'architecture cible dès le premier jour. Ils utilisent Genie d'emblée, et cela a probablement permis d'économiser des centaines d'heures de création de tableaux de bord que les gens auraient oubliés après la première utilisation.
Mon collègue a ce concept qu'il appelle la Howden Intelligence Layer : une fine couche qui oriente votre question vers le bon service. Certaines questions passent par un modèle général pour de la recherche ou de la rédaction d'e-mails. D'autres sont des questions destinées à Genie parce que la réponse se trouve dans nos données gouvernées. L'utilisateur ne devrait pas avoir à se soucier de la provenance de l'information.
Aly : Si vous aviez un seul conseil à donner à un dirigeant C-level qui cherche à mettre à l'échelle ses efforts en matière de données et d'AI, quel serait-il ?
Barry : Ralentir pour aller plus vite (Go slow to go fast). Pas trop lentement, mais concevez les choses correctement dès le départ. Demandez à votre partenaire de plateforme de vous aider à concevoir l'architecture, car j'ai vu trop d'architectes arriver avec les habitudes de leurs expériences passées.
Impliquez très tôt les personnes qui dirigent les processus et le travail sur les agents dans votre organisation. Nous allons fournir des données à des agents qui les feront circuler dans l'entreprise, et cela nécessite une mentalité de conception différente. Et commencez à penser en termes de services de données, et pas seulement de produits de données.
L'argument de Barry ne concerne pas Howden. Il s'agit des choix de conception auxquels la plupart des entreprises vont bientôt être confrontées. Le modèle de produit adapté à l'ère des tableaux de bord n'est pas celui qui convient à l'ère des agents. Le travail de réconciliation effectué en aval devient une taxe permanente à moins que la taxonomie ne soit codifiée en amont. La métrique de fraîcheur pour laquelle la plupart des équipes optimisent n'est pas celle qui importe vraiment pour l'entreprise ; c'est le délai d'obtention des insights qui compte.
Le rythme auquel Howden réalise des acquisitions rend ces compromis visibles plus rapidement qu'ailleurs. Mais ces compromis ne sont pas propres à Howden. Ils s'imposent à toutes les entreprises qui prévoient de fournir des données à des agents, et les leaders qui conçoivent leurs systèmes pour ce mode de consommation dès maintenant n'auront pas à en revoir l'architecture plus tard.
Concevez pour le rythme vers lequel vous vous dirigez, pas pour celui auquel vous êtes aujourd'hui.
Pour découvrir comment plus de 25 experts du secteur tracent la voie vers un déploiement réussi de l'AI, accédez au rapport « Making AI Deliver » d'Economist Enterprise, réalisé avec le soutien de Databricks.
(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original
Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.