O CDO do Howden Group explica por que o modelo de produto de dados falha no ritmo de aquisições — e como é, em vez disso, uma camada de dados pronta para agentes
por Aly McGue
O manual tradicional de dados corporativos pressupõe um certo ritmo. Você projeta uma estratégia, constrói a plataforma, integra fontes de forma metódica e implementa produtos para cada grande caso de uso. O plano é o artefato, e o artefato é feito para durar.
Esse manual está sendo testado ao limite de uma forma para a qual não foi projetado. Empresas que crescem por meio de aquisições, criam fluxos de trabalho baseados em agentes e absorvem novas fontes de dados em alta velocidade estão descobrindo que estratégias criadas para uma era mais lenta se tornam limitações para o próprio negócio. A arquitetura, a taxonomia e o modelo operacional que funcionavam em um determinado ritmo começam a agir ativamente contra o próximo.
Barry Panayi é Group Chief Data Officer na Howden, uma corretora de seguros, subscritora e resseguradora global que opera em mais de 50 países com 25.000 funcionários. Há cinco anos, a empresa tinha 10.000 pessoas. No ano passado, ela adquiriu mais de uma empresa por semana. A Howden executa sua plataforma de dados corporativos no Databricks, consolidando mais de 100 fontes de registro em uma arquitetura unificada que suporta desde relatórios regulatórios até análises conversacionais por meio do Databricks Genie.
Neste blog, Barry discute como as escolhas tradicionais de design não funcionarão para o rumo que o consumo de AI está tomando. O modelo de produto se torna engessado. O ciclo de reconciliação fica caro. O acúmulo de dashboards se torna o gargalo. Abaixo, Barry defende o que deve ser construído em vez disso.
Aly McGue: Você mencionou que o modelo de um produto por caso de uso começa a falhar a partir de certo ponto. O que você quer dizer com isso e o que o substitui?
Barry Panayi: Comecei a perceber que esse modelo se torna engessado. Se você pensar na sua camada de dados como um conjunto de serviços abertos e governados, ela se torna muito mais adaptável a quaisquer demandas de AI que surjam a seguir.
Vamos fornecer dados para agentes que os distribuirão pela empresa, e isso exige uma mentalidade de design diferente. Não é possível predefinir cada caso de uso quando os consumidores não são mais apenas dashboards e analistas. Os agentes vão compor os dados de maneiras que você não previu. Uma camada de serviços pressupõe isso. Um catálogo de produtos, não.
É também por isso que digo às pessoas para trazerem quem lidera o trabalho de processos e agentes na organização logo no início. Não depois que a plataforma estiver construída.
Aly: A Howden adquiriu mais de uma empresa por semana no ano passado. O que esse ritmo faz com uma organização de dados e o que precisou mudar na arquitetura?
Barry: Quando cheguei, tínhamos cerca de 80 fontes de dados ingeridas e levava cerca de seis meses para integrar os dados após a aquisição. No ritmo em que estamos adquirindo, isso significava que as pessoas estavam criando silos ou buscando dados de outros lugares porque precisavam de resultados imediatos. Tínhamos uma adoção limitada em nossas divisões porque simplesmente não tínhamos a cobertura necessária.
Não foi apenas uma modernização técnica. Tratava-se de eliminar o custo da fragmentação, da integração lenta e do esforço duplicado. Arquiteturalmente, mudamos de direção. A configuração anterior lidava com a masterização de dados e verificações de qualidade mais adiante no fluxo (downstream), mais perto da camada de relatórios. Precisávamos que isso acontecesse o mais próximo possível da ingestão, para que os dados se tornassem utilizáveis mais rapidamente. Essa mudança altera todo o cronograma.
Um dos maiores pontos fortes da Howden é a colaboração entre diferentes partes do negócio. E o que alimenta isso são os dados. Você precisa saber o que seu colega tem que poderia ajudá-lo e como você poderia ajudá-lo. Havia tantas oportunidades de negócios que poderíamos desbloquear apenas tornando os dados visíveis — nem mesmo totalmente ingeridos e masterizados, apenas visíveis.
Aly: Quando se tem tantas fontes, a mesma métrica pode existir em várias versões corretas. Como você fez para que sua equipe parasse de gastar tempo com reconciliação manual?
Barry: Podíamos ter até quatro versões do mesmo ponto de dados, e todas elas estavam corretas em seu próprio contexto. Não havia um modelo de dados ou taxonomia comum, então minha equipe gastava muito esforço para descobrir qual versão era a correta para uma determinada resposta.
Os executivos sempre conseguiam o que precisavam. Garantíamos que os números fossem reconciliados. Mas a reconciliação manual consumia tempo e recursos que poderiam ter sido direcionados para trabalhos de maior valor. Desde então, construímos um modelo de dados padrão, o modelo de dados Accord, junto com a plataforma. Isso codifica a lógica para que a reconciliação seja integrada, em vez de depender de pessoas para identificá-la a cada vez.
Esse é o ponto principal. Se a sua taxonomia não estiver codificada, sua equipe se tornará o mecanismo de reconciliação. Esse é um preço que você paga a cada ciclo de relatórios, e ele cresce junto com o negócio exatamente na direção errada.
Aly: Muitas empresas têm um portfólio de pilotos de AI que nunca ganham escala. O que mudou na Howden?
Barry: Como em muitas organizações, nossas etapas iniciais foram focadas em exploração, o que significava que estávamos construindo casos de uso exclusivos do zero. Foi uma fase necessária para ver o que era possível, mas, para realmente ganhar escala, tivemos que deixar de reconstruir tudo para cada divisão. Agora, devido à forma como usamos a plataforma Databricks, temos pipelines padronizados, código compartilhado e ativos de dados reutilizáveis. Podemos fazer análises cruzadas de domínios (cross-domain analytics), misturando dados de clientes, dados de risco e dados de mercado, construindo uma única vez em vez de reconstruir por divisão.
Temos um pipeline de casos de uso de AI em todo o grupo agora. Ainda estamos trabalhando para colocar modelos em produção para que possam ser consumidos como serviços consistentes, e esse é um ponto fraco sobre o qual sou honesto. Mas a transição de experimentos isolados para uma capacidade escalável é real. Não seríamos capazes de fazer nada disso sem essa visão unificada.
Aly: Em um setor que não se move na velocidade transacional do varejo, onde dados mais rápidos realmente mudam o resultado?
Barry: O que importa enormemente é reduzir o que chamo de atraso do insight (insight lag), o intervalo entre o momento em que o dado passa a existir em algum lugar da empresa e quando alguém pode realmente usá-lo.
Nosso negócio é principalmente de corretagem. Isso significa dar aos corretores o insight mais atualizado possível antes de se reunirem com um cliente. Nossos relatórios costumavam ser lentos e processados em lotes (batch). Os dados não estavam errados, mas, no momento em que você os via, já estavam desatualizados. Isso não cria um problema de confiança. Cria um problema de utilidade. Você está trabalhando olhando pelo retrovisor.
Agora, quando um corretor vai até um cliente, ele pode dizer: "Isto é o que estamos vendo em nossa carteira agora, este é o benchmarking, esta é a nossa visão interna." Nossos dados são nossa IP. Não existem muitas empresas que operam em toda a cadeia de valor de seguros da forma como fazemos. Eu seria louco se não garantisse que esses insights fossem divulgados rapidamente, e não haveria como fazer isso com a fragmentação que tínhamos antes.
Aly: Qual foi o catalisador para a implementação do Genie e o que mudou na forma como as pessoas chegam às respostas?
Barry: A pergunta que me fizeram, possivelmente até na minha entrevista antes de entrar, foi: por que não podemos simplesmente conversar com nossos dados? A lógica era simples. As pessoas estão conversando com toda a internet por meio do ChatGPT. Então, por que elas não podem fazer uma pergunta aos dados da sua própria empresa e obter uma resposta rápida?
Há dois lados nisso. Um é a velocidade literal. Alguém tem uma dúvida, a resposta são alguns números ou um gráfico rápido, e o Genie resolve. O outro lado é o que ele libera. Sem ele, alguém pede os dez principais clientes por uma métrica. Um analista recebe isso, esclarece a dúvida, escreve uma consulta (query), cria um dashboard que inevitavelmente se torna mais elaborado do que precisava ser. Esse ciclo é lento. Em nossa operação de varejo nos US, que era uma operação do zero (greenfield) quando entrei, estabelecemos a arquitetura-alvo desde o primeiro dia. Eles estão usando o Genie logo de cara, e isso provavelmente economizou centenas de horas de criação de dashboards que as pessoas teriam esquecido após o primeiro uso.
Meu colega tem esse conceito que ele chama de Howden Intelligence Layer: uma camada fina que direciona sua pergunta para o serviço certo. Algumas perguntas passam por um modelo geral para pesquisa ou e-mail. Outras são perguntas para o Genie, porque a resposta está em nossos dados governados. O usuário não precisa se preocupar de onde ela vem.
Aly: Se você pudesse oferecer um conselho a um líder C-level que está expandindo seus esforços de dados e AI, qual seria?
Barry: Vá devagar para ir rápido. Não muito devagar, mas projete tudo corretamente desde o início. Peça ajuda ao parceiro da sua plataforma para projetar a arquitetura, porque já vi muitos arquitetos trazerem bagagem de como faziam antes.
Traga quem lidera o trabalho de processos e agentes na sua organização logo no início. Vamos fornecer dados para agentes que os distribuirão pela empresa, e isso exige uma mentalidade de design diferente. E comece a pensar em serviços de dados, não apenas em produtos de dados.
O argumento de Barry não é sobre a Howden. É sobre as escolhas de design que a maioria das empresas está prestes a enfrentar. O modelo de produto que se adequava a uma era de dashboards não é o modelo que se adequa a uma era de agentes. O trabalho de reconciliação feito downstream torna-se um custo permanente, a menos que a taxonomia seja codificada upstream. A métrica de atualização que a maioria das equipes otimiza não é a métrica que realmente importa para o negócio; o atraso no insight (insight lag) é.
O ritmo com que a Howden está fazendo aquisições torna esses trade-offs visíveis mais rapidamente do que em outros lugares. Mas os trade-offs não são exclusivos da Howden. Eles estão chegando para todas as empresas que pretendem fornecer dados para agentes, e os líderes que projetam para esse padrão de consumo agora não precisarão rearquitetar isso mais tarde.
Projete para o ritmo em direção ao qual você está avançando, não para o ritmo em que está hoje.
Para descobrir como mais de 25 especialistas do setor estão traçando um caminho em direção à implantação bem-sucedida de AI, acesse o relatório "Making AI Deliver" da Economist Enterprise, produzido com o apoio da Databricks.
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.