13 de maio de 2026

A qualidade dos dados é a estratégia de IA

Por que um sistema de saúde acadêmico corrigiu os dados na origem antes de apostar em IA

O princípio orientador para IA de alta qualidade são dados de alta qualidade, e isso significa corrigir primeiro os sistemas transacionais.
O suporte à decisão clínica em tempo real já está prevenindo diagnósticos errados na sala de emergência.
As ferramentas e os modelos continuarão mudando. As organizações que se concentrarem na criação de valor com dados unificados serão as que mais se beneficiarão.

A área da saúde pode ser uma das maiores beneficiadas pela IA. Poucas indústrias geram tantos dados e poucas têm tanto a ganhar com a extração de insights deles. Mas a lacuna entre gerar dados e realmente usá-los para melhorar o atendimento, acelerar a pesquisa e otimizar as operações permanece enorme na maioria dos sistemas de saúde. Aqueles que estão fechando essa lacuna começam com os dados, não com os modelos.

A NYU Langone Health, um sistema de saúde acadêmico líder, atende a área metropolitana de Nova York por meio de atendimento ao paciente, pesquisa médica e educação médica. A NYU Langone utiliza o Databricks como sua plataforma unificada de dados e IA, tendo recentemente desativado seu data lake on-premises e agora migrando seu data warehouse corporativo. A instituição construiu uma ampla comunidade de clínicos, analistas, cientistas e membros da força de trabalho corporativa utilizando a plataforma em atendimento, operações e pesquisa.

Nader Mherabi, o Chief Digital and Information Officer da NYU Langone Health, liderou a estratégia de dados da instituição muito antes da atual onda de IA, construindo as bases para um sistema de saúde orientado por dados. Em 2017, ele reconheceu a qualidade da coleta de dados da NYU Langone e criou uma oportunidade para ir além com as capacidades emergentes de IA.

A metáfora que Nader usou: Se você quer água limpa, conserte os canos. Não tente filtrá-la no final.

Corrija a qualidade dos seus dados na origem

Aly McGue: A NYU Langone é uma organização orientada por métricas com uma pilha de dados madura. Quando você já tem um data warehouse e um data lake funcionais, qual é a 'peça que falta' que torna a migração para uma plataforma de dados moderna necessária?

Nader Mherabi: Nosso caminho foi um pouco diferente de algumas instituições. Sempre fomos uma organização altamente orientada por dados e métricas. Já tínhamos dados unificados em um data lake e um data warehouse corporativo, mesmo na pilha tradicional. Portanto, a transição para uma plataforma moderna foi mais fácil para nós do que pode ser para outros.

Mas o imperativo era claro. Em 2017, reconhecemos que o potencial da IA, mesmo naquele estágio inicial, significava que precisávamos modernizar nossa pilha de dados. É uma coisa construir modelos. É outra coisa executá-los 24 horas por dia, 7 dias por semana, de forma segura e confiável. Precisávamos de uma plataforma que pudesse nos ajudar a realizar nossas ambições em relação à qualidade do paciente, segurança, eficiência e pesquisa médica, e que pudesse crescer conosco à medida que a tecnologia evolui.

Um princípio orientador que estabelecemos há mais de uma década é que, se você realmente deseja dados de alta qualidade em sua camada de inteligência, você tem que corrigi-los primeiro nos sistemas transacionais. É como água vindo pelos canos. Se você tem água limpa na fonte, não precisa ficar filtrando no final. Filtrar água suja é caro. Portanto, o objetivo deve ser sempre água limpa primeiro. Algumas coisas você ainda terá que filtrar ao longo do caminho, mas o princípio deve ser acertar a montante.

Aly: Como a disciplina de corrigir dados no nível transacional transformou a utilidade real da sua camada de dados?

Nader: Anos atrás, tínhamos muitos sistemas com dados de pacientes espalhados por vários locais sem identificadores unificados. Isso é um grande desafio para a qualidade dos dados e limita o que você pode fazer com eles. Parte da nossa abordagem foi investir em plataformas transacionais comuns: um prontuário eletrônico e um sistema ERP. À medida que incorporávamos novas práticas ou hospitais, investíamos em trazer todos para plataformas comuns e, em seguida, criávamos princípios orientadores para os dados.

Por exemplo, nunca mapearíamos dados na camada do data warehouse. Sempre tentamos corrigi-los na origem. Dominamos os sistemas e os dados para saber que esta é a fonte autoritativa para dados do paciente, esta é a fonte para dados financeiros, esta é a fonte para dados operacionais. Uma vez que você faz isso, sua plataforma de dados se torna muito mais significativa. As pessoas podem cruzar dados, o que é crítico na área da saúde. Pense em um paciente no centro: você precisa conectar seus dados de atendimento ao que está disponível em ensaios clínicos, até o lado financeiro, até espécimes coletados durante a cirurgia e onde eles estão fisicamente. Se você não tiver esse mapeamento, estará perdendo uma capacidade enorme. O princípio orientador que o torna possível é sempre o mesmo: corrija a montante.

O que os dados unificados realmente desbloqueiam

Aly: Na área da saúde, os riscos para a precisão dos dados são altos. Como uma base de dados unificada evita o debate de 'métricas conflitantes' entre diferentes departamentos e por que essa confiança é tão crítica ao avançar para sistemas de IA agênticos?

Nader: É enorme. Mesmo antes da IA, os ganhos com dados unificados eram enormes. Quando seus dados são unificados, você pode criar melhores métricas, e diferentes partes do negócio não vêm dizendo: "Esse número não faz sentido". Se seus dados não são unificados, suas métricas nunca se alinharão.

Com a IA, é claro, os riscos aumentam. Se você não tiver ótimos dados, não terá ótima IA. O desempenho depende da qualidade dos dados. E então há a dimensão em tempo real. Obter o insight das pessoas no momento e local certos é o que importa.

Governança unificada é um imperativo estratégico de IA

Aly McGue: Uma vez que você tem dados unificados, o próximo desafio é torná-los descobertos e confiáveis em escala. Como a governança de dados se encaixa nisso?

Nader Mherabi: É fundamental. Você precisa de um catálogo para operar em dados e modelos de IA. Usamos o Unity Catalog e continuamos a expandi-lo.

Mas o investimento não está apenas na ferramenta, é a estratégia em torno dela. Você precisa definir suas fontes de dados mestre, decidir quem é o proprietário de cada parte do catálogo e, em seguida, considerar cuidadosamente como você o expõe à comunidade em geral para que as pessoas possam encontrar o que precisam sem duplicar o trabalho. É uma coisa ter um programa de dados enorme. É outra coisa as pessoas encontrarem os dados corretos dentro dele. Se você está adotando uma plataforma como esta, eu sempre sugeriria acertar o catálogo desde o início. Ele sustenta todo o resto.

Construindo uma comunidade com literacia em dados

Aly McGue: Uma plataforma unificada só entrega valor se as pessoas em toda a instituição realmente a utilizarem. Como vocês abordaram a construção dessa comunidade além da equipe de engenharia de dados?

Nader: Quando você investe em uma plataforma como esta, você tem que otimizar o investimento. Para nós, isso significa evangelizar o que ela pode fazer em toda a instituição. O objetivo é nos tornarmos um sistema de saúde de aprendizado, que aprende com cada interação do paciente e retroalimenta esse insight na prática. Isso só funciona se a comunidade que usa a plataforma se estender bem além da TI. Construímos uma ampla base de usuários de clínicos, analistas e cientistas, todos trabalhando dentro de controles de acesso adequados, e investimos em programas de literacia e treinamento para garantir que pessoas em atendimento, operações e pesquisa possam aproveitá-la. Ter a TI na plataforma é um dado. A verdadeira medida de sucesso é se o resto da instituição também pode usá-la.

Insight em tempo real onde mais importa

Aly: Em um ambiente de alta complexidade como uma Sala de Emergência, 'insight no dia seguinte' é efetivamente inútil. Quais são os requisitos arquitetônicos para uma plataforma se mover de relatórios retrospectivos para suporte à decisão clínica em tempo real que possa realmente prevenir um diagnóstico incorreto?

Nader: No atendimento, o impacto é direto. Temos modelos rodando na sala de emergência que procuram certas condições críticas e fornecem suporte à decisão aos clínicos. O objetivo é garantir que, se um paciente estiver recebendo alta, o sistema possa sinalizar: você identificou este diagnóstico? Você olhou para isso? Porque o que não queremos é um paciente saindo da sala de emergência com uma condição que poderia ter consequências graves se for perdida.

Todos nós ouvimos falar de casos em outras instituições onde um diagnóstico incorreto leva a um resultado ruim. Queremos modelos em tempo real que rodem continuamente e forneçam o melhor conselho aos clínicos. Não substituindo o julgamento deles, mas dizendo: "Ei, você pode ter negligenciado isso. Por favor, dê outra olhada." Para que isso funcione, os modelos precisam de dados em tempo real. E isso exige que a plataforma de dados suporte fluxos em tempo real para que os modelos possam operar com informações atuais e fornecer insights just-in-time.

Três camadas de análise de dados

Aly: Como a IA transformou a abordagem da sua organização à estratégia de análise e BI?

Nader: Eu acredito que a análise tem três camadas. Primeiro, você tem que fornecer alguma visualização básica. Você não pode simplesmente dizer: "O que você quer olhar?" As pessoas precisam de alguns pontos de partida estruturados. Segundo, você adiciona a camada conversacional, ferramentas como o Genie, onde as pessoas podem ser curiosas e fazer perguntas mais profundas. E terceiro, você precisa ser capaz de entregar a resposta em diferentes formas, dependendo do usuário: às vezes é um fato direto, às vezes é uma visualização e às vezes são alguns números na tela.

O que é poderoso sobre onde estamos agora é que, pela primeira vez na história humano-máquina, podemos realmente conversar com máquinas em termos humanos, da maneira que você perguntaria a um colega. Isso claramente tem um lugar. Mas eu aconselharia a todos a pensar onde isso faz sentido e em que grau. Não substitua totalmente sua visualização. Adicione a camada conversacional para que as pessoas possam ser curiosas, fazer mais perguntas e se ajudar de forma simples.

Aly: O ritmo do desenvolvimento de IA pode ser paralisante para muitos líderes. Como você equilibra a necessidade de uma estratégia de longo prazo estável com a realidade de que a tecnologia pode parecer completamente diferente daqui a seis meses?

Nader: Primeiro, aceite a imprevisibilidade da IA. Você vai acordar amanhã e algo novo terá chegado. As ferramentas e a tecnologia continuarão a mudar. Não se prenda a isso. Encontre bons parceiros que possam expandir sua plataforma como parte da mudança e concentre-se na criação de valor.

Seja entregando cuidados seguros e de alta qualidade, melhorando a eficiência operacional ou tornando a experiência do paciente melhor, esse é o valor. Busque-o com as capacidades que existem hoje e, em seguida, continue a evoluir. E a outra parte é se educar. Parte do que torna as pessoas hesitantes é que elas não sentem que entendem o que está acontecendo. Você tem que se manter informado o melhor que puder, porque isso ajuda você a tomar melhores decisões à medida que o mercado evolui, especialmente no ritmo em que está se movendo agora.

Considerações Finais

A abordagem inicial e intencional da NYU Langone é a principal conclusão desta discussão. A metáfora da água limpa captura algo importante. Organizações que investem na filtragem de dados sujos a jusante estão sempre correndo atrás. Aquelas que corrigem na camada transacional, mesmo que leve mais tempo e custe mais no início, constroem uma base sobre a qual cada investimento subsequente, de análise a IA a suporte à decisão clínica em tempo real, pode ser construído de forma confiável. Em um ambiente onde as apostas são a segurança do paciente, essa disciplina não é opcional.

Para ouvir líderes do setor e definir seu caminho para operacionalizar a IA, baixe o relatório da Economist Enterprise, “Making AI Deliver.”

(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

Receba os posts mais recentes na sua caixa de entrada

Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.

Ver todos os blogs