13 de mayo de 2026

La calidad de los datos es la estrategia de IA

Por qué un sistema de salud académico arregló los datos en la fuente antes de apostar por la IA

El principio rector para la IA de alta calidad son los datos de alta calidad, y eso significa arreglar primero los sistemas transaccionales.
El soporte de decisiones clínicas en tiempo real ya está previniendo diagnósticos erróneos en la sala de emergencias.
Las herramientas y los modelos seguirán cambiando. Las organizaciones que se centran en la creación de valor con datos unificados serán las que más se beneficien.

La atención médica puede ser uno de los mayores beneficiarios de la IA. Pocas industrias generan tantos datos, y pocas tienen tanto que ganar extrayendo información de ellos. Pero la brecha entre generar datos y utilizarlos realmente para mejorar la atención, acelerar la investigación y ejecutar las operaciones de manera más eficiente sigue siendo enorme en la mayoría de los sistemas de salud. Los que están cerrando esa brecha comienzan con los datos, no con los modelos.

NYU Langone Health, un sistema de salud académico líder, atiende al área metropolitana de Nueva York a través de la atención al paciente, la investigación médica y la educación médica. NYU Langone utiliza Databricks como su plataforma unificada de datos e IA, habiendo retirado recientemente su data lake local y ahora está migrando su data warehouse empresarial. La institución ha construido una amplia comunidad de médicos, analistas, científicos y miembros de la fuerza laboral corporativa que utilizan la plataforma en la prestación de atención, las operaciones y la investigación.

Nader Mherabi, Director Digital y de Información de NYU Langone Health, ha liderado la estrategia de datos de la institución mucho antes de la ola actual de IA, sentando las bases para un sistema de salud impulsado por datos. En 2017, reconoció la calidad de la recopilación de datos de NYU Langone y creó una oportunidad para ir más allá con las capacidades emergentes de IA.

La metáfora que Nader repitió: Si quieres agua limpia, arregla las tuberías. No intentes filtrarla al final.

Arregla la calidad de tus datos en la fuente

Aly McGue: NYU Langone es una organización impulsada por métricas con una pila de datos madura. Cuando ya tienes un data warehouse y un data lake funcionales, ¿cuál es la 'pieza que falta' que hace necesaria la transición a una plataforma de datos moderna?

Nader Mherabi: Nuestro camino fue un poco diferente al de algunas instituciones. Siempre hemos sido una organización muy impulsada por datos y métricas. Ya teníamos datos unificados en un data lake y un data warehouse empresarial, incluso en la pila tradicional. Por lo tanto, la transición a una plataforma moderna fue más fácil para nosotros de lo que podría ser para otros.

Pero el imperativo estaba claro. Allá por 2017, reconocimos que el potencial de la IA, incluso en esa etapa temprana, significaba que necesitábamos modernizar nuestra pila de datos. Una cosa es construir modelos. Otra muy distinta es ejecutarlos 24/7 de manera segura y confiable. Necesitábamos una plataforma que pudiera ayudarnos a realizar nuestras ambiciones en torno a la calidad del paciente, la seguridad, la eficiencia y la investigación médica, y que pudiera crecer con nosotros a medida que la tecnología evoluciona.

Un principio rector que establecimos hace más de una década es que si realmente quieres datos de alta calidad en tu capa de inteligencia, tienes que arreglarlos primero en los sistemas transaccionales. Es como el agua que fluye por las tuberías. Si tienes agua limpia en la fuente, no tienes que seguir filtrándola al final. Filtrar agua sucia es caro. Por lo tanto, el objetivo siempre debe ser agua limpia primero. Algunas cosas todavía tendrás que filtrarlas sobre la marcha, pero el principio debe ser hacerlo bien río arriba.

Aly: ¿Cómo ha transformado la disciplina de arreglar los datos a nivel transaccional la utilidad real de su capa de datos?

Nader: Hace años, teníamos muchos sistemas con datos de pacientes dispersos en múltiples ubicaciones sin identificadores unificados. Eso es un gran desafío para la calidad de los datos y limita lo que puedes hacer con ellos. Parte de nuestro enfoque fue invertir en plataformas transaccionales comunes: un registro electrónico de salud y un sistema ERP. A medida que incorporamos nuevas prácticas u hospitales, invertimos en integrar a todos en plataformas comunes y luego creamos principios rectores para los datos.

Por ejemplo, nunca mapearíamos datos en la capa del data warehouse. Siempre intentamos arreglarlo en la fuente. Dominamos los sistemas y los datos para saber que esta es la fuente autorizada de datos del paciente, esta es la fuente de datos financieros, esta es la fuente de datos operativos. Una vez que haces eso, tu plataforma de datos se vuelve mucho más significativa. Las personas pueden cruzar datos, lo cual es fundamental en la atención médica. Toma a un paciente en el centro: necesitas conectar sus datos de atención con los ensayos clínicos disponibles, hasta el lado financiero, hasta las muestras recolectadas durante la cirugía y dónde se encuentran físicamente. Si no tienes ese mapeo, te pierdes una capacidad enorme. El principio rector que lo hace posible es siempre el mismo: Arréglalo río arriba.

Lo que desbloquea realmente los datos unificados

Aly: En la atención médica, las apuestas por la precisión de los datos son altas. ¿Cómo evita una base de datos unificada el debate de 'métricas contradictorias' entre diferentes departamentos, y por qué es tan crítico esa confianza al avanzar hacia sistemas de IA agénticos?

Nader: Es enorme. Incluso antes de la IA, las ganancias de los datos unificados fueron enormes. Cuando tus datos están unificados, puedes crear mejores métricas, y diferentes partes del negocio no vienen diciendo: "Ese número no tiene sentido". Si tus datos no están unificados, tus métricas nunca se alinearán.

Con la IA, por supuesto, las apuestas aumentan. Si no tienes datos excelentes, no tendrás una IA excelente. El rendimiento depende de la calidad de los datos. Y luego está la dimensión en tiempo real. Obtener la información de las personas en el momento y lugar adecuados es lo que importa.

La gobernanza unificada es un imperativo estratégico de IA

Aly McGue: Una vez que tienes datos unificados, el siguiente desafío es hacerlos descubribles y confiables a escala. ¿Cómo encaja la gobernanza de datos en eso?

Nader Mherabi: Es fundamental. Necesitas un catálogo para operar con datos y modelos de IA. Usamos Unity Catalog, y seguimos impulsándolo aún más.

Pero la inversión no está solo en la herramienta, sino en la estrategia que la rodea. Necesitas definir tus fuentes de datos maestras, decidir quién posee cada parte del catálogo y luego considerar cuidadosamente cómo lo expones a la comunidad en general para que las personas puedan encontrar lo que necesitan sin duplicar el trabajo. Una cosa es tener un programa de datos enorme. Otra muy distinta es que las personas encuentren los datos correctos dentro de él. Si estás adoptando una plataforma como esta, siempre sugeriría tener el catálogo correcto desde el principio. Sustenta todo lo demás.

Construyendo una comunidad con conocimientos de datos

Aly McGue: Una plataforma unificada solo aporta valor si las personas de toda la institución la utilizan realmente. ¿Cómo han abordado la construcción de esa comunidad más allá del equipo de ingeniería de datos?

Nader: Cuando inviertes en una plataforma como esta, tienes que optimizar la inversión. Para nosotros, eso significa evangelizar lo que puede hacer en toda la institución. El objetivo es convertirnos en un sistema de salud de aprendizaje, uno que aprende de cada interacción del paciente y retroalimenta esa información en la práctica. Eso solo funciona si la comunidad que utiliza la plataforma se extiende mucho más allá de TI. Hemos construido una amplia base de usuarios de médicos, analistas y científicos, todos trabajando dentro de controles de acceso adecuados, y hemos invertido en programas de alfabetización y capacitación para garantizar que las personas en la prestación de atención, las operaciones y la investigación puedan aprovecharla. Tener TI en la plataforma es un hecho. La verdadera medida del éxito es si el resto de la institución también puede usarla.

Información en tiempo real donde más importa

Aly: En un entorno de alta agudeza como una sala de emergencias, la 'información del día siguiente' es efectivamente inútil. ¿Cuáles son los requisitos arquitectónicos para que una plataforma pase de la generación de informes retrospectivos al soporte de decisiones clínicas en tiempo real que pueda prevenir un diagnóstico erróneo?

Nader: En la prestación de atención, el impacto es directo. Tenemos modelos que se ejecutan en la sala de emergencias que buscan ciertas condiciones críticas y brindan soporte de decisiones a los médicos. El objetivo es garantizar que si un paciente está siendo dado de alta, el sistema pueda indicar: ¿identificaste este diagnóstico? ¿Miraste esto? Porque lo que no queremos es que un paciente salga de la sala de emergencias con una condición que podría tener graves consecuencias si se pasa por alto.

Todos oímos hablar de casos en otras instituciones donde un diagnóstico erróneo conduce a un mal resultado. Queremos modelos en tiempo real que se ejecuten continuamente y brinden el mejor consejo a los médicos. No reemplazando su juicio, sino diciendo: "Oye, es posible que hayas pasado esto por alto. Por favor, échale un segundo vistazo". Para que eso funcione, los modelos necesitan datos en tiempo real. Y eso requiere que la plataforma de datos admita flujos en tiempo real para que los modelos puedan operar con información actual y proporcionar información justo a tiempo.

Tres capas de análisis de datos

Aly: ¿Cómo ha transformado la IA la forma en que su organización aborda la estrategia de análisis y BI?

Nader: Creo que el análisis tiene tres capas. Primero, tienes que proporcionar alguna visualización básica. No puedes simplemente decir: "¿Qué quieres ver?" Las personas necesitan algunos puntos de partida estructurados. Segundo, agregas la capa conversacional, herramientas como Genie, donde las personas pueden sentir curiosidad y hacer preguntas más profundas. Y tercero, debes poder entregar la respuesta en diferentes formatos según el usuario: a veces es un hecho directo, a veces es una visualización y a veces son unos pocos números en una pantalla.

Lo poderoso de dónde estamos ahora es que, por primera vez en la historia de la relación humano-máquina, podemos hablar con las máquinas en términos humanos, de la manera en que le preguntarías a un colega. Eso claramente tiene un lugar. Pero aconsejaría a todos que piensen dónde tiene sentido y en qué medida. No reemplaces tu visualización por completo. Agrega la capa conversacional para que las personas puedan sentir curiosidad, hacer más preguntas y ayudarse a sí mismas de manera sencilla.

Aly: El ritmo del desarrollo de la IA puede ser paralizante para muchos líderes. ¿Cómo equilibra la necesidad de una estrategia estable a largo plazo con la realidad de que la tecnología podría ser completamente diferente dentro de seis meses?

Nader: Primero, acepte la imprevisibilidad de la IA. Te despertarás mañana y habrá llegado algo nuevo. Las herramientas y la tecnología seguirán cambiando. No te obsesiones con eso. Encuentra buenos socios que puedan hacer crecer su plataforma como parte del cambio y concéntrate en la creación de valor.

Ya sea que esté brindando atención segura y de alta calidad, mejorando la eficiencia operativa o mejorando la experiencia del paciente, ese es el valor. Busque ese valor con las capacidades que existen hoy y luego continúe evolucionando. Y la otra parte es educarse. Parte de lo que hace que las personas duden es que no sienten que entienden lo que está sucediendo. Tienes que mantenerte informado lo mejor que puedas, porque eso te ayuda a tomar mejores decisiones a medida que el mercado evoluciona, especialmente al ritmo que se mueve ahora.

Pensamientos finales

El enfoque temprano e intencional de NYU Langone es la conclusión clave de esta discusión. La metáfora del agua limpia captura algo importante. Las organizaciones que invierten en filtrar datos sucios en etapas posteriores siempre van a la zaga. Aquellas que lo solucionan en la capa transaccional, aunque lleve más tiempo y cueste más por adelantado, construyen una base sobre la cual cada inversión posterior, desde análisis hasta IA y soporte de decisiones clínicas en tiempo real, puede construirse de manera confiable. En un entorno donde lo que está en juego es la seguridad del paciente, esa disciplina no es opcional.

Para escuchar a líderes de la industria y definir su camino para operacionalizar la IA, descargue el informe de Economist Enterprise, “Making AI Deliver.”

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

Recibe las últimas publicaciones en tu bandeja de entrada

Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.

Ver todos los blogs