27 de mayo de 2026

Construcción de una plataforma de datos de salud nativa de FHIR en Databricks Lakebase

por Marcin Jimenez, Aleksandr Kislitsyn y Nikolai Ryzhikov

Health Samurai estandariza datos clínicos de HL7v2, C-CDA y X12 a FHIR en la ingesta, con normalización de terminología y desduplicación de pacientes incluidas
Aidbox se ejecuta de forma nativa en Databricks Lakebase, lo que hace que los datos FHIR estén disponibles instantáneamente para Spark, ML e IA sin ETL ni movimiento de datos
La arquitectura ofrece el cumplimiento de los mandatos CMS-0057 y ONC como un subproducto, no como un flujo de trabajo separado

Los datos de atención médica residen en docenas de sistemas: EHR, reclamaciones, laboratorios, farmacia, SDoH, cada uno con sus propios formatos, códigos y duplicados. Convertir este panorama fragmentado en una base de datos unificada, estandarizada con FHIR y confiable es un paso clave hacia mejores resultados, operaciones más inteligentes y preparación regulatoria. En este blog, aprenderá cómo Health Samurai y Databricks le brindan las tecnologías para construir esa base sobre estándares abiertos, a cualquier escala.

Hoy en día, las aplicaciones inteligentes de atención médica no existen en el borde del negocio. Dirigen el negocio; desde cerrar brechas de atención de manera proactiva hasta potenciar la participación del miembro en tiempo real y garantizar el cumplimiento normativo por diseño. Pero estas aplicaciones exigen una base de datos que la mayoría de las organizaciones de atención médica han luchado por construir: una que esté estandarizada, gobernada y accesible para cada herramienta en la pila sin mover datos entre sistemas.

¿Qué pasaría si su inteligencia operativa y sus capacidades analíticas estuvieran unificadas y fueran verdaderamente interoperables, generando las mismas perspectivas?

El desafío: datos fragmentados, gobernanza fragmentada

El panorama de datos de la atención médica es particularmente complejo. La información del paciente se distribuye en mensajes HL7v2, documentos C-CDA, transacciones X12 y formatos propietarios, y cada sistema codifica los mismos conceptos clínicos de manera diferente. Un solo diagnóstico puede aparecer bajo múltiples códigos en varios vocabularios. Un solo paciente puede existir como varios registros en varios sistemas.

El enfoque tradicional para unificar estos datos implica configurar un servidor FHIR para la interoperabilidad, un almacén de datos separado para análisis y una red de canalizaciones ETL que conectan ambos. Cada sistema mantiene sus propios controles de acceso, pistas de auditoría y postura de cumplimiento.

Esta duplicación es costosa. Los mismos datos clínicos se replican en el servidor FHIR, el almacén de datos y múltiples capas de preparación, cada uno agregando almacenamiento, cómputo y sobrecarga operativa. Mientras tanto, el propio servidor FHIR a menudo se convierte en un cuello de botella. La mayoría de las implementaciones se diseñaron para casos de uso transaccionales (intercambio de documentos, búsquedas puntuales, API regulatorias), no para los patrones de acceso de análisis modernos, canalizaciones de ML o agentes de IA que necesitan escanear millones de recursos de manera eficiente.

Como resultado, las organizaciones se ven obligadas a tomar decisiones difíciles: aprovisionar en exceso la infraestructura FHIR para mantener el rendimiento o extraer datos a otro sistema para hacerlos utilizables.

El resultado es predecible: movimiento de datos lento, gobernanza fragmentada e iniciativas de IA estancadas, porque los modelos no pueden acceder de manera confiable a datos limpios, confiables y bien gobernados donde se necesitan. Los costos aumentan, mientras que la flexibilidad disminuye; no se pueden crear aplicaciones de atención médica inteligentes sobre datos aislados, inconsistentes y mal gobernados.

La visión: un conjunto de datos, cada herramienta, sin movimiento de datos

Imagine una plataforma única donde los datos clínicos se estandarizan a FHIR en el punto de entrada, donde esos mismos datos, sin ningún movimiento o transformación, están disponibles de inmediato para análisis Spark, modelos de ML, agentes de IA y paneles de BI. Donde el cumplimiento no es una línea de trabajo separada, sino una propiedad natural de la arquitectura. Donde cada herramienta, desde el EHR hasta el cuaderno del científico de datos, ve los mismos datos gobernados y confiables.

Esto es lo que Health Samurai y Databricks han construido juntos.

Cómo funciona: Health Samurai

Agregar y estandarizar

La primera milla de la calidad de los datos determina la última milla de la información. Health Samurai proporciona las tecnologías y la experiencia para recopilar y estandarizar datos de diversas fuentes en una base de datos unificada y nativa de FHIR.

Todo en esta capa está construido teniendo en cuenta la interoperabilidad. Los formatos de datos y las API se basan en HL7 y X12, incluidos FHIR R4/R5, HL7 v2, C-CDA y X12. El significado clínico se representa utilizando sistemas de códigos ampliamente adoptados como LOINC, SNOMED CT, RxNorm e ICD-10. La conformidad con casos de uso específicos se define a través de Guías de Implementación FHIR como US Core, CARIN Blue Button, Da Vinci PDex y mCODE, con sistemas de códigos y guías adicionales incorporados a medida que evolucionan las regulaciones y los requisitos de los socios.

Esta es una elección arquitectónica deliberada, no una casilla de verificación. Los estándares abiertos significan garantizar que su modelo de datos no esté bloqueado en un único proveedor. Los mismos recursos FHIR que impulsan la interoperabilidad hoy pueden admitir análisis, IA y aplicaciones futuras sin necesidad de rehacer el trabajo. Cambiar de herramientas no debería requerir remodelar sus datos.

Las capacidades clave incluyen:

Convertidores de código abierto HL7v2, C-CDA y X12 que transforman datos heredados en FHIR, el estándar moderno para la interoperabilidad de la atención médica.
Servidor de terminología nativo de FHIR que normaliza los códigos entre vocabularios, asegurando que un diagnóstico se cuente una vez independientemente del sistema de origen.
MDM/MPI (Gestión de Datos Maestros / Índice Maestro de Pacientes) que elimina duplicados de registros de pacientes para que un paciente sea un único registro dorado.
Guías de Implementación y Validación FHIR que aplican la calidad y conformidad de los datos en el punto de entrada, no después.

El resultado son datos FHIR limpios y estandarizados con un único registro dorado por paciente. La calidad y la transparencia son fundamentales y no un enfoque posterior.

Health Samurai ayuda a configurar estas canalizaciones y herramientas para el panorama de datos específico de cada organización.

Acceso en todas partes — Cero ETL

Aquí es donde la arquitectura se vuelve transformadora. Aidbox, el servidor y la base de datos FHIR de Health Samurai, se ejecuta de forma nativa en Databricks Lakebase.

Lakebase es una base de datos Postgres completamente administrada y sin servidor, integrada en la Plataforma de Inteligencia de Datos de Databricks. Dado que Aidbox se ejecuta directamente en Lakebase, los datos FHIR están disponibles de inmediato en todo el conjunto de herramientas de Databricks, sin necesidad de ETL.

Los datos se replican a través de Moonlink, un motor de sincronización en tiempo real entre formatos operativos y analíticos, con cero ETL. Esto permite que los datos FHIR fluyan sin problemas a la capa analítica, eliminando las dependencias de canalizaciones, transformaciones o retrasos.

Esto crea dos patrones de acceso complementarios a partir de un único conjunto de datos, ambos impulsando sus análisis y sus cargas de trabajo operativas:

Acceso nativo de Databricks: Spark, SQL, ML, AI/BI — para análisis, ciencia de datos e IA
Acceso basado en estándares: API FHIR, SMART on FHIR y Vistas de Definición SQL sobre FHIR (un nuevo estándar HL7 que aplana los recursos FHIR anidados en vistas tabulares para análisis)

Lo que puedes construir

Con datos FHIR unificados y el poder combinado de Health Samurai y Databricks, las organizaciones pueden abordar de manera flexible sus desafíos específicos:

Optimización de EHR y atención basada en el valor

El soporte de decisiones clínicas y administrativas impulsado por Databricks AI se conecta de nuevo a los flujos de trabajo de EHR y facturación a través de SMART on FHIR y CDS Hooks. Esto permite:

Puntuación HEDIS/STARS y medición de calidad
Optimización de la captura de ajuste de riesgo y HCC
Análisis de contratos y seguimiento de ahorros compartidos
IA agéntica que cierra las brechas de atención de manera proactiva, no retrospectiva

La base nativa de FHIR significa que las perspectivas fluyen directamente de regreso a los médicos en el punto de atención, integradas en sus flujos de trabajo existentes.

Compromiso del miembro a escala

Construya relaciones significativas con pacientes y miembros a través de:

Portales de pacientes con la API FHIR como columna vertebral, cumpliendo estándares por diseño
Alcance personalizado a escala utilizando modelos de propensión en Databricks para determinar el canal, mensaje y momento adecuados para millones de miembros
API de Acceso al Paciente incluida como una propiedad natural de la arquitectura

Cumplimiento — integrado, no añadido

Al basarse en FHIR, las organizaciones abordan mandatos como CMS-0057 (Interoperabilidad y Acceso del Paciente) y los requisitos de la ONC como una propiedad natural de su arquitectura:

Cumplimiento de la Regla de Acceso del Paciente
Intercambio de datos de Pagador a Pagador
Preparación para la Certificación de Tecnología de la Salud de la ONC

El cumplimiento no es un proyecto separado; es un subproducto de hacer las cosas bien.

Por qué esto importa ahora

Las fechas límite regulatorias de CMS y ONC se acercan rápidamente, y la IA está pasando de los pilotos a la producción — pero solo sobre datos confiables y gobernados. El enfoque tradicional de mantener un servidor FHIR separado, una plataforma de análisis separada y pipelines ETL que conectan ambos es demasiado lento, demasiado caro y demasiado frágil para las demandas de la atención médica moderna.

Lakebase protege sus inversiones en interoperabilidad para el futuro. Su servidor FHIR se ejecuta en su Plataforma de Inteligencia de Datos. Sus operaciones clínicas y su análisis comparten la misma fuente de verdad para la información. Unity Catalog gobierna todo, desde los datos operativos hasta las perspectivas y la IA. Y los estándares abiertos significan la flexibilidad de no depender de un solo proveedor.

Comience

Health Samurai y Databricks — tecnologías abiertas para su Plataforma de Datos de Salud.

Obtenga más información sobre Databricks Lakebase
Explore Aidbox de Health Samurai
Contáctenos para discutir su estrategia de plataforma de datos de salud

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

Recibe las últimas publicaciones en tu bandeja de entrada

Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.

Ver todos los blogs