Ir al contenido principal

Cómo TetraScience acelera la biofarmacéutica con datos listos para producción e inteligencia científica

databricks-tetrascience

Publicado: 16 de marzo de 2026

Salud y ciencias biológicas7 min de lectura

Summary

  • El cuello de botella son los datos, no la computación. La IA en biofarmacia está fallando porque los datos de laboratorio están aislados y sin estructura. TetraScience resuelve esto transformando las salidas crudas de los instrumentos en conjuntos de datos listos para IA a escala empresarial con Databricks y NVIDIA.
  • Los resultados son drásticos. Las predicciones de anticuerpos que tardaban 48 horas ahora tardan 30 minutos, el desarrollo de líneas celulares se redujo de 8 meses a 2.5, y los ciclos de revisión de control de calidad pasaron de semanas a días.
  • La solución completa supera a las soluciones puntuales. La IA científica sostenible requiere una plataforma unificada, no pilotos únicos, para acumular ventajas en todo el ciclo de vida del desarrollo de fármacos.

Las organizaciones de I+D farmacéutica compiten por implementar flujos de trabajo impulsados por IA que prometen reducir los plazos de desarrollo y mejorar las tasas de éxito de los candidatos. Sin embargo, la revolución de la IA en biofarmacia se ha detenido en la puerta del laboratorio. La investigación de McKinsey muestra que los modos de fallo típicos de las transformaciones digitales en farmacia incluyen "implementar tecnología sin beneficios comerciales claros" y "depender de sistemas inflexibles plagados de datos de baja calidad y aislados", mientras que la Ley de Eroom continúa su marcha implacable: la productividad de I+D disminuye incluso cuando aumenta la inversión en IA.

El desafío principal no es la potencia de cálculo ni la sofisticación del modelo, sino la ausencia de datos científicos listos para producción, nativos de IA, y flujos de trabajo impulsados por IA que ofrezcan resultados a escala empresarial. Lo que falta es una plataforma que pueda transformar continuamente los resultados heterogéneos del laboratorio, desde análisis de cromatografía hasta secuenciación de células únicas, en conjuntos de datos armonizados y ricos en contexto; codificar el conocimiento del dominio científico en ontologías y flujos de trabajo reutilizables; operacionalizar modelos de IA como aplicaciones explicables y listas para auditoría; y ofrecer esas capacidades en toda la cadena de valor, desde el cribado de anticuerpos y la selección de clones en el descubrimiento hasta la liberación de lotes y el monitoreo de cumplimiento en la fabricación.

La Necesidad de un Sistema Operativo para la Inteligencia Científica

Los primeros esfuerzos de biofarmacia en la construcción de IA Científica se han parecido a una colonia de artistas: cada aplicación hecha a mano por especialistas que construyen integraciones personalizadas, canalizaciones de datos a medida y modelos únicos para cada flujo de trabajo. Si bien esto funcionó para proyectos piloto, colapsa bajo las demandas de producción: el cribado de alto rendimiento requiere soporte de decisiones en tiempo real a través de millones de puntos de datos, el desarrollo de biológicos necesita modelos predictivos que rastreen cientos de parámetros en líneas celulares, y los reguladores esperan pistas de auditoría completas con explicabilidad total de IA.

Este es el desafío que el socio de Databricks, TetraScience, existe para resolver. Durante los últimos cinco años, TetraScience ha estado construyendo Tetra OS, una plataforma de datos científicos y IA que comprende cuatro capas integradas. Tetra Data Foundry replata automáticamente los datos del instrumento en esquemas nativos de IA. Tetra Use Case Factory ofrece aplicaciones de IA listas para producción en flujos de trabajo de I+D, fabricación y calidad. Tetra AI sirve como la capa de razonamiento y orquestación que une datos, flujos de trabajo y experiencia. Apoyando estos componentes están los Tetra Sciborgs, híbridos científico-ingenieros que traducen los requisitos en aplicaciones de IA listas para producción.

La asociación de TetraScience con Databricks proporciona la base de análisis empresarial que hace posibles los casos de uso de Factory a escala. Una vez que Foundry replata los datos científicos en formatos nativos de IA, esos datos fluyen hacia Databricks Unity Catalog como tablas Delta, creando un lakehouse unificado y gobernado donde décadas de resultados experimentales se vuelven consultables utilizando API SQL y Spark. Los casos de uso de Factory aprovechan el conjunto de la plataforma Databricks Intelligence para ofrecer flujos de trabajo sin código y de bajo código que requieren una configuración mínima del cliente. Los patrones arquitectónicos demostrados en Genesis Workbench permitieron el desarrollo de flujos de trabajo escalables utilizando NVIDIA BioNeMo y Nemotron Parse. Los científicos acceden a visualizaciones listas para usar y a información predictiva sin escribir canalizaciones ni administrar infraestructura, mientras que los equipos de datos conservan la extensibilidad para crear análisis personalizados cuando sea necesario. Algunos ejemplos:

Resolviendo el Cuello de Botella de Datos de CRO: De Días a Minutos

Los datos preclínicos de las organizaciones de investigación por contrato a menudo llegan en formatos heterogéneos: PDF, hojas de cálculo y exportaciones de instrumentos que son difíciles de analizar, conciliar y confiar a escala. Los datos son científicamente ricos, pero en gran medida inaccesibles para los equipos sin días y, a menudo, semanas de revisión manual y reformateo por estudio. Para las organizaciones que ejecutan cientos de estudios anualmente, esa fricción se acumula en semanas y meses de tiempo perdido en rutas críticas de presentación de IND.

El producto CRO Connect automatiza todo el flujo de trabajo utilizando NVIDIA Nemotron Parse para extraer resultados estructurados de PDF y salidas de instrumentos, mientras que el razonamiento basado en LLM marca anomalías y proporciona contexto explicativo. Una biofarmacéutica global informó una reducción del 80% en el tiempo de revisión (de 2-3 horas por estudio a 20-40 minutos), un 30-45% menos de retrasos en la preparación de datos y una aceleración del 10-20% en la preparación de IND.

Reduciendo Meses del Desarrollo de Anticuerpos: De la Iteración a la Predicción

El desarrollo de anticuerpos terapéuticos requiere tradicionalmente 6-10 semanas por ciclo de optimización en múltiples modalidades de ensayo, cada uno generando datos en diferentes formatos con metadatos inconsistentes.

El producto AI-Augmented Biologics Discovery, implementado en producción en una de las 20 principales farmacéuticas, armoniza datos de múltiples ensayos y aplica modelos de lenguaje de proteínas (como el modelo AMPLIFY del NVIDIA BioNeMo Framework) para predecir perfiles de unión y desarrollabilidad in silico. Los científicos ahora logran predicciones de unión con un 94% de precisión en 30 minutos frente a 48 horas, casi el doble de la precisión del 50% que es estándar utilizando software de proveedores. Al eliminar rondas de optimización innecesarias, las organizaciones logran una mejora del 25-50% en la calidad del candidato y hasta un 50% de aceleración en la identificación de leads, mejorando la probabilidad técnica de éxito hasta en un 5%.

Informe

La inteligencia de datos remodela las industrias

Identificando Clones Blockbuster en 2.5 Meses en Lugar de 8

El desarrollo de líneas celulares consume un promedio de 6-8 meses, un plazo que impacta directamente cuándo los programas biológicos pueden ingresar a la fabricación. El Asistente de Selección de Clones Líder de TetraScience redujo esto a 2.5 meses al agregar datos de múltiples fuentes de instrumentos y aplicar el modelo VISTA-2D de NVIDIA para analizar patrones de morfología celular y Geneformer en los marcos BioNeMo y MONAI para procesar firmas transcriptómicas predictivas de estabilidad a largo plazo.

Al identificar "super clones" con alto título y viabilidad sostenidos durante más de 20 generaciones, la aplicación permite mejoras 10 veces mayores en el título de fabricación que se traducen en una reducción del 85% en el costo de los bienes, lo que representa cientos de millones en evitación de costos de fabricación para biológicos exitosos.

Eliminando el Cuello de Botella de Revisión de $50M: De Semanas a Días

Los equipos de control de calidad dedican el 40-50% de su tiempo a revisar manualmente datos de cromatografía de rutina que ya cumplen con las normativas: verificando eventos de la pista de auditoría, comparando visualmente picos con lotes de referencia y ciclando a través de más de 5 rondas de iteración analista-revisor. Los laboratorios modernos generan entre 10,000 y 20,000 pruebas anualmente, creando millones de eventos de pista de auditoría que la revisión manual no puede escalar para manejar. El costo: sobrecarga cognitiva, anomalías omitidas y retrasos en la liberación de lotes que pueden costar entre $800,000 y $1 millón por día en ingresos perdidos.

El Asistente de Revisión por Excepción (RbE) cambia de la revisión manual exhaustiva a la supervisión inteligente y automatizada. Los modelos de IA entrenados en lotes de referencia específicos del cliente analizan los perfiles de cromatogramas y marcan las desviaciones, detectando diferencias sutiles en la intensidad del pico y los tiempos de retención que la inspección visual podría pasar por alto. Las comprobaciones de cumplimiento basadas en reglas muestran eventos de alto riesgo mientras filtran las actividades de rutina. Las organizaciones que implementan RbE informan ciclos de liberación de lotes comprimidos de semanas a días, con expertos recuperando hasta 198,000 horas anuales para centrarse en excepciones genuinas.

De Pilotos a Producción

El enfoque de pila completa de TetraScience tiene éxito donde las soluciones puntuales y los esfuerzos de bricolaje fallan a través de tres diferenciadores: la comercialización (cada aplicación de IA construida como un componente reutilizable que crea economías de escala), el modelo Sciborg (cerrando la brecha entre científicos y equipos de TI) y la apertura de la plataforma (los datos fluyen hacia Databricks y otros entornos de análisis en lugar de crear silos propietarios).

Las organizaciones que implementan IA Científica a escala industrial hoy en día, pasando de proyectos piloto artesanales a aplicaciones de producción que abarcan el descubrimiento, el desarrollo, la fabricación y la calidad, acumularán ventajas en velocidad, calidad e innovación que los competidores no pueden replicar fácilmente.

TetraScience, Databricks y NVIDIA proporcionan la base completa: aplicaciones de IA Científica listas para producción construidas sobre infraestructura de cómputo, datos y análisis de nivel empresarial. Juntos, permiten lo que los CEO han estado prometiendo: avances impulsados por IA que abarcan la cadena de valor desde la identificación de éxitos hasta la fabricación comercial.

Para obtener más información sobre Tetra OS y las aplicaciones Factory de TetraScience, visite tetrascience.com.

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.