주요 컨텐츠로 이동

TetraScience가 프로덕션 준비 데이터와 과학 인텔리전스로 바이오 제약을 가속화하는 방법

databricks-tetrascience

발행일: 2026년 3월 16일

의료 및 생명 공학Less than a minute

작성자: Alan Millar

Summary

  • 컴퓨팅 파워가 아니라 데이터가 병목 현상입니다. 제약 바이오 AI는 실험실 데이터가 사일로화되고 구조화되지 않아 실패하고 있으며, TetraScience는 Databricks 및 NVIDIA를 사용하여 엔터프라이즈 규모에서 원시 기기 출력을 AI 준비 데이터셋으로 변환하여 이를 해결합니다.
  • 그 결과는 극적입니다. 48시간이 걸리던 항체 예측이 이제 30분 만에 완료되고, 세포주 개발은 8개월에서 2.5개월로 단축되었으며, QC 검토 주기는 몇 주에서 며칠로 단축되었습니다.
  • 풀스택이 단일 솔루션보다 뛰어납니다. 지속 가능한 과학 AI는 전체 신약 개발 수명 주기에 걸쳐 이점을 누적하기 위해 일회성 파일럿이 아닌 통합 플랫폼을 필요로 합니다.

제약 R&D 조직은 개발 기간을 단축하고 후보 성공률을 개선할 것을 약속하는 AI 기반 워크플로우를 배포하기 위해 경쟁하고 있습니다. 그러나 바이오 제약 분야의 AI 혁명은 실험실 문턱에서 멈춰섰습니다. McKinsey 연구에 따르면 제약 디지털 전환의 일반적인 실패 사례에는 "명확한 비즈니스 이점 없이 기술을 구현하는 것"과 "품질이 낮고 사일로화된 데이터로 인해 비효율적인 시스템에 의존하는 것"이 포함되며, Eroom의 법칙은 AI 투자가 증가함에도 불구하고 R&D 생산성이 감소하는 끊임없는 행진을 계속하고 있습니다.

핵심 과제는 컴퓨팅 성능이나 모델의 정교함이 아니라, 엔터프라이즈 규모에서 결과를 제공하는 생산 준비가 된 AI 네이티브 과학 데이터와 AI 기반 워크플로우의 부재입니다. 누락된 것은 크로마토그래피 분석부터 단일 세포 시퀀싱까지 다양한 실험실 출력을 조화롭고 맥락이 풍부한 데이터 세트로 지속적으로 변환하고, 과학적 도메인 지식을 재사용 가능한 온톨로지와 워크플로우로 인코딩하며, AI 모델을 설명 가능하고 감사 준비가 된 애플리케이션으로 운영화하고, 항체 스크리닝 및 클론 선택부터 제조에서의 배치 릴리스 및 규정 준수 모니터링까지 전체 가치 사슬에 걸쳐 이러한 기능을 제공할 수 있는 플랫폼입니다.

과학적 인텔리전스를 위한 OS의 필요성

바이오 제약 분야의 과학 AI 구축 초기 노력은 예술가들의 식민지와 같았습니다. 각 애플리케이션은 전문가들이 맞춤형 통합, 맞춤형 데이터 파이프라인, 모든 워크플로우를 위한 일회성 모델을 구축하여 수작업으로 제작되었습니다. 이는 파일럿 프로젝트에는 효과적이었지만, 생산 요구 사항에는 무너집니다. 고처리량 스크리닝은 수백만 개의 데이터 포인트에 대한 실시간 의사 결정을 지원해야 하며, 생물학적 제제 개발은 세포주 전반에 걸쳐 수백 개의 매개변수를 추적하는 예측 모델이 필요하며, 규제 기관은 완전한 AI 설명 가능성을 갖춘 감사 추적을 기대합니다.

이것이 Databricks 파트너인 TetraScience가 해결하고자 하는 과제입니다. 지난 5년 동안 TetraScience는 네 가지 통합 계층으로 구성된 과학 데이터 및 AI 플랫폼인 Tetra OS를 구축해 왔습니다. Tetra Data Foundry는 계측기 데이터를 AI 네이티브 스키마로 자동 재플랫폼화합니다. Tetra Use Case Factory는 R&D, 제조 및 품질 워크플로우 전반에 걸쳐 생산 등급 AI 애플리케이션을 제공합니다. Tetra AI는 데이터, 워크플로우 및 전문 지식을 통합하는 추론 및 오케스트레이션 계층 역할을 합니다. 이러한 구성 요소를 지원하는 것은 요구 사항을 생산 준비가 된 AI 애플리케이션으로 변환하는 과학자-엔지니어 하이브리드인 Tetra Sciborgs입니다.

TetraScience와 Databricks의 파트너십은 Factory 사용 사례를 대규모로 가능하게 하는 엔터프라이즈 분석 기반을 제공합니다. Foundry가 과학 데이터를 AI 네이티브 형식으로 재플랫폼화하면 해당 데이터는 Databricks Unity Catalog로 Delta 테이블로 흘러 들어가, 수십 년간의 실험 결과가 SQL 및 Spark API를 사용하여 쿼리 가능한 통합되고 관리되는 레이크하우스를 생성합니다. Factory 사용 사례는 Databricks Intelligence Platform 스택을 활용하여 최소한의 고객 구성으로 노코드 및 로우코드 워크플로우를 제공합니다. Genesis Workbench에서 시연된 아키텍처 패턴은 NVIDIA BioNeMo 및 Nemotron Parse를 사용하여 확장 가능한 워크플로우 개발을 가능하게 했습니다. 과학자들은 파이프라인을 작성하거나 인프라를 관리하지 않고도 즉시 사용 가능한 시각화 및 예측 인사이트에 액세스할 수 있으며, 데이터 팀은 필요할 때 사용자 지정 분석을 구축할 수 있는 확장성을 유지합니다. 몇 가지 예시는 다음과 같습니다.

CRO 데이터 병목 현상 해결: 며칠에서 몇 분으로

계약 연구 기관의 전임상 데이터는 종종 PDF, 스프레드시트 및 계측기 내보내기와 같은 다양한 형식으로 제공되어 대규모로 구문 분석, 조정 및 신뢰하기 어렵습니다. 데이터는 과학적으로 풍부하지만, 연구당 며칠 또는 몇 주에 걸친 수동 검토 및 재서식 지정 없이는 팀이 액세스하기 어렵습니다. 연간 수백 건의 연구를 수행하는 조직의 경우, 이러한 마찰은 중요한 IND 제출 경로에서 몇 주 또는 몇 달의 시간 손실로 누적됩니다.

CRO Connect 제품은 NVIDIA Nemotron Parse를 사용하여 PDF 및 계측기 출력에서 구조화된 결과를 추출하고, LLM 기반 추론이 이상 징후를 플래그 지정하고 설명 컨텍스트를 제공함으로써 전체 워크플로우를 자동화합니다. 한 글로벌 바이오 제약 회사는 검토 시간을 80% 줄이고(연구당 2-3시간에서 20-40분으로), 데이터 준비 지연을 30-45% 줄였으며, IND 준비를 10-20% 가속화했다고 보고했습니다.

항체 개발 기간 단축: 반복에서 예측으로

치료용 항체 개발은 전통적으로 여러 분석 모달리티에 걸쳐 최적화 주기당 6-10주가 소요됩니다. 각 모달리티는 다른 형식과 일관되지 않은 메타데이터로 데이터를 생성합니다.

AI-Augmented Biologics Discovery 제품은 상위 20개 제약 회사에서 프로덕션으로 배포되어 다중 분석 데이터를 조화시키고 단백질 언어 모델(예: NVIDIA BioNeMo Framework의 AMPLIFY 모델)을 적용하여 결합 및 개발 가능성 프로필을 인실리코로 예측합니다. 과학자들은 이제 48시간에 비해 30분 만에 94% 정확도로 결합 예측을 달성하며, 이는 공급업체 소프트웨어를 사용할 때 표준인 50% 정확도의 거의 두 배입니다. 불필요한 최적화 라운드를 제거함으로써 조직은 후보 품질을 25-50% 개선하고 선도 물질 식별을 최대 50% 가속화하여 성공 확률을 최대 5%까지 향상시킵니다.

보고서

산업을 재편하는 데이터 인텔리전스

블록버스터 클론 식별: 8개월에서 2.5개월로

세포주 개발은 평균 6-8개월이 소요되며, 이는 생물학적 제제 프로그램이 제조에 진입할 수 있는 시점에 직접적인 영향을 미칩니다. TetraScience의 Lead Clone Selection Assistant는 여러 계측기 소스의 데이터를 집계하고 NVIDIA의 VISTA-2D 모델을 적용하여 세포 형태 패턴을 분석하고 BioNeMo 및 MONAI 프레임워크의 Geneformer를 사용하여 장기 안정성을 예측하는 전사체 시그니처를 처리함으로써 이 기간을 2.5개월로 단축했습니다.

20세대 이상 동안 지속적으로 높은 역가와 생존력을 가진 "슈퍼 클론"을 식별함으로써, 이 애플리케이션은 제조 역가를 10배 개선하여 상품 원가를 85% 절감하며, 이는 블록버스터 생물학적 제제에 대해 수억 달러의 제조 비용 절감을 나타냅니다.

5천만 달러 검토 병목 현상 제거: 몇 주에서 며칠로

품질 관리 팀은 감사 추적 이벤트의 사실 확인, 골든 배치와 피크 비교, 분석가-검토자 반복 5회 이상 순환 등 이미 규정을 준수하는 일반적인 크로마토그래피 데이터를 수동으로 검토하는 데 시간을 40-50% 소비합니다. 현대 실험실은 연간 10,000-20,000건의 테스트를 생성하여 수백만 개의 감사 추적 이벤트를 생성하며, 이는 수동 검토로는 처리할 수 없습니다. 비용은 인지 과부하, 누락된 이상 징후, 배치 릴리스 지연으로 하루에 80만~100만 달러의 손실 수익으로 이어집니다.

Review-by-Exception(RbE) Assistant는 철저한 수동 검토에서 지능형 자동화된 감독으로 전환합니다. 고객별 골든 배치를 기반으로 훈련된 AI 모델은 크로마토그램 프로파일을 분석하고 편차를 플래그 지정하여 시각적 검사에서 놓칠 수 있는 피크 강도 및 유지 시간의 미묘한 차이를 감지합니다. 규칙 기반 규정 준수 검사는 일상적인 활동을 필터링하면서 고위험 이벤트를 표시합니다. RbE를 배포하는 조직은 배치 릴리스 주기가 몇 주에서 며칠로 압축되었으며, SME는 연간 최대 198,000시간을 확보하여 실제 예외에 집중할 수 있다고 보고합니다.

파일럿에서 프로덕션으로

TetraScience의 풀스택 접근 방식은 세 가지 차별화 요소, 즉 재사용 가능한 구성 요소로 구축된 모든 AI 애플리케이션(규모의 경제 창출), 과학자와 IT 팀 간의 격차 해소(Sciborg 모델), 데이터가 독점 사일로를 생성하는 대신 Databricks 및 기타 분석 환경으로 흐르는 플랫폼 개방성을 통해 포인트 솔루션 및 DIY 노력에서 실패하는 곳에서 성공합니다.

오늘날 산업 규모의 과학 AI를 배포하는 조직(예술적인 파일럿 프로젝트에서 발견, 개발, 제조 및 품질에 걸친 프로덕션 애플리케이션으로 이동)은 경쟁자가 쉽게 복제할 수 없는 속도, 품질 및 혁신에서 이점을 누릴 것입니다.

TetraScience, Databricks 및 NVIDIA는 완전한 기반을 제공합니다. 엔터프라이즈급 컴퓨팅, 데이터 및 분석 인프라를 기반으로 구축된 생산 준비가 된 과학 AI 애플리케이션입니다. 함께, 그들은 CEO들이 약속해 온 것, 즉 히트 식별부터 상업 제조에 이르기까지 가치 사슬 전반에 걸친 AI 기반 혁신을 가능하게 합니다.

TetraScience의 Tetra OS 및 Factory 애플리케이션에 대한 자세한 내용은 tetrascience.com에서 확인하세요.

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)

게시물을 놓치지 마세요

관심 있는 카테고리를 구독하고 최신 게시물을 받은편지함으로 받아보세요