Passa al contenuto principale
Sanità e bioscienze

Genesis Workbench: un modello di riferimento per l'AI di settore nelle scienze della vita, con tecnologia Databricks e NVIDIA

Un workbench aperto e regolamentato per le scienze della vita che unisce il calcolo accelerato di NVIDIA e i modelli aperti NVIDIA BioNeMo per la biologia in una piattaforma di scoperta end-to-end, eseguita interamente nel tuo ambiente Databricks

di Mark Lee e Srijit Nair

  • Genesis Workbench è un blueprint Databricks aperto e modulare che integra gli strumenti di calcolo accelerato di NVIDIA, tra cui BioNeMo e Parabricks, in un unico ambiente sicuro per la scoperta di farmaci end-to-end.
  • La piattaforma semplifica le complesse attività di R&D fornendo un'interfaccia no-code e point-and-click che consente ai ricercatori di laboratorio di eseguire attività di genomica e progettazione molecolare, mantenendo al contempo una rigorosa sicurezza della IP tramite la governance di Unity Catalog.
  • Centralizzando i dati ed eliminando le dipendenze da API esterne, il workbench ottimizza l'intera pipeline di ricerca, dall'ipotesi iniziale al candidato terapeutico classificato, mantenendo i dati proprietari all'interno di un perimetro controllato e regolamentato.

Portare la scoperta di farmaci accelerata da GPU direttamente sui tuoi dati

I leader nel settore delle scienze della vita hanno bisogno di un'AI specifica per il dominio, pronta per la produzione e creata direttamente sui propri dati governati. Insieme, Databricks e NVIDIA stanno rendendo possibile questa transizione: combinando Databricks (governance di Unity Catalog, MLflow, Model Serving e calcolo GPU serverless) con NVIDIA BioNeMo Agent Toolkit, inclusi le librerie NVIDIA CUDA-X, Parabricks e un catalogo in continua crescita di modelli di biologia e chimica come Proteina-Complexa, i clienti possono eseguire un'AI specializzata dove risiedono già i dati, anziché inviare dati sensibili ad API di terze parti.

Questo post si concentra su una delle applicazioni più complesse di questa combinazione: R&D nelle scienze della vita e scoperta di farmaci - un lavoro che può richiedere anni e miliardi di investimenti, su dati che sono in gran parte non strutturati e sensibili, tra genomica, trascrittomica, biologia strutturale e chimica - discipline che raramente condividono una toolchain comune. Genesis Workbench rappresenta tutto questo all'atto pratico.

Cos'è Genesis Workbench?

Genesis Workbench è un blueprint aperto per un'applicazione di scienze della vita su Databricks - un workbench modulare che riunisce le fasi principali della scoperta computazionale di farmaci sotto lo stesso tetto, un'unica UI e un unico modello di governance. Ogni dominio scientifico è un modulo distribuibile in modo indipendente:

  • Genomica
  • Singola cellula
  • Grandi molecole
  • Piccole molecole
  • Fine-tuning del modello NVIDIA BioNeMo

Questa piattaforma trasforma una cassetta degli attrezzi standard in un workbench scientifico coeso. Inoltre, l'intero ambiente è facilmente distribuibile tramite un singolo script. Utilizzando un'interfaccia utente (UI) point-and-click basata su Databricks Apps, i ricercatori di laboratorio possono navigare nell'intero workflow di scoperta senza scrivere codice. L'architettura sottostante si basa su modelli open-source gestiti in Unity Catalog, tracciati tramite MLflow ed erogati su endpoint GPU. Centralizzando i dataset pubblici e proprietari con Databricks AI Search, abbiamo eliminato completamente le dipendenze da API esterne. In definitiva, questa configurazione fluida collega ogni fase del processo, consentendo ai risultati della genomica di confluire senza sforzo nella validazione a singola cellula, nella previsione della struttura del target, nel docking dei candidati, nell'ADMET e nel ranking.

In che modo Genesis Workbench accelera la R&D nelle scienze della vita

Portando ogni fase della scoperta su un'unica piattaforma nativa di Databricks e accelerata da NVIDIA, Genesis Workbench affronta direttamente quattro problemi che storicamente hanno impedito all'AI di dare risultati nella R&D delle scienze della vita:

  • Generazione di workflow assistita da AI. Usa il workbench in modo dichiarativo: descrivi la scienza che desideri e ottieni una pipeline eseguibile, senza cablaggi o codice boilerplate. Questo abbassa la barriera da "so come costruirlo" a "so cosa voglio", consentendo a più scienziati di trasformare le idee in esperimenti e innovare più rapidamente. Vortex è il canvas visivo che rende possibile tutto questo.
  • Supporto MCP. Genesis Workbench diventa un elemento trainante per il più ampio ecosistema AI: i suoi modelli e workflow diventano strumenti che qualsiasi agente o client MCP può chiamare, in modo che la piattaforma alimenti i tuoi assistenti e le tue pipeline anziché vivere in un silo. Un server Model Context Protocol (MCP) complementare lo espone a Databricks AI Playground, Claude, Cursor o ai tuoi agenti, con distribuzione automatica insieme al core.
  • Sicurezza e rischio di IP. Sequenze, librerie di composti, risultati di test e dati dei pazienti sono tra gli asset più regolamentati di un'organizzazione. I modelli e i dati vengono scaricati una sola volta in Unity Catalog, l'inferenza viene eseguita sugli endpoint di Model Serving nel tuo workspace e non vi è alcuna dipendenza da API esterne a runtime: la tua IP non lascia mai il tuo perimetro governato.
  • Un panorama di modelli in costante evoluzione. La bio-AI si muove rapidamente. L'architettura modulare di Genesis Workbench tratta ogni modello come un sottomodulo distribuibile in modo indipendente nello stesso substrato di registro e serving, quindi l'adozione di GenMol, Proteina-Complexa o di un modello più recente è un semplice passaggio di distribuzione, non una riscrittura.
  • Fine-tuning. Il fine-tuning di modelli open-source su dataset proprietari altamente governati nel tuo Lakehouse semplifica l'utilizzo delle conoscenze interne esistenti per un'ideazione e una scoperta dei candidati più rapide.
  • Integrazione complessa tra discipline diverse. Poiché ogni modulo condivide un'unica piattaforma, un unico modello di governance e un unico substrato di job/serving/MLflow, le discipline si collegano in modo nativo, con passaggi in-app (inclusa la risoluzione gene→sequenza) anziché fragili copia-incolla tra sistemi. Il workbench è il livello di integrazione.

Coinvolgere gli scienziati non computazionali. Un'interfaccia utente (UI) React point-and-click - con visualizzatori 3D interattivi e interpretazioni dei risultati in linguaggio naturale generate dall'AI - consente a un biologo di effettuare il calling delle varianti, simulare un knockout, progettare un legante e classificare i candidati senza scrivere codice, mentre i colleghi computazionali mantengono il pieno accesso a job, modelli e artefatti sottostanti con NVIDIA in ogni fase della pipeline.

In quasi tutte le fasi, il lavoro più pesante è svolto dal calcolo accelerato e dai modelli NVIDIA:

Fase di scoperta

Tecnologia NVIDIA

Cosa fa in Genesis Workbench

Genomica

Parabricks

Parte del workflow di genomica

Calling e annotazione delle varianti germinali accelerati da GPU, che fanno emergere le varianti patogene dai dati nel tuo lakehouse

Singola cellula

RAPIDS-singlecell (parte di scverse)

Parte del workflow a singola cellula

Clustering, UMAP ed espressione differenziale accelerati da GPU su dataset di grandi dimensioni su scala, trasformando un job batch notturno in un'esplorazione interattiva

Piccole molecole

GenMol (NV-GenMol-89M-v2)

Parte del workflow di progettazione guidata delle molecole

Genera molecole nuove e sintetizzabili da uno scaffold iniziale in un ciclo chiuso genera→valuta→riavvia, in presenza di vincoli rigidi con docking opzionale nel reward

Grandi molecole

Proteina-Complexa

Parte del workflow di progettazione degli enzimi

Progettazione di leganti proteici tramite flow-matching e scaffolding di motivi (con ProteinMPNN + ESMFold), da una struttura target a candidati leganti progettati e classificati

Varie fasi

BioNeMo Recipes

Esegue il fine-tuning e l'inferenza con modelli preconfigurati nel container BioNeMo sui tuoi dati, sulla tua infrastruttura

Il futuro di Genesis Workbench

Guardando al futuro, ci stiamo concentrando sul rendere il workbench ancora più accessibile e potente per la scoperta scientifica. La nostra roadmap include:

  • Generazione automatizzata di workflow: Stiamo introducendo l'automazione basata sull'AI per generare workflow scientifici complessi, semplificando l'integrazione trasparente di nuovi modelli e diverse fonti di dati.
  • Integrazione di NVIDIA AI Skills: Stiamo integrando NVIDIA BioNeMo Skills e mostrando come BioNeMo Agent Toolkit possa migliorare l'intelligenza e le funzionalità native della piattaforma. Ulteriori skill verranno integrate non appena saranno disponibili.
  • Servizi MCP: Prevediamo di aggiungere servizi MCP (Model Context Protocol) per garantire che Genesis Workbench possa fornire facilmente dati e insight di alta qualità alle applicazioni consumer a valle.

Dalla malattia al candidato, su un'unica piattaforma governata

Genesis Workbench consente agli scienziati di gestire in modo sicuro l'intero processo di scoperta dei farmaci, dall'ipotesi alle terapie classificate, senza che i dati lascino mai l'ambiente. Unificando strumenti accelerati da GPU come Parabricks, CUDA-X Data Science, Proteina-Complexa, GenMol e BioNeMo Agent Toolkit sotto la governance di Unity Catalog, offre una UI intuitiva creata appositamente per i ricercatori di laboratorio. Questa potente pipeline in-silico garantisce che solo i target con la massima probabilità avanzino al wet lab, riducendo drasticamente la perdita di tempo e risorse. Questa è la promessa dell'AI di settore resa concreta: portare un'AI specializzata e sicura direttamente sui tuoi dati.

Pronto ad accelerare la scoperta di farmaci?

Distribuisci Genesis Workbench oggi stesso dal nostro repository GitHub. Forniamo anche skill di Claude Code per assisterti nelle distribuzioni e nelle modifiche. I contributi sono benvenuti, quindi non esitare a collaborare al progetto se puoi! Se sei già un cliente Databricks e ti interessa una demo dal vivo, contatta il tuo team di account Databricks.

Genesis Workbench è un blueprint aperto di Databricks Industry Solutions.

(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale

Ricevi gli ultimi articoli nella tua casella di posta

Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.