Un workbench aperto e regolamentato per le scienze della vita che unisce il calcolo accelerato di NVIDIA e i modelli aperti NVIDIA BioNeMo per la biologia in una piattaforma di scoperta end-to-end, eseguita interamente nel tuo ambiente Databricks
di Mark Lee e Srijit Nair
I leader nel settore delle scienze della vita hanno bisogno di un'AI specifica per il dominio, pronta per la produzione e creata direttamente sui propri dati governati. Insieme, Databricks e NVIDIA stanno rendendo possibile questa transizione: combinando Databricks (governance di Unity Catalog, MLflow, Model Serving e calcolo GPU serverless) con NVIDIA BioNeMo Agent Toolkit, inclusi le librerie NVIDIA CUDA-X, Parabricks e un catalogo in continua crescita di modelli di biologia e chimica come Proteina-Complexa, i clienti possono eseguire un'AI specializzata dove risiedono già i dati, anziché inviare dati sensibili ad API di terze parti.
Questo post si concentra su una delle applicazioni più complesse di questa combinazione: R&D nelle scienze della vita e scoperta di farmaci - un lavoro che può richiedere anni e miliardi di investimenti, su dati che sono in gran parte non strutturati e sensibili, tra genomica, trascrittomica, biologia strutturale e chimica - discipline che raramente condividono una toolchain comune. Genesis Workbench rappresenta tutto questo all'atto pratico.
Genesis Workbench è un blueprint aperto per un'applicazione di scienze della vita su Databricks - un workbench modulare che riunisce le fasi principali della scoperta computazionale di farmaci sotto lo stesso tetto, un'unica UI e un unico modello di governance. Ogni dominio scientifico è un modulo distribuibile in modo indipendente:
Questa piattaforma trasforma una cassetta degli attrezzi standard in un workbench scientifico coeso. Inoltre, l'intero ambiente è facilmente distribuibile tramite un singolo script. Utilizzando un'interfaccia utente (UI) point-and-click basata su Databricks Apps, i ricercatori di laboratorio possono navigare nell'intero workflow di scoperta senza scrivere codice. L'architettura sottostante si basa su modelli open-source gestiti in Unity Catalog, tracciati tramite MLflow ed erogati su endpoint GPU. Centralizzando i dataset pubblici e proprietari con Databricks AI Search, abbiamo eliminato completamente le dipendenze da API esterne. In definitiva, questa configurazione fluida collega ogni fase del processo, consentendo ai risultati della genomica di confluire senza sforzo nella validazione a singola cellula, nella previsione della struttura del target, nel docking dei candidati, nell'ADMET e nel ranking.
Portando ogni fase della scoperta su un'unica piattaforma nativa di Databricks e accelerata da NVIDIA, Genesis Workbench affronta direttamente quattro problemi che storicamente hanno impedito all'AI di dare risultati nella R&D delle scienze della vita:

Coinvolgere gli scienziati non computazionali. Un'interfaccia utente (UI) React point-and-click - con visualizzatori 3D interattivi e interpretazioni dei risultati in linguaggio naturale generate dall'AI - consente a un biologo di effettuare il calling delle varianti, simulare un knockout, progettare un legante e classificare i candidati senza scrivere codice, mentre i colleghi computazionali mantengono il pieno accesso a job, modelli e artefatti sottostanti con NVIDIA in ogni fase della pipeline.
In quasi tutte le fasi, il lavoro più pesante è svolto dal calcolo accelerato e dai modelli NVIDIA:
Fase di scoperta | Tecnologia NVIDIA | Cosa fa in Genesis Workbench |
|---|---|---|
Genomica | Parabricks | Parte del workflow di genomica Calling e annotazione delle varianti germinali accelerati da GPU, che fanno emergere le varianti patogene dai dati nel tuo lakehouse |
Singola cellula | RAPIDS-singlecell (parte di scverse) | Parte del workflow a singola cellula Clustering, UMAP ed espressione differenziale accelerati da GPU su dataset di grandi dimensioni su scala, trasformando un job batch notturno in un'esplorazione interattiva |
Piccole molecole | GenMol (NV-GenMol-89M-v2) | Parte del workflow di progettazione guidata delle molecole Genera molecole nuove e sintetizzabili da uno scaffold iniziale in un ciclo chiuso genera→valuta→riavvia, in presenza di vincoli rigidi con docking opzionale nel reward |
Grandi molecole | Proteina-Complexa | Parte del workflow di progettazione degli enzimi Progettazione di leganti proteici tramite flow-matching e scaffolding di motivi (con ProteinMPNN + ESMFold), da una struttura target a candidati leganti progettati e classificati |
Varie fasi | BioNeMo Recipes | Esegue il fine-tuning e l'inferenza con modelli preconfigurati nel container BioNeMo sui tuoi dati, sulla tua infrastruttura |
Guardando al futuro, ci stiamo concentrando sul rendere il workbench ancora più accessibile e potente per la scoperta scientifica. La nostra roadmap include:
Genesis Workbench consente agli scienziati di gestire in modo sicuro l'intero processo di scoperta dei farmaci, dall'ipotesi alle terapie classificate, senza che i dati lascino mai l'ambiente. Unificando strumenti accelerati da GPU come Parabricks, CUDA-X Data Science, Proteina-Complexa, GenMol e BioNeMo Agent Toolkit sotto la governance di Unity Catalog, offre una UI intuitiva creata appositamente per i ricercatori di laboratorio. Questa potente pipeline in-silico garantisce che solo i target con la massima probabilità avanzino al wet lab, riducendo drasticamente la perdita di tempo e risorse. Questa è la promessa dell'AI di settore resa concreta: portare un'AI specializzata e sicura direttamente sui tuoi dati.
Distribuisci Genesis Workbench oggi stesso dal nostro repository GitHub. Forniamo anche skill di Claude Code per assisterti nelle distribuzioni e nelle modifiche. I contributi sono benvenuti, quindi non esitare a collaborare al progetto se puoi! Se sei già un cliente Databricks e ti interessa una demo dal vivo, contatta il tuo team di account Databricks.
Genesis Workbench è un blueprint aperto di Databricks Industry Solutions.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.