Um workbench de ciências da vida aberto e governado que integra a computação acelerada e os modelos abertos BioNeMo da NVIDIA em uma plataforma de descoberta de ponta a ponta — executada inteiramente no seu próprio ambiente Databricks
por Mark Lee e Srijit Nair
Líderes de ciências da vida precisam de AI específica de domínio e pronta para produção, criada diretamente em seus próprios dados governados. Juntas, a Databricks e a NVIDIA estão viabilizando essa mudança: ao combinar a Databricks (governança do Unity Catalog, MLflow, Model Serving e computação GPU serverless) com o NVIDIA BioNeMo Agent Toolkit, incluindo as bibliotecas NVIDIA CUDA-X, o Parabricks e um catálogo crescente de modelos de biologia e química, como o Proteina-Complexa, os clientes podem executar AI especializada onde os dados já residem, em vez de enviar dados confidenciais para APIs de terceiros.
Este post foca em uma das aplicações mais difíceis dessa combinação: R&D em ciências da vida e descoberta de medicamentos — um trabalho que pode levar anos e bilhões em investimentos, com dados que são amplamente não estruturados e confidenciais, abrangendo genômica, transcriptômica, biologia estrutural e química — disciplinas que raramente compartilham uma cadeia de ferramentas comum. O Genesis Workbench é como isso se parece na prática.
O Genesis Workbench é um blueprint aberto para um aplicativo de ciências da vida na Databricks — uma bancada de trabalho modular que reúne as principais etapas da descoberta computacional de medicamentos sob o mesmo teto, uma única UI e um único modelo de governança. Cada domínio científico é um módulo implantável de forma independente:
Esta plataforma transforma uma caixa de ferramentas padrão em uma bancada científica coesa. O melhor de tudo é que todo o ambiente pode ser facilmente implantado por meio de um único script. Usando uma UI de apontar e clicar baseada no Databricks Apps, os cientistas de bancada podem navegar por todo o fluxo de trabalho de descoberta sem escrever código. A arquitetura subjacente depende de modelos de código aberto gerenciados no Unity Catalog, monitorados via MLflow e servidos em endpoints de GPU. Ao centralizar conjuntos de dados públicos e proprietários com o Databricks AI Search, eliminamos completamente as dependências de APIs externas. Por fim, essa configuração integrada conecta cada etapa do processo — permitindo que as descobertas genômicas fluam sem esforço para a validação de célula única, previsão de estrutura de alvos, docking de candidatos, ADMET e ranqueamento.
Ao trazer cada etapa de descoberta para uma única plataforma nativa da Databricks e acelerada pela NVIDIA, o Genesis Workbench aborda diretamente quatro problemas que historicamente impediram a AI de gerar resultados no R&D de ciências da vida:

Mantendo cientistas não computacionais envolvidos. Uma UI em React de apontar e clicar — com visualizadores 3D interativos e interpretações de resultados geradas por AI em linguagem simples — permite que um biólogo identifique variantes, simule um knockout, projete um ligante (binder) e ranqueie candidatos sem escrever código, enquanto os colegas da área computacional mantêm acesso total aos jobs, modelos e artefatos subjacentes com a NVIDIA em todas as etapas do pipeline.
Em quase todas as etapas, o trabalho pesado é feito pela computação acelerada e pelos modelos da NVIDIA:
Etapa de descoberta | Tecnologia NVIDIA | O que faz no Genesis Workbench |
|---|---|---|
Genômica | Parabricks | Parte do fluxo de trabalho de genômica Identificação e anotação de variantes germinativas aceleradas por GPU — revelando variantes patogênicas a partir de dados em seu lakehouse |
Célula única | RAPIDS-singlecell (parte do scverse) | Parte do fluxo de trabalho de célula única Agrupamento, UMAP e expressão diferencial acelerados por GPU em grandes conjuntos de dados em escala — transformando um job em lote (batch) que duraria a noite toda em uma exploração interativa |
Molécula pequena | GenMol (NV-GenMol-89M-v2) | Parte do fluxo de trabalho de design guiado de moléculas Gera moléculas novas e sintetizáveis a partir de um scaffold semente em um loop fechado de geração→pontuação→nova semeadura, sob restrições rígidas com docking opcional na recompensa |
Molécula grande | Proteina-Complexa | Parte do fluxo de trabalho de design de enzimas Design de ligantes (binders) proteicos por flow-matching e scaffolding de motivos (com ProteinMPNN + ESMFold) — de uma estrutura-alvo a candidatos a ligantes projetados e ranqueados |
Várias etapas | BioNeMo Recipes | Realiza o ajuste fino e executa inferência com modelos pré-pacotados no contêiner BioNeMo em seus dados, em sua infraestrutura |
Olhando para o futuro, estamos focados em tornar a bancada de trabalho ainda mais acessível e poderosa para a descoberta científica. Nosso roadmap inclui:
O Genesis Workbench capacita os cientistas a conduzirem com segurança todo o processo de descoberta de medicamentos — da hipótese às terapias classificadas — sem que seus dados saiam do ambiente. Ao unificar ferramentas aceleradas por GPU, como Parabricks, CUDA-X Data Science, Proteina-Complexa, GenMol e BioNeMo Agent Toolkit sob a governança do Unity Catalog, ele oferece uma UI intuitiva criada especificamente para cientistas de bancada. Esse poderoso pipeline in-silico garante que apenas os alvos com maior probabilidade avancem para o wet lab, reduzindo drasticamente o desperdício de tempo e recursos. Essa é a promessa da AI para o setor de forma concreta: levar AI especializada e segura diretamente aos seus dados.
Implante o Genesis Workbench hoje mesmo a partir do nosso repositório do GitHub. Também fornecemos habilidades do Claude Code para ajudar você em implantações e modificações. Contribuições são muito bem-vindas, então sinta-se à vontade para colaborar com o projeto se puder! Se você já é cliente da Databricks e tem interesse em uma demonstração ao vivo, fale com a sua equipe de conta da Databricks.
O Genesis Workbench é um blueprint aberto do Databricks Industry Solutions.
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.