Ir para o conteúdo principal
Saúde e ciências da vida

Genesis Workbench: Um modelo de referência para AI no setor de ciências da vida, impulsionado por Databricks e NVIDIA

Um workbench de ciências da vida aberto e governado que integra a computação acelerada e os modelos abertos BioNeMo da NVIDIA em uma plataforma de descoberta de ponta a ponta — executada inteiramente no seu próprio ambiente Databricks

por Mark Lee e Srijit Nair

  • O Genesis Workbench é um blueprint modular e aberto do Databricks que integra as ferramentas de computação acelerada da NVIDIA, incluindo BioNeMo e Parabricks, em um único ambiente seguro para a descoberta de medicamentos de ponta a ponta.
  • A plataforma simplifica processos complexos de R&D ao fornecer uma interface no-code e de apontar e clicar que permite aos cientistas de bancada executar tarefas de genômica e design molecular, mantendo uma segurança rigorosa de IP por meio da governança do Unity Catalog.
  • Ao centralizar os dados e eliminar dependências de APIs externas, o workbench otimiza todo o pipeline de pesquisa, desde a hipótese inicial até o candidato terapêutico classificado, mantendo os dados proprietários dentro de um perímetro controlado e governado.

Levando a descoberta de medicamentos acelerada por GPU até os seus dados

Líderes de ciências da vida precisam de AI específica de domínio e pronta para produção, criada diretamente em seus próprios dados governados. Juntas, a Databricks e a NVIDIA estão viabilizando essa mudança: ao combinar a Databricks (governança do Unity Catalog, MLflow, Model Serving e computação GPU serverless) com o NVIDIA BioNeMo Agent Toolkit, incluindo as bibliotecas NVIDIA CUDA-X, o Parabricks e um catálogo crescente de modelos de biologia e química, como o Proteina-Complexa, os clientes podem executar AI especializada onde os dados já residem, em vez de enviar dados confidenciais para APIs de terceiros.

Este post foca em uma das aplicações mais difíceis dessa combinação: R&D em ciências da vida e descoberta de medicamentos — um trabalho que pode levar anos e bilhões em investimentos, com dados que são amplamente não estruturados e confidenciais, abrangendo genômica, transcriptômica, biologia estrutural e química — disciplinas que raramente compartilham uma cadeia de ferramentas comum. O Genesis Workbench é como isso se parece na prática.

O que é o Genesis Workbench?

O Genesis Workbench é um blueprint aberto para um aplicativo de ciências da vida na Databricks — uma bancada de trabalho modular que reúne as principais etapas da descoberta computacional de medicamentos sob o mesmo teto, uma única UI e um único modelo de governança. Cada domínio científico é um módulo implantável de forma independente:

  • Genômica
  • Célula única
  • Moléculas grandes
  • Moléculas pequenas
  • Ajuste fino de modelos NVIDIA BioNeMo

Esta plataforma transforma uma caixa de ferramentas padrão em uma bancada científica coesa. O melhor de tudo é que todo o ambiente pode ser facilmente implantado por meio de um único script. Usando uma UI de apontar e clicar baseada no Databricks Apps, os cientistas de bancada podem navegar por todo o fluxo de trabalho de descoberta sem escrever código. A arquitetura subjacente depende de modelos de código aberto gerenciados no Unity Catalog, monitorados via MLflow e servidos em endpoints de GPU. Ao centralizar conjuntos de dados públicos e proprietários com o Databricks AI Search, eliminamos completamente as dependências de APIs externas. Por fim, essa configuração integrada conecta cada etapa do processo — permitindo que as descobertas genômicas fluam sem esforço para a validação de célula única, previsão de estrutura de alvos, docking de candidatos, ADMET e ranqueamento.

Como o Genesis Workbench acelera o R&D em Ciências da Vida

Ao trazer cada etapa de descoberta para uma única plataforma nativa da Databricks e acelerada pela NVIDIA, o Genesis Workbench aborda diretamente quatro problemas que historicamente impediram a AI de gerar resultados no R&D de ciências da vida:

  • Geração de fluxo de trabalho assistida por AI. Use a bancada de trabalho de forma declarativa: descreva a ciência que você deseja e obtenha um pipeline executável, sem necessidade de conexões complexas ou códigos repetitivos (boilerplate). Isso reduz a barreira de "eu sei como construir isso" para "eu sei o que quero", permitindo que mais cientistas transformem ideias em experimentos e inovem mais rapidamente. O Vortex é a tela visual que faz isso acontecer.
  • Suporte a MCP. O Genesis Workbench se torna um motor de trabalho para o ecossistema de AI mais amplo: seus modelos e fluxos de trabalho se tornam ferramentas que qualquer agente ou cliente MCP pode chamar, de modo que a plataforma impulsione seus assistentes e pipelines em vez de viver isolada. Um servidor complementar de Model Context Protocol (MCP) o expõe ao Databricks AI Playground, Claude, Cursor ou aos seus próprios agentes; implantado automaticamente com o core.
  • Segurança e risco de IP. Sequências, bibliotecas de compostos, resultados de ensaios e dados de pacientes estão entre os ativos mais regulamentados de uma organização. Modelos e dados são baixados uma vez no Unity Catalog, a inferência é executada em endpoints de Model Serving em seu próprio espaço de trabalho e não há dependência de APIs externas em tempo de execução — seu IP nunca sai do seu perímetro governado.
  • Um cenário de modelos em constante mudança. A Bio-AI avança rapidamente. A arquitetura modular do Genesis Workbench trata cada modelo como um submódulo implantável de forma independente no mesmo substrato de registro e serviço, de modo que a adoção do GenMol, Proteina-Complexa ou de um modelo mais recente seja apenas uma etapa de implantação — e não uma reescrita.
  • Ajuste fino. O ajuste fino de modelos de código aberto em conjuntos de dados proprietários altamente governados em seu Lakehouse facilita o aproveitamento do conhecimento interno existente para uma ideação e descoberta de candidatos mais rápidas.
  • Integração complexa entre disciplinas. Como cada módulo compartilha uma única plataforma, modelo de governança e substrato de job/serving/MLflow, as disciplinas se conectam nativamente — com transferências internas no aplicativo (handoffs) (incluindo a resolução de gene→sequência) em vez de cópias e colas frágeis entre sistemas. A bancada de trabalho é a camada de integração.

Mantendo cientistas não computacionais envolvidos. Uma UI em React de apontar e clicar — com visualizadores 3D interativos e interpretações de resultados geradas por AI em linguagem simples — permite que um biólogo identifique variantes, simule um knockout, projete um ligante (binder) e ranqueie candidatos sem escrever código, enquanto os colegas da área computacional mantêm acesso total aos jobs, modelos e artefatos subjacentes com a NVIDIA em todas as etapas do pipeline.

Em quase todas as etapas, o trabalho pesado é feito pela computação acelerada e pelos modelos da NVIDIA:

Etapa de descoberta

Tecnologia NVIDIA

O que faz no Genesis Workbench

Genômica

Parabricks

Parte do fluxo de trabalho de genômica

Identificação e anotação de variantes germinativas aceleradas por GPU — revelando variantes patogênicas a partir de dados em seu lakehouse

Célula única

RAPIDS-singlecell (parte do scverse)

Parte do fluxo de trabalho de célula única

Agrupamento, UMAP e expressão diferencial acelerados por GPU em grandes conjuntos de dados em escala — transformando um job em lote (batch) que duraria a noite toda em uma exploração interativa

Molécula pequena

GenMol (NV-GenMol-89M-v2)

Parte do fluxo de trabalho de design guiado de moléculas

Gera moléculas novas e sintetizáveis a partir de um scaffold semente em um loop fechado de geração→pontuação→nova semeadura, sob restrições rígidas com docking opcional na recompensa

Molécula grande

Proteina-Complexa

Parte do fluxo de trabalho de design de enzimas

Design de ligantes (binders) proteicos por flow-matching e scaffolding de motivos (com ProteinMPNN + ESMFold) — de uma estrutura-alvo a candidatos a ligantes projetados e ranqueados

Várias etapas

BioNeMo Recipes

Realiza o ajuste fino e executa inferência com modelos pré-pacotados no contêiner BioNeMo em seus dados, em sua infraestrutura

O futuro do Genesis Workbench

Olhando para o futuro, estamos focados em tornar a bancada de trabalho ainda mais acessível e poderosa para a descoberta científica. Nosso roadmap inclui:

  • Geração automatizada de fluxos de trabalho: Estamos introduzindo a automação orientada por AI para gerar fluxos de trabalho científicos complexos, facilitando a integração perfeita de novos modelos e diversas fontes de dados.
  • Integração de habilidades de AI da NVIDIA: Estamos integrando as habilidades do NVIDIA BioNeMo e mostrando como o BioNeMo Agent Toolkit pode aprimorar a inteligência e os recursos nativos da plataforma. Mais habilidades serão integradas à medida que estiverem disponíveis.
  • Serviços MCP: Planejamos adicionar serviços MCP (Model Context Protocol) para garantir que o Genesis Workbench possa fornecer facilmente dados e insights de alta qualidade para aplicações de consumo downstream.

Da doença ao candidato, em uma única plataforma governada

O Genesis Workbench capacita os cientistas a conduzirem com segurança todo o processo de descoberta de medicamentos — da hipótese às terapias classificadas — sem que seus dados saiam do ambiente. Ao unificar ferramentas aceleradas por GPU, como Parabricks, CUDA-X Data Science, Proteina-Complexa, GenMol e BioNeMo Agent Toolkit sob a governança do Unity Catalog, ele oferece uma UI intuitiva criada especificamente para cientistas de bancada. Esse poderoso pipeline in-silico garante que apenas os alvos com maior probabilidade avancem para o wet lab, reduzindo drasticamente o desperdício de tempo e recursos. Essa é a promessa da AI para o setor de forma concreta: levar AI especializada e segura diretamente aos seus dados.

Pronto para acelerar sua descoberta de medicamentos?

Implante o Genesis Workbench hoje mesmo a partir do nosso repositório do GitHub. Também fornecemos habilidades do Claude Code para ajudar você em implantações e modificações. Contribuições são muito bem-vindas, então sinta-se à vontade para colaborar com o projeto se puder! Se você já é cliente da Databricks e tem interesse em uma demonstração ao vivo, fale com a sua equipe de conta da Databricks.

O Genesis Workbench é um blueprint aberto do Databricks Industry Solutions.

(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

Receba os posts mais recentes na sua caixa de entrada

Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.