Eine offene, verwaltete Life-Sciences-Workbench, die beschleunigtes NVIDIA-Computing und offene NVIDIA BioNeMo-Biologiemodelle zu einer End-to-End-Forschungsplattform verbindet – komplett in Ihrer eigenen Databricks-Umgebung.
von Mark Lee und Srijit Nair
Führende Köpfe im Bereich Life Sciences benötigen fachspezifische, produktionsbereite AI, die direkt auf ihren eigenen verwalteten Daten aufbaut. Gemeinsam ermöglichen Databricks und NVIDIA diesen Wandel: Durch die Kombination von Databricks (Unity Catalog-Governance, MLflow, Model Serving und serverlosem GPU-Computing) mit NVIDIA BioNeMo Agent Toolkit, einschließlich NVIDIA CUDA-X-Bibliotheken, Parabricks und einem wachsenden Katalog von Biologie- und Chemiemodellen wie Proteina-Complexa, können Kunden spezialisierte AI dort ausführen, wo die Daten bereits liegen, anstatt sensible Daten an APIs von Drittanbietern zu senden.
Dieser Beitrag konzentriert sich auf eine der anspruchsvollsten Anwendungen dieser Kombination: R&D und Wirkstoffforschung im Bereich Life Sciences – eine Arbeit, die Jahre und Milliarden an Investitionen erfordern kann, auf Daten, die überwiegend unstrukturiert und sensibel sind, über Genomik, Transkriptomik, Strukturbiologie und Chemie hinweg – Disziplinen, die selten eine gemeinsame Toolchain nutzen. Genesis Workbench zeigt, wie das in der Praxis aussieht.
Genesis Workbench ist ein offener Blueprint für eine Life-Sciences-Anwendung auf Databricks – eine modulare Workbench, die die wichtigsten Phasen der computergestützten Wirkstoffforschung unter einem Dach, einer UI und einem Governance-Modell vereint. Jeder wissenschaftliche Bereich ist ein unabhängig bereitstellbares Modul:
Diese Plattform verwandelt einen Standard-Werkzeugkasten in eine zusammenhängende wissenschaftliche Workbench. Das Beste daran ist, dass die gesamte Umgebung ganz einfach über ein einziges Skript bereitgestellt werden kann. Über eine Point-and-Click-UI, die auf Databricks Apps basiert, können Laborwissenschaftler den gesamten Forschungs-Workflow durchlaufen, ohne Code schreiben zu müssen. Die zugrunde liegende Architektur basiert auf Open-Source-Modellen, die in Unity Catalog verwaltet, über MLflow nachverfolgt und auf GPU-Endpunkten bereitgestellt werden. Durch die Zentralisierung sowohl öffentlicher als auch proprietärer Datensätze mit Databricks AI Search haben wir externe API-Abhängigkeiten vollständig eliminiert. Letztendlich verbindet dieses nahtlose Setup jeden Schritt des Prozesses – so können Erkenntnisse aus der Genomik mühelos in die Single-Cell-Validierung, die Vorhersage von Zielstrukturen, das Andocken von Kandidaten, ADMET und das Ranking einfließen.
Indem sie jede Phase der Forschung auf einer Databricks-nativen und NVIDIA-beschleunigten Plattform zusammenführt, löst die Genesis Workbench direkt vier Probleme, die in der Vergangenheit verhindert haben, dass AI in der R&D im Bereich Life Sciences ihr volles Potenzial entfaltet:

Wissenschaftler ohne Programmierkenntnisse einbinden. Eine Point-and-Click- React-UI – mit interaktiven 3D-Viewern und AI-generierten, leicht verständlichen Ergebnisinterpretationen – ermöglicht es Biologen, Varianten aufzurufen, einen Knockout zu simulieren, einen Binder zu entwerfen und Kandidaten zu bewerten, ohne Code schreiben zu müssen, während Kollegen aus der Bioinformatik in jeder Phase der Pipeline vollen Zugriff auf die zugrunde liegenden Jobs, Modelle und Artefakte mit NVIDIA behalten.
In fast jeder Phase wird die Hauptarbeit von NVIDIA-beschleunigtem Computing und entsprechenden Modellen geleistet:
Forschungsphase | NVIDIA-Technologie | Funktion in der Genesis Workbench |
|---|---|---|
Genomik | Parabricks | Teil des Genomik-Workflows GPU-beschleunigtes Aufrufen und Annotieren von Keimbahnvarianten – Identifizierung pathogener Varianten aus Daten in Ihrem Lakehouse |
Single-Cell | RAPIDS-singlecell (Teil von scverse) | Teil des Single-Cell-Workflows GPU-beschleunigtes Clustering, UMAP und differenzielle Expression auf großen Datensätzen in beliebigem Umfang – verwandelt einen Batch-Job über Nacht in eine interaktive Erkundung |
Kleine Moleküle | GenMol (NV-GenMol-89M-v2) | Teil des geführten Moleküldesign-Workflows Generiert neue, synthetisierbare Moleküle aus einem Ausgangsgerüst in einer geschlossenen Generate→Score→Reseed-Schleife unter strengen Einschränkungen mit optionalem Docking im Reward |
Große Moleküle | Proteina-Complexa | Teil des Enzymdesign-Workflows Flow-Matching-Protein- Binder-Design und Motiv-Scaffolding (mit ProteinMPNN + ESMFold) – von einer Zielstruktur zu bewerteten, entworfenen Binder-Kandidaten |
Verschiedene Phasen | BioNeMo Recipes | Führt Feintuning und Inferenz mit vorkonfigurierten Modellen im BioNeMo-Container auf Ihren Daten und Ihrer Infrastruktur aus |
Mit Blick auf die Zukunft konzentrieren wir uns darauf, die Workbench für die wissenschaftliche Forschung noch zugänglicher und leistungsfähiger zu machen. Unsere Roadmap umfasst:
Genesis Workbench ermöglicht es Wissenschaftlern, den gesamten Prozess der Wirkstoffforschung – von der Hypothese bis hin zu priorisierten Therapeutika – sicher zu steuern, ohne dass ihre Daten jemals die Umgebung verlassen. Durch die Zusammenführung GPU-beschleunigter Tools wie Parabricks, CUDA-X Data Science, Proteina-Complexa, GenMol und dem BioNeMo Agent Toolkit unter der Governance von Unity Catalog bietet sie eine intuitive Benutzeroberfläche (UI), die speziell für Laborwissenschaftler entwickelt wurde. Diese leistungsstarke In-silico-Pipeline stellt sicher, dass nur die Targets mit der höchsten Erfolgswahrscheinlichkeit ins Nasslabor gelangen, was den Zeit- und Ressourcenaufwand drastisch reduziert. Das ist das konkrete Versprechen von Branchen-KI: spezialisierte, sichere KI direkt zu Ihren Daten zu bringen.
Stellen Sie Genesis Workbench noch heute über unser GitHub-Repository bereit. Wir bieten auch Claude Code Skills an, um Sie bei Bereitstellungen und Anpassungen zu unterstützen. Wir freuen uns über Beiträge – bringen Sie sich also gerne in das Projekt ein! Wenn Sie bereits Databricks-Kunde sind und Interesse an einer Live-Demo haben, wenden Sie sich bitte an Ihr Databricks-Account-Team.
Genesis Workbench ist ein offener Databricks Industry Solutions Blueprint.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.