Direkt zum Hauptinhalt

Genesis Workbench: Ein Blueprint für Branchen-KI in den Life Sciences, powered by Databricks und NVIDIA

Eine offene, verwaltete Life-Sciences-Workbench, die beschleunigtes NVIDIA-Computing und offene NVIDIA BioNeMo-Biologiemodelle zu einer End-to-End-Forschungsplattform verbindet – komplett in Ihrer eigenen Databricks-Umgebung.

von Mark Lee und Srijit Nair

  • Genesis Workbench ist ein offener, modularer Databricks-Blueprint, der die beschleunigten Computing-Tools von NVIDIA, einschließlich BioNeMo und Parabricks, in einer einzigen, sicheren Umgebung für die End-to-End-Arzneimittelforschung integriert.
  • Die Plattform vereinfacht komplexe R&D, indem sie eine No-Code-Point-and-Click-Benutzeroberfläche bereitstellt, mit der Laborwissenschaftler Genomik- und Molekulardesign-Aufgaben ausführen können, während über die Unity Catalog-Governance eine strenge IP-Sicherheit gewährleistet bleibt.
  • Durch die Zentralisierung von Daten und die Eliminierung externer API-Abhängigkeiten optimiert die Workbench die gesamte Forschungspipeline von der ersten Hypothese bis zum bewerteten therapeutischen Kandidaten, sodass geschützte Daten innerhalb eines kontrollierten, verwalteten Bereichs verbleiben.

GPU-beschleunigte Wirkstoffforschung direkt auf Ihren Daten

Führende Köpfe im Bereich Life Sciences benötigen fachspezifische, produktionsbereite AI, die direkt auf ihren eigenen verwalteten Daten aufbaut. Gemeinsam ermöglichen Databricks und NVIDIA diesen Wandel: Durch die Kombination von Databricks (Unity Catalog-Governance, MLflow, Model Serving und serverlosem GPU-Computing) mit NVIDIA BioNeMo Agent Toolkit, einschließlich NVIDIA CUDA-X-Bibliotheken, Parabricks und einem wachsenden Katalog von Biologie- und Chemiemodellen wie Proteina-Complexa, können Kunden spezialisierte AI dort ausführen, wo die Daten bereits liegen, anstatt sensible Daten an APIs von Drittanbietern zu senden.

Dieser Beitrag konzentriert sich auf eine der anspruchsvollsten Anwendungen dieser Kombination: R&D und Wirkstoffforschung im Bereich Life Sciences – eine Arbeit, die Jahre und Milliarden an Investitionen erfordern kann, auf Daten, die überwiegend unstrukturiert und sensibel sind, über Genomik, Transkriptomik, Strukturbiologie und Chemie hinweg – Disziplinen, die selten eine gemeinsame Toolchain nutzen. Genesis Workbench zeigt, wie das in der Praxis aussieht.

Was ist Genesis Workbench?

Genesis Workbench ist ein offener Blueprint für eine Life-Sciences-Anwendung auf Databricks – eine modulare Workbench, die die wichtigsten Phasen der computergestützten Wirkstoffforschung unter einem Dach, einer UI und einem Governance-Modell vereint. Jeder wissenschaftliche Bereich ist ein unabhängig bereitstellbares Modul:

  • Genomik
  • Single-Cell
  • Große Moleküle
  • Kleine Moleküle
  • Feintuning von NVIDIA BioNeMo-Modellen

Diese Plattform verwandelt einen Standard-Werkzeugkasten in eine zusammenhängende wissenschaftliche Workbench. Das Beste daran ist, dass die gesamte Umgebung ganz einfach über ein einziges Skript bereitgestellt werden kann. Über eine Point-and-Click-UI, die auf Databricks Apps basiert, können Laborwissenschaftler den gesamten Forschungs-Workflow durchlaufen, ohne Code schreiben zu müssen. Die zugrunde liegende Architektur basiert auf Open-Source-Modellen, die in Unity Catalog verwaltet, über MLflow nachverfolgt und auf GPU-Endpunkten bereitgestellt werden. Durch die Zentralisierung sowohl öffentlicher als auch proprietärer Datensätze mit Databricks AI Search haben wir externe API-Abhängigkeiten vollständig eliminiert. Letztendlich verbindet dieses nahtlose Setup jeden Schritt des Prozesses – so können Erkenntnisse aus der Genomik mühelos in die Single-Cell-Validierung, die Vorhersage von Zielstrukturen, das Andocken von Kandidaten, ADMET und das Ranking einfließen.

Wie die Genesis Workbench die R&D im Bereich Life Sciences beschleunigt

Indem sie jede Phase der Forschung auf einer Databricks-nativen und NVIDIA-beschleunigten Plattform zusammenführt, löst die Genesis Workbench direkt vier Probleme, die in der Vergangenheit verhindert haben, dass AI in der R&D im Bereich Life Sciences ihr volles Potenzial entfaltet:

  • AI-gestützte Workflow-Generierung. Nutzen Sie die Workbench deklarativ – beschreiben Sie die wissenschaftliche Fragestellung und erhalten Sie eine ausführbare Pipeline, ganz ohne Programmieraufwand oder Boilerplate-Code. Dies senkt die Hürde von „Ich weiß, wie man das baut“ zu „Ich weiß, was ich will“, sodass mehr Wissenschaftler Ideen in Experimente umsetzen und schneller Innovationen entwickeln können. Vortex ist die visuelle Arbeitsfläche, die dies ermöglicht.
  • MCP-Unterstützung. Die Genesis Workbench wird zum Arbeitstier für das breitere AI-Ökosystem – ihre Modelle und Workflows werden zu Tools, die jeder Agent oder MCP-Client aufrufen kann. So treibt die Plattform Ihre Assistenten und Pipelines an, anstatt in einem Silo zu existieren. Ein zugehöriger Model Context Protocol (MCP)-Server stellt sie dem Databricks AI Playground, Claude, Cursor oder Ihren eigenen Agenten zur Verfügung; die Bereitstellung erfolgt automatisch mit dem Core.
  • IP-Risiko und Sicherheit. Sequenzen, Substanzbibliotheken, Testergebnisse und Patientendaten gehören zu den am strengsten regulierten Werten eines Unternehmens. Modelle und Daten werden einmalig in den Unity Catalog heruntergeladen, die Inferenz läuft auf Model Serving-Endpunkten in Ihrem eigenen Workspace, und es gibt keine Laufzeitabhängigkeit von externen APIs – Ihre IP verlässt nie Ihren geschützten Bereich.
  • Eine sich ständig verändernde Modelllandschaft. Bio-AI entwickelt sich rasant. Die modulare Architektur der Genesis Workbench behandelt jedes Modell als ein unabhängig bereitstellbares Submodul in derselben Registry- und Serving-Infrastruktur. Die Einführung von GenMol, Proteina-Complexa oder eines neueren Modells ist daher nur ein Bereitstellungsschritt – kein Umschreiben des Codes.
  • Feintuning. Das Feintuning von Open-Source-Modellen auf streng kontrollierten, proprietären Datensätzen in Ihrem Lakehouse macht es einfach, vorhandenes internes Wissen für eine schnellere Ideenfindung und Kandidatensuche zu nutzen.
  • Komplexe disziplinübergreifende Integration. Da jedes Modul dieselbe Plattform, dasselbe Governance-Modell und dieselbe Job-/Serving-/MLflow-Infrastruktur nutzt, sind die Disziplinen nativ miteinander verbunden – mit In-App-Übergaben (einschließlich der Auflösung von Gen→Sequenz) anstelle von fehleranfälligem Copy-and-Paste zwischen Systemen. Die Workbench ist die Integrationsschicht.

Wissenschaftler ohne Programmierkenntnisse einbinden. Eine Point-and-Click- React-UI – mit interaktiven 3D-Viewern und AI-generierten, leicht verständlichen Ergebnisinterpretationen – ermöglicht es Biologen, Varianten aufzurufen, einen Knockout zu simulieren, einen Binder zu entwerfen und Kandidaten zu bewerten, ohne Code schreiben zu müssen, während Kollegen aus der Bioinformatik in jeder Phase der Pipeline vollen Zugriff auf die zugrunde liegenden Jobs, Modelle und Artefakte mit NVIDIA behalten.

In fast jeder Phase wird die Hauptarbeit von NVIDIA-beschleunigtem Computing und entsprechenden Modellen geleistet:

Forschungsphase

NVIDIA-Technologie

Funktion in der Genesis Workbench

Genomik

Parabricks

Teil des Genomik-Workflows

GPU-beschleunigtes Aufrufen und Annotieren von Keimbahnvarianten – Identifizierung pathogener Varianten aus Daten in Ihrem Lakehouse

Single-Cell

RAPIDS-singlecell (Teil von scverse)

Teil des Single-Cell-Workflows

GPU-beschleunigtes Clustering, UMAP und differenzielle Expression auf großen Datensätzen in beliebigem Umfang – verwandelt einen Batch-Job über Nacht in eine interaktive Erkundung

Kleine Moleküle

GenMol (NV-GenMol-89M-v2)

Teil des geführten Moleküldesign-Workflows

Generiert neue, synthetisierbare Moleküle aus einem Ausgangsgerüst in einer geschlossenen Generate→Score→Reseed-Schleife unter strengen Einschränkungen mit optionalem Docking im Reward

Große Moleküle

Proteina-Complexa

Teil des Enzymdesign-Workflows

Flow-Matching-Protein- Binder-Design und Motiv-Scaffolding (mit ProteinMPNN + ESMFold) – von einer Zielstruktur zu bewerteten, entworfenen Binder-Kandidaten

Verschiedene Phasen

BioNeMo Recipes

Führt Feintuning und Inferenz mit vorkonfigurierten Modellen im BioNeMo-Container auf Ihren Daten und Ihrer Infrastruktur aus

Die Zukunft der Genesis Workbench

Mit Blick auf die Zukunft konzentrieren wir uns darauf, die Workbench für die wissenschaftliche Forschung noch zugänglicher und leistungsfähiger zu machen. Unsere Roadmap umfasst:

  • Automatisierte Workflow-Generierung: Wir führen eine KI-gestützte Automatisierung zur Erstellung komplexer wissenschaftlicher Workflows ein, um die nahtlose Integration neuer Modelle und vielfältiger Datenquellen zu erleichtern.
  • Integration von NVIDIA AI Skills: Wir integrieren NVIDIA BioNeMo Skills und zeigen, wie das BioNeMo Agent Toolkit die native Intelligenz und die Funktionen der Plattform erweitern kann. Weitere Skills werden integriert, sobald sie verfügbar sind.
  • MCP-Services: Wir planen die Integration von MCP-Services (Model Context Protocol), um sicherzustellen, dass Genesis Workbench nachgelagerten Anwendungen problemlos hochwertige Daten und Erkenntnisse bereitstellen kann.

Vom Krankheitsbild zum Wirkstoffkandidaten auf einer einzigen Plattform unter einheitlicher Governance

Genesis Workbench ermöglicht es Wissenschaftlern, den gesamten Prozess der Wirkstoffforschung – von der Hypothese bis hin zu priorisierten Therapeutika – sicher zu steuern, ohne dass ihre Daten jemals die Umgebung verlassen. Durch die Zusammenführung GPU-beschleunigter Tools wie Parabricks, CUDA-X Data Science, Proteina-Complexa, GenMol und dem BioNeMo Agent Toolkit unter der Governance von Unity Catalog bietet sie eine intuitive Benutzeroberfläche (UI), die speziell für Laborwissenschaftler entwickelt wurde. Diese leistungsstarke In-silico-Pipeline stellt sicher, dass nur die Targets mit der höchsten Erfolgswahrscheinlichkeit ins Nasslabor gelangen, was den Zeit- und Ressourcenaufwand drastisch reduziert. Das ist das konkrete Versprechen von Branchen-KI: spezialisierte, sichere KI direkt zu Ihren Daten zu bringen.

Bereit, Ihre Wirkstoffforschung zu beschleunigen?

Stellen Sie Genesis Workbench noch heute über unser GitHub-Repository bereit. Wir bieten auch Claude Code Skills an, um Sie bei Bereitstellungen und Anpassungen zu unterstützen. Wir freuen uns über Beiträge – bringen Sie sich also gerne in das Projekt ein! Wenn Sie bereits Databricks-Kunde sind und Interesse an einer Live-Demo haben, wenden Sie sich bitte an Ihr Databricks-Account-Team.

Genesis Workbench ist ein offener Databricks Industry Solutions Blueprint.

(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag

Erhalten Sie die neuesten Beiträge in Ihrem Posteingang

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.