メインコンテンツへジャンプ
ログイン
      • Databricks を知る
        • エグゼクティブ向け
          • スタートアップ向け
            • レイクハウスアーキテクチャ
              • Mosaic Research
              • 導入事例
                • 注目の導入事例
                • パートナー
                  • クラウドプロバイダ
                    Databricks on AWS、Azure、GCP
                    • コンサルティング・SI
                      Databricks の構築・デプロイ、Databricks への移行のエキスパート
                      • 技術パートナー
                        既存のツールをレイクハウスに接続
                        • C&SI パートナー
                          レイクハウスの構築・デプロイメント、レイクハウスへの移行
                          • データパートナー
                            データコンシューマーのエコシステムにアクセス
                            • パートナーソリューション
                              業界・移行のニーズに応じたカスタムソリューション
                              • Databricks で構築
                                ビジネスの創造・マーケティング・成長
                              • Databricks プラットフォーム
                                • プラットフォームの概要
                                  データ・分析・AI のための統合プラットフォーム
                                  • データ管理
                                    データの信頼性・セキュリティ・パフォーマンス
                                    • 共有
                                      オープン、セキュア、ゼロコピーでのデータ共有
                                      • データウェアハウジング
                                        バッチ、ストリーミングデータのための ETL とオーケストレーション
                                        • ガバナンス
                                          データ・分析・AI のための統合ガバナンス
                                          • データエンジニアリング
                                            バッチ、ストリーミングデータのための ETL とオーケストレーション
                                            • 人工知能(AI)
                                              ML と生成 AI アプリケーションの構築とデプロイメント
                                              • データサイエンス
                                                データサイエンスの大規模な連携
                                                • BI
                                                  実世界データのインテリジェント分析
                                                  • アプリケーション開発
                                                    安全なデータと AI アプリを迅速に構築
                                                    • データベース
                                                      データアプリとAIエージェントのための Postgres
                                                    • 統合とデータ
                                                      • マーケットプレイス
                                                        データ、分析、AI のためのオープンマーケットプレイス
                                                        • IDE 統合
                                                          お気に入りの IDE(統合開発環境)でレイクハウスを構築
                                                          • パートナーコネクト
                                                            Databricks エコシステムの検索と統合
                                                          • ご利用料金
                                                            • Databricks のご利用料金
                                                              料金設定、DBU、その他
                                                              • コスト計算ツール
                                                                クラウド利用でのコンピュートコストの試算
                                                              • オープンソース
                                                                • オープンソーステクノロジー
                                                                  プラットフォームを支えるイノベーションをもっと詳しく
                                                                • 業界向け Databricks
                                                                  • 通信
                                                                    • メディア・エンターテイメント
                                                                      • 金融サービス
                                                                        • 官公庁・公共機関
                                                                          • 医療・ライフサイエンス
                                                                            • リテール・消費財
                                                                              • 製造
                                                                                • 全て見る
                                                                                • クロスインダストリーソリューション
                                                                                  • AI Agents
                                                                                    • サイバーセキュリティ
                                                                                      • マーケティング
                                                                                      • 移行・デプロイメント
                                                                                        • データの移行
                                                                                          • プロフェッショナルサービス
                                                                                          • ソリューションアクセラレータ
                                                                                            • ソリューションアクセラレータ一覧
                                                                                              成果を加速
                                                                                            • トレーニング・認定試験
                                                                                              • トレーニング概要
                                                                                                ニーズに合わせたカリキュラムを探す
                                                                                                • Databricks アカデミー
                                                                                                  Databricks ラーニングプラットフォームにサインインする
                                                                                                  • 認定
                                                                                                    スキル・認定で差別化を図る
                                                                                                    • 無料版
                                                                                                      専門家向けデータとAIツールを無料で学べます
                                                                                                      • 大学との連携
                                                                                                        Databricks を教材として活用
                                                                                                      • イベント
                                                                                                        • DATA+AI サミット
                                                                                                          • Data+AI ワールドツアー
                                                                                                            • Data Intelligence Days
                                                                                                              • イベントカレンダー
                                                                                                              • ブログ・ポッドキャスト
                                                                                                                • Databricks ブログ
                                                                                                                  最新情報、製品発表、その他の情報
                                                                                                                  • Databricks Mosaic AIリサーチブログ
                                                                                                                    AI世代に関する最新リサーチ
                                                                                                                    • Data Brew ポッドキャスト
                                                                                                                      ご相談・お問い合わせ
                                                                                                                      • ポッドキャスト:Data+AI のチャンピオン
                                                                                                                        イノベーションを支えるデータリーダーのインサイト
                                                                                                                      • お役立ちリソース
                                                                                                                        • カスタマーサポート
                                                                                                                          • ドキュメント
                                                                                                                            • コミュニティ
                                                                                                                            • もっと詳しく
                                                                                                                              • リソースセンター
                                                                                                                                • デモセンター
                                                                                                                                  • アーキテクチャ センター
                                                                                                                                  • 企業概要
                                                                                                                                    • Databricks について
                                                                                                                                      • 経営陣
                                                                                                                                        • Databricks Ventures
                                                                                                                                          • ご相談・お問い合わせ
                                                                                                                                          • 採用情報
                                                                                                                                            • 採用情報概要
                                                                                                                                              • 求人情報
                                                                                                                                              • プレス・ニュース記事
                                                                                                                                                • ニュースルーム
                                                                                                                                                  • 受賞歴と業界評価
                                                                                                                                                  • セキュリティと信頼
                                                                                                                                                    • セキュリティと信頼
                                                                                                                                                • 是非ご検討ください!
                                                                                                                                                • デモを見る
                                                                                                                                                • ログイン
                                                                                                                                                • ご相談・お問い合わせ
                                                                                                                                                • Databricks 無料トライアル
                                                                                                                                                1. ブログ
                                                                                                                                                2. /
                                                                                                                                                  Mosaic Research
                                                                                                                                                3. /
                                                                                                                                                  記事

                                                                                                                                                ジェネシス・ワークベンチ: Databricks 上のライフサイエンス・アプリケーションの設計図(ブループリント)

                                                                                                                                                Protein structure visualization on Databricks Genesis Workbench.

                                                                                                                                                Published: December 1, 2025

                                                                                                                                                Mosaic Research2分で読めます

                                                                                                                                                によってピーター・ホーキンス、メイ・マークル・タン、スリジット・チャンドラシェカール・ナイール、Eli Swanson、Yang Yang、陳冠宇、Ram Goli、ダグラス・ムーア による投稿

                                                                                                                                                この投稿を共有する

                                                                                                                                                最新の投稿を通知します

                                                                                                                                                Summary

                                                                                                                                                生成 AI は、多様な生物学データで事前学習された基盤モデルを活用することで、創薬、予測モデリング、個別化医療といった高度な応用を可能にし、バイオテック領域の研究開発を大きく変革しつつあります。
                                                                                                                                                一方で、この分野の研究者は GPU 環境の構成、複雑なワークフローの管理、適切なアクセス制御の確保など、多くの技術的・運用的ハードルに直面しており、本来の研究活動に集中しづらいという課題があります。
                                                                                                                                                Genesis Workbench は、Databricks プラットフォーム上でバイオロジー向け基盤モデルを活用したライフサイエンスアプリケーションを開発するための「設計図(ブループリント)」として、こうした課題の解消を支援することを目指しています。

                                                                                                                                                AIによるターゲット探索の加速と、創薬デザインの変革

                                                                                                                                                ライフサイエンスは、大規模なゲノムおよびマルチオミクス・データセットと、人工知能(AI)および機械学習(ML)の進歩との融合によって、根本的な変革を遂げています。当初は専門的だったAIツールは、タンパク質構造予測、タンパク質言語モデル、さらには高度な生成モデルにおけるイノベーションに示されるように、洗練された汎用的な基盤モデルへと急速に進化しました。生物学的配列および構造データの膨大なコーパスでトレーニングされたこれらの基盤モデルは、lab-in-the-loop designなどのプロセスを通じて創薬の発見を加速させ、科学者の日常タスクの効率を向上させ、de novo designを促進する可能性があります。この加速は、専門的な大規模言語モデル(LLM)によってさらにサポートされています。LLMは、科学文献、電子カルテ(EHR)、電子実験ノート(ELN)から生物医学的知識を正確に抽出し、統合するために不可欠です。

                                                                                                                                                安全でスケーラブルな研究プラットフォームを構築するうえでの実践的な課題 

                                                                                                                                                標的の発見や新薬の設計を向上させる技術や、それに使用されるデータは、高度に保護された知的財産(IP)です。したがって、組織は、データとモデルの両方に対して、個人とグループに適切なアクセス制御を付与できるようにする必要があります。大規模な生物学的データセット上の基盤モデルにとって、モデル使用の監査やコストのモニタリングなど、追加のガバナンスに関する懸念事項が重要な要素となります。しかし重要なのは、これらのアクセス制御プロセスが、実装が非常に困難であったり、ユーザーにとって不透明であったりして、組織内の科学コミュニティによる実質的な進歩を妨げるようなものであってはならないということです。実際には、多くの組織がこのバランスを見つけるのに苦労しています。

                                                                                                                                                DNA二重らせんのイラストと2人の科学者。

                                                                                                                                                多くの優秀な科学者は、生物学や計算生物学の専門知識を持ちながらも、最新のAI技術のニッチな分野に関連するタスクが負担となり、高度な生物学的モデルの構築に苦労しています。これらの課題には、大規模モデルを効率的にトレーニングするために不可欠な、GPU アクセラレーションのための CUDA 環境の設定といった技術的な複雑さが含まれます。さらに、科学者は、データ処理、モデルトレーニング、MLOpsを自動化して効率的にスケーリングする複雑なワークフローを作成して管理する必要があることがよくあります。こうしたタスクには、従来の生物学のトレーニングの範囲外のスキルが求められることがよくあります。プライバシーと再現性を維持するためのデータガバナンスポリシーをコンプライアンスしながら、多様な生物学的データセットの収集、クリーニング、統合を含むデータエンジニアリングも大きなハードルとなる。このような生物学以外の要件によって、本来の科学研究から貴重な時間と集中力が奪われ、ライフサイエンスにおける生成AIモデルの応用時の進歩とイノベーションが遅くなります。このギャップを埋めるには、分野横断的なコラボレーションと、生物学の研究者にとっての技術的な障壁を下げるツールへのアクセスの向上が必要です。

                                                                                                                                                ジェネシス・ワークベンチ: Databricks上の生物学的AI/機械学習のブループリント

                                                                                                                                                手軽なのに強力:Databricks でデータと AI をシンプルに

                                                                                                                                                Databricksは、堅牢なガバナンス、直感的な操作性、包括的な機能を兼ね備えた統合分析プラットフォームとして際立っており、必要なデータやAIソリューションを構築することができます。データマネジメント、セキュリティ、コンプライアンスのための一元化されたツールにより、データは常に保護され、あらゆるスキルレベルのユーザーが簡単にアクセスできる。シームレスなコラボレーション機能、スケーラブルな処理能力、データ分析、AIワークロードの全領域のサポートにより、厳密な管理とシンプルさを維持しながらイノベーションを目指す組織にとって理想的な基盤です。メルク社のTEDDY基盤モデルファミリーから Tahoe Therapeutics社のシングルセルアトラスに至るまで、大小さまざまな組織がDatabricks上で生物学モデルを構築し、成功を収めています。

                                                                                                                                                Genesis WorkbenchはDatabricks上でライフサイエンスのスーパーチャージを支援する

                                                                                                                                                Genesis Workbench は、Databricks の機能を活用してライフサイエンス アプリケーションを開発するためのブループリントを提供します。自動ワークフロー、GPUクラスター、モデルサービング、MLflowなどの機能を活用した作業テンプレートを提供し、AI主導のライフサイエンス研究を加速させます。直感的なDatabricks Appsインターフェースが特徴で、あらかじめパッケージ化された生物学的モデルやカスタマイズされたワークフローを備えているため、研究者は複雑なセットアップをすることなく、すぐにスタートできます。

                                                                                                                                                NVIDIAとの協力により、デジタルバイオロジーのための生成AIフレームワークであるBioNeMoが統合され、高度な事前学習済みモデルに簡単にアクセスできるようになりました。BioNeMoモデルはNVIDIAハードウェアに最適化されており、エンタープライズ・ワークロードに高いパフォーマンスとスケーラビリティを提供します。

                                                                                                                                                オープンソースの Genesis Workbench は、AI エンジニアに拡張可能なテンプレートを提供し、生物学以外の作業負荷を軽減して、生物学用の基盤AIモデルの使用と組み合わせによる迅速なイノベーションを促進します。Genesis Workbench を出発点としてさまざまなモデルを提供しており、これらはアプリ経由で実験科学者が使用することも、パイプラインを構築する高度な計算ユーザーが使用することもできます。重要なのは、APIを介してモデルを提供することで、複雑なモデルの依存関係やGPU要件を抽象化できるという点です。これによってユーザーは、よく使われるが非常に複雑なツールを、単一のパイプラインでつなぎ合わせることができます。

                                                                                                                                                GenesisワークベンチはDatabricksソリューションアクセラレータであり、現在活発に開発が進められています。

                                                                                                                                                Genesis Workbenchアーキテクチャ

                                                                                                                                                このアプリケーションはDatabricksプラットフォーム上に構築され、以下のプラットフォーム機能を使用しています。

                                                                                                                                                • Unity Catalog によるガバナンス
                                                                                                                                                • UIのためのDatabricks Apps
                                                                                                                                                • 基盤モデルを提供するためのGPU Model Serving
                                                                                                                                                • スケーラブルなバッチ推論とファインチューニングを実行するためのLakeflow Jobs
                                                                                                                                                • インタラクティブおよびバッチ ワークロード向けの GPU 搭載Classic Compute
                                                                                                                                                • サードパーティライブラリを統合するためのDockerコンテナサービス
                                                                                                                                                • 簡単なデプロイのためのDatabricks Asset Bundle
                                                                                                                                                AIモデル管理のUnity Catalogワークフロー図

                                                                                                                                                Genesis Workbenchのモジュール

                                                                                                                                                タンパク質のフォールディングと設計

                                                                                                                                                概要

                                                                                                                                                アミノ酸配列からタンパク質の三次元構造を予測することは、長年にわたって計算生物学と理論生物学における代表的な難題でした。この課題に対する最新の手法は、CASPコンペティションという国際的な評価の場で競い合うことで洗練され、研究コミュニティのモデリング能力をさらに向上させてきました。DeepMind は、AlphaFold(Senior ら, 2020, Nature)と AlphaFold2(Jumper ら, 2021, Nature)を CASP に出場させることで、タンパク質構造予測の精度を従来手法から大きく前進させています。これらのモデルは、既存の構造データと大規模配列データベースを AI で学習し、その情報を統合して予測に利用するアプローチを採用しています。​その結果、タンパク質複合体を含む多くの構造について実験に近い精度で予測できるようになり、生成 AI を活用した創薬・設計ワークフローの基盤技術となりました。

                                                                                                                                                現在、タンパク質の構造に関連するタスクのためのモデルは山のようにある。Alphafold-3(Abramsom et al. 2024, Nature・クローズドウェイト)、Boltz-1(Wohlend 2024,BioRxiv)、Chai-1(Chai discovery team 2024,BioRxiv)などのモデルは、今やタンパク質を超えて、タンパク質、DNA、RNA、低分子を含むより高度な構造にまで拡大している。最近、Openfold3(The Openfold3 team)のような他のオープンモデルも同様の機能を持つものがリリースされており、このモデル群は今後も増え続けると予想される。加えて、生成モデルを用いてタンパク質そのものを設計・生成する技術も急速に進歩しています。この分野では、RFdiffusion(Watson ら, 2023, Nature)や ProteinMPNN(Dauparas ら, 2022, Science)といったツールが頻繁に用いられており、抗体設計などの応用例も報告されています(例えば Bielska ら, 2025, Frontiers in Immunology)。​さらに BoltzGen(Stark ら, preprint および公開リポジトリ)などの新しいモデルも登場しており、計算創薬・分子設計のためのツールキットは、いまもなお急速に進化し続けています。

                                                                                                                                                デプロイ済みモデルのリストが表示されたタンパク質研究ダッシュボード
                                                                                                                                                Alphafold

                                                                                                                                                最新の安定バージョン(v2.3.2)のalphafold2(Jumper et al. 2021, Nature)が含まれています。alphafoldのプロセスは、広範な特徴量計算のため実行に時間がかかるため、Genesis Workbenchでは、Databricksのワークフロー Jobとしてalphafoldをプロビジョニングする方法を紹介します。このjobは、CPU中心のタスク(MSA、特徴抽出)とGPU中心のフォールディングタスクの2つのタスクで構成されています。これにより、各タスクを適切なコンピュートタイプで実行できます。このjobはHPCのようにキューイングシステムを利用しており、複数のシーケンスを同時にフォールディングしながら、他のシーケンスをキューで待機させることができます。

                                                                                                                                                AlphaFold2を使用したタンパク質構造予測ワークフロー。
                                                                                                                                                ESMフォールド

                                                                                                                                                ESMFold(Lin et al. 2023, Science)は、強力なESMタンパク質言語モデルと構造ヘッドを活用して、単一のシーケンスからタンパク質構造を推測する、高速でコスト効率の高いタンパク質構造予測のためのディープラーニングモデルです。その精度は多重配列アライメントを使用するモデルよりも低いですが、ESMFoldは多くの実用的なアプリケーションには十分です。Genesis Workbenchでは、MLflowモデルでラップされたESMfoldをデプロイし、Unity Catalogに登録します。Databricksでは、Unity Catalogに登録されたMLflowモデルをAPIとして提供することが非常に簡単で、コスト削減のためのスケールトゥゼロ操作もサポートされています。ESMFoldがAPIとして提供されることで、研究者は新しいタンパク質構造を迅速に予測し、計算パイプラインに簡単に統合し、Genesis Workbenchに示されているパターンを使用して結果を視覚化またはdownloadして、さらなる分析を行うことができます。

                                                                                                                                                ボルツ

                                                                                                                                                Boltz-1 (Wohlend 2024, BioRxiv) は、生体分子構造予測のための、コードと重みが完全にオープンソース (MIT) のモデルを提供します。ESMFoldと同様に、Boltz-1をUnity Catalogにモデルとして登録し、モデルサービング endpointで提供します。Boltz-1にはオプションのMSA入力があり、省略することも、事前に計算されたMSAを使うことも、mmseqs2(Steinegger, Sölding 2017Nat.Biotech)のサーバーアドレスを使うこともできます。Boltz-1の様々なオプションを確保するため、Boltz-1の必須モデルコンポーネントを、alphafold2(Jumper et al. 2021, Nature ) ライブラリーの JackHMMer(Johnson et al.これにより、ユーザーは JackHMMer MSA を選択できます。デフォルトの mmseqs2 サーバーアドレスはほとんどのセキュリティポリシーに違反する公開 URL であるため、一部のユーザーにとっては JackHMMer MSA を使用する方が有利な場合があります。

                                                                                                                                                Boltz-1関数とMSAステージはmlflowトレースでラップされます。トレースすることで、推論の全ステージと、各ステージからの入力と出力を、例えばMSAステージのように簡単に可視化することができます。これは、ノートブックでモデルを使用する場合に特に有用です。なぜなら、保存されたファイルに個別に移動する必要なく、モデルで何が起こったかを素早く正確に確認し、MSAの問題を特定できるためです。

                                                                                                                                                ProteinMPNN と RFDiffusion によるタンパク質設計

                                                                                                                                                計算タンパク質設計は、酵素活性と治療効果の両方について効果的なタンパク質を設計する方法を変える大きな可能性を秘めた、急速に発展している分野です。RFdiffusion (Watson et al. 2023, Nature) と ProteinMPNN (Dauparas et al. 2022, Science) は、タンパク質設計において、例えば計算による抗体設計 (Bielska et al. 2025, front.immunol) などで、しばしば一緒に使用されます。そして最近では、de novo抗体のデザインにも使われています(Bennett et al.)

                                                                                                                                                Genesis Workbenchでは、RFDiffusionとProteinMPNNを提供する方法を紹介します。一旦複雑な依存関係がモデルサービングで抽象化されれば、これらのモデルを計算パイプラインにつなぎ合わせることがいかに簡単であるかを示します。具体的には、ESMFold・RFdiffusion・ProteinMPNN を組み合わせたパイプラインを構築し、その全体を Genesis Workbench アプリケーションをホストしている小さな CPU 専用マシンから呼び出せるようにしています。これにより、各モデルのすべての依存関係を 1 か所で維持したり、競合する CUDA バージョンについて心配したりする必要がなくなります。このアプリでは、Mol*ビューアに元の配列と設計された配列を表示するため、出力も元の予測構造と構造的にアラインメントされます。 

                                                                                                                                                これは、計算機ユーザーがGenesis Workbench内のコンポーネントに基づいて新しいツールを構築し、組織や研究チームの目標に合わせたプロセスを作成できることを示しています。

                                                                                                                                                シングルセル分析

                                                                                                                                                概要

                                                                                                                                                シングルセル・トランスクリプトミクスは、異なるコホート間の細胞集団の理解、ニッチ細胞タイプの同定、細胞軌道の解明など、多くのことを可能にする強力な技術です。この分野で利用可能なデータ量は、サンプル処理の増加だけでなく、技術の向上によっても急速に拡大しています。その結果、この規模でのデータのラベリングや処理に課題をもたらし、次のような問題意識が生じています:

                                                                                                                                                • 高度な博士号レベルの研究者に反復的なタスクに時間を割かせ、過度の負担を強いることを防ぐために、分析の一部を自動化することはできないか?
                                                                                                                                                • サンプルの将来的なアトラスレベルの分析のためにデータ ディスカバリーを強化するには、どのようにデータに事前アノテーションを付ければよいか?

                                                                                                                                                我々は、これらの課題に対するソリューションを提供し、これらの問題のバリエーションにこれらのアプローチを適応させるための設計ブループリントを構築することを目指しています。

                                                                                                                                                Genesis Workbenchでは、シングルセルの前処理と可視化を自動化するツール群を提供しています。これらはすべてMLflowの**エクスペリメント**で追跡されるため、ユーザーはデータおよび共有方法を完全にコントロールできます。これには、最適なRAM選択によるCPUパイプラインや、GPUアクセラレーションによるワークフローが含まれます。さらに、処理されたデータを低レイテンシーで可視化機能も提供します。加えて、シングルセル発現のためのファウンデーションモデルとして SCimilarity(Heimberg ら, 2024, Nature)および scGPT(Cui ら, 2024, Nature Methods)を組み込み、アトラスレベルでのアノテーション、埋め込み表現の取得、検索に活用できるようにしています。

                                                                                                                                                Single Cell Studiesのダッシュボードに展開されたモデルのリストが表示されている。
                                                                                                                                                scRNAデータ処理: scanpyとrapids-singlecell

                                                                                                                                                Genesis Workbench では、標準的な scanpy (Wolf et al. 2018 Genome Biol) 実行用のワークフロー job を構築します。この job は、ユーザーの負担とコストを同時に軽減するため、最小の RAM サイズを自動的に選択しようと試みます。このジョブは、選択されたパラメーターだけでなく、様々なメトリクス、出力、数値を1つのMLflowランにまとめて記録します。これにより、最新のエクスペリメントトラッキング手順が可能になり、ラン中のパイプラインに関するすべての詳細が自動的にログに記録されます。このScanpy jobに加え、RAPIDS-singlecell(Dicks et al, 2022,リポジトリ,doi)jobも用意しています。このパッケージはscanpyと非常によく似た動作をし、同じパラメータオプションを持ちながら、GPUによって処理が高速化されているライブラリです。これにより、特定のプロジェクトに不可欠なスループットの高速化を実現できます。

                                                                                                                                                Genesis Workbench アプリケーションでは、シンプルなインターフェースを介してこれらのパイプラインに簡単にアクセスし、さまざまなパラメーターでランをstartして、アプリケーション内で出力を表示できます。インテリジェントなデータ キュレーションを実行して結果の迅速なアプリ内分析を可能にし、単一のコンパクトなアプリケーション コンピュートで複数のユーザーをサポートします。その後、QC メトリクス、クラスター、マーカー遺伝子発現などの詳細はすべてアプリ内で表示できます。この処理は、scRNA 向けの基盤モデルでデータを使用する前に行う重要なステップとなる場合があります。

                                                                                                                                                Databricks Genesis の単一細胞解析設定画面。ダークインターフェース上の色付きクラスターの UMAP 散布プロット
                                                                                                                                                基盤モデル: SCimilarity と scGPT

                                                                                                                                                Genesis Workbenchの単一細胞解析モジュールを使用すると、ライフサイエンス研究者はSCimilarityとscGPTという2つの最先端の基盤モデルを利用できます。

                                                                                                                                                SCimilarityは、大規模な細胞アトラスを検索し、疾患に関連する集団と類似のin vitroモデルを迅速に同定するためにメトリクス学習を利用し、クラスターを必要とせずに参照カタログを用いて臓器レベルおよび疾患レベルの精度を達成します。これを補完するために、scGPTは摂動予測、制御ネットワーク推論、ゼロショットマルチオミクス統合のために、2つの遺伝子-細胞エンベッディングを持つ5,300万パラメータのTransformerアーキテクチャを採用しています。これらは共に、多様なデータセットを調和させ、アノテーションのバイアスを最小化し、疾患のメカニズム的な知見-統合勾配による類似性と注意メカニズムによるscGPT-を明らかにすることで、腫瘍学、免疫学、希少疾患研究のトランスレーショナル・ディスカバリーや治療イノベーションを推進します(Heimberg et al, 2024,Nature; Cui et al, 2024, Nature Methods)。

                                                                                                                                                Genesis Workbenchは、これらの基盤となるモデルを、設定済みのGPUクラスタ、自動ワークフロー、MLflow統合:cell_query.gene_orderとともにパッケージ化することで、両モデルの主要なEndpointをデプロイしています。具体的には、SCimilarity 向けに cell_query.gene_order、cell_embedding.get_embeddings、cell_query.search_nearest、scGPT 向けに遺伝子埋め込み推論用のエンドポイントを公開しています。サンプルノートブックでは、SCimilarity の IPF myofibroblast チュートリアルに基づくワークフローを実演しており、提供されているエンドポイントを用いて、scRNA-seq データの読み込みと正規化、埋め込みの計算、2,340 万細胞に対するクエリから疾患エンリッチされた集団の近傍探索までを行います。同定された細胞集団は、同一環境内で scGPT による遺伝子制御ネットワークの推定、摂動スクリーニング、CRISPR ターゲット予測などの後続解析へとつなげることができます。

                                                                                                                                                DatabricksとNVIDIAはスピードとスケールを提供する

                                                                                                                                                NVIDIA のソフトウェア スタックは、ライフサイエンス研究を加速させるための強力なソリューションを提供します。NVIDIA BioNeMoは、バイオファーマ向けのディープラーニングモデルの開発を加速させるオープンソースのフレームワークである。これにより研究者は、DNA、RNA、タンパク質データにまたがる生体分子AIモデルを、迅速かつ合理化されたツールで新たな高みへと拡張することができます。Parabricksは、GPUに最適化されたアルゴリズムを使用して、迅速でhigh-throughputなゲノム解析を提供し、ゲノミクス研究所の次世代シーケンスデータの迅速な処理を可能にします。Rapids-SingleCellはシングルセルデータ分析を強化し、より深い生物学的知見のためにGPUアクセラレーションを活用することで、大規模なマルチオミックデータセットのスケーラブルでインタラクティブな探索と分析を可能にします。

                                                                                                                                                NVIDIAとDatabricksのエンジニアリングチーム間の緊密な連携により、NVIDIAの先進的なソフトウェアスタックをGenesis Workbenchにシームレスに統合することが可能となり、ライフサイエンス向けにAIを活用した迅速かつスケーラブルなワークフローが実現した。ジェネシス・ワークベンチのパターンを使えば、次のことができます:

                                                                                                                                                • Databricks Platform内のスケーラブルGPUコンピュートでBioNeMoモデルを活用する
                                                                                                                                                • BioNeMoパッケージで利用可能なモデルを微調整し、スケールでの推論に利用する。
                                                                                                                                                • RAPIDS-singlecellを使用する。RAPIDS-singlecellは、シングルセル解析のためのオープンソースのGPUアクセラレーションフレームワークである。
                                                                                                                                                • ゲノム解析にパラブリックを使う

                                                                                                                                                Databricks ダッシュボードを使用した可視性の合理化とコスト最適化

                                                                                                                                                Job実行のモニタリング

                                                                                                                                                多くのワークフローでは、長時間動き続けるバックグラウンド処理は必須ではありません。​Genesis Workbench では Databricks Workflows を活用し、ジョブを非同期に起動する設計にしています。さらに、アプリケーション内から起動されたすべての Databricks Workflows ジョブを一覧できる専用のモニタリングダッシュボードを用意しています。

                                                                                                                                                ジョブのステータスを表示するDatabricksワークフロー監視ダッシュボー�ド。

                                                                                                                                                コスト・モニタリング

                                                                                                                                                基盤モデルを使用して計算パイプラインやツールを構築すると、関連するコストについての疑問が生じることがよくあります。Databricksは、使用状況と請求に関する情報をシステムテーブルに自動的にキャプチャします。これにより、この情報に基づいてダッシュボードを簡単に構築し、使用状況と支出を迅速に表示および分析するためのカスタムな方法を作成できます。これらを使用して、使いすぎに関連する自動アラートを作成することもできます。Genesis Workbenchでは、アプリケーション内に各モデルの支出を時間とユーザー別に分類して表示するダッシュボードを自動的に提供します。さらに、ダッシュボードの形式もオープンソースであり、Genesis Workbenchをインストールしたチームがカスタマイズできます。

                                                                                                                                                Databricksの使用チャートとグラフを表示するダッシュボード。

                                                                                                                                                次のステップ

                                                                                                                                                インストール

                                                                                                                                                Genesis Workbenchには、Databricks Asset Bundlesを利用してアプリケーションをデプロイするスクリプトが含まれている。アプリケーションは、提供されている インストール手順 に従って、 GitHub repository からdownloadしてインストールできます。

                                                                                                                                                ソースには次の内容が含まれています:

                                                                                                                                                • UI アプリケーションを含む Genesis Workbench コアモジュールを workspace にデプロイするためのスクリプト
                                                                                                                                                • 以下のモジュールをデプロイするためのスクリプト:
                                                                                                                                                  • シングルセルモジュール
                                                                                                                                                  • タンパク質研究モジュール
                                                                                                                                                  • コンテナ定義とワークフローを含む BioNeMo モジュール (注: BioNeMo コンテナは別途ビルドする必要があります)
                                                                                                                                                  • モニタリングとダッシュボード

                                                                                                                                                フィードバック

                                                                                                                                                このプロジェクトは現在進行中であり、皆様からのご連絡をお待ちしている。あなたのユースケースについて議論し、Genesis Workbenchで議論されているパターンをどのように活用できるかを理解するために、アカウント・チームに連絡してください。

                                                                                                                                                ロードマップ

                                                                                                                                                • 標準提供モデルの拡充
                                                                                                                                                • MSAによるタンパク質フォールディングの高速化のための高度なMSAサポート
                                                                                                                                                • シングルセルデータのストリーミング対応
                                                                                                                                                • BioNemoとモデルサービングの統合
                                                                                                                                                • 空間トランスクリプトミクスの対応

                                                                                                                                                まとめ 

                                                                                                                                                Genesis Workbenchは、すぐに使えるMLflowでパッケージ化された生物学的基盤モデルとNVIDIA BioNemoモデルを提供しており、これらはDatabricksエコシステムとシームレスに統合されます。これは、Databricksユーザーが新しいモデルをDatabricksに導入し、複数のモデルを組み合わせて複雑なパイプラインを構築し、単一のフレームワークで実験科学者と計算科学者の両方をサポートするためのブループリントです。

                                                                                                                                                Unity Catalog を介した Databricks のガバナンスは、モデル、Job、データ、アプリケーションへのアクセスを制御するための一貫性のある包括的なシステムを提供します。これにより、適切なアクセス制御を確保しつつ、これらの基盤モデルを利用したアプリケーションやデータパイプラインの開発を大幅に簡素化できます。

                                                                                                                                                Databricks のモデルサービング機能を利用することで、計算科学者や MLOps エンジニアは、各モデルの複雑な依存関係や GPU 要件を抽象化できます。これにより、他の計算機ユーザーはパイプラインを構築することができ、独自の依存関係を持つ複数のモデルをつなぎ合わせることができる。これにより開発ライフサイクルが大幅に高速化され、Unity Catalog を利用することで、適切な権限を設定してチーム間で簡単に共有できるようになります。

                                                                                                                                                Databricks Apps は、これらの基盤モデルのビルディングブロックや生物学的データビューアを基盤として、アプリケーションを迅速にテスト・構築できる開発ライフサイクルを提供します。Genesis Workbench のコードはオープンソースなので、チームはそれぞれのニーズに合わせてアプリを改作し、改良することができます。必要に応じて新しいモデルを追加することもできるし、Genesis Workbenchが提供する設計図に従って、ビジネスに必要なシステムを構築することもできます。

                                                                                                                                                Genesis Workbenchは、現在活発に開発中のDatabricksソリューションアクセラレータです。このツールの使用に興味のあるチームには、ぜひ私たちと関わり、フィードバックを提供し、将来のロードマップの形成にご協力いただければ幸いです。

                                                                                                                                                最新の投稿を通知します

                                                                                                                                                この投稿を共有する

                                                                                                                                                Databricksの投稿を見逃さないようにしましょう

                                                                                                                                                興味のあるカテゴリを購読して、最新の投稿を受信トレイに届けましょう

                                                                                                                                                Sign up

                                                                                                                                                次は何ですか?

                                                                                                                                                Header graphic with a horizontally distributed series of circles

                                                                                                                                                Mosaic Research

                                                                                                                                                April 30, 2024/1分未満

                                                                                                                                                モザイク評価ガントレットのキャリブレーション

                                                                                                                                                Building-Custom-LLMs-with-Mosaic-AI-Training

                                                                                                                                                Mosaic Research

                                                                                                                                                May 14, 2024/2分で読めます

                                                                                                                                                Mosaic AI TrainingでDBRX級のカスタムLLMを構築しよう!

                                                                                                                                                databricks logo
                                                                                                                                                Databricks を選ぶ理由
                                                                                                                                                Databricks を選ぶ理由
                                                                                                                                                • エグゼクティブ向け
                                                                                                                                                • スタートアップ向け
                                                                                                                                                • レイクハウスアーキテクチャ
                                                                                                                                                • Mosaic Research
                                                                                                                                                導入事例
                                                                                                                                                • 注目の導入事例
                                                                                                                                                パートナー
                                                                                                                                                • クラウドプロバイダ
                                                                                                                                                • 技術パートナー
                                                                                                                                                • データパートナー
                                                                                                                                                • Databricks で構築
                                                                                                                                                • コンサルティング・SI
                                                                                                                                                • C&SI パートナー
                                                                                                                                                • パートナーソリューション
                                                                                                                                                Databricks を選ぶ理由
                                                                                                                                                • エグゼクティブ向け
                                                                                                                                                • スタートアップ向け
                                                                                                                                                • レイクハウスアーキテクチャ
                                                                                                                                                • Mosaic Research
                                                                                                                                                導入事例
                                                                                                                                                • 注目の導入事例
                                                                                                                                                パートナー
                                                                                                                                                • クラウドプロバイダ
                                                                                                                                                • 技術パートナー
                                                                                                                                                • データパートナー
                                                                                                                                                • Databricks で構築
                                                                                                                                                • コンサルティング・SI
                                                                                                                                                • C&SI パートナー
                                                                                                                                                • パートナーソリューション
                                                                                                                                                製品
                                                                                                                                                レイクハウスプラットフォーム
                                                                                                                                                • プラットフォーム
                                                                                                                                                • 共有
                                                                                                                                                • データガバナンス
                                                                                                                                                • 人工知能(AI)
                                                                                                                                                • DBRX
                                                                                                                                                • データベース
                                                                                                                                                • データ管理
                                                                                                                                                • データウェアハウス
                                                                                                                                                • データエンジニアリング
                                                                                                                                                • データサイエンス
                                                                                                                                                • アプリケーション開発
                                                                                                                                                ご利用料金
                                                                                                                                                • 料金設定の概要
                                                                                                                                                • 料金計算ツール
                                                                                                                                                オープンソース
                                                                                                                                                統合とデータ
                                                                                                                                                • マーケットプレイス
                                                                                                                                                • IDE 統合
                                                                                                                                                • パートナーコネクト
                                                                                                                                                レイクハウスプラットフォーム
                                                                                                                                                • プラットフォーム
                                                                                                                                                • 共有
                                                                                                                                                • データガバナンス
                                                                                                                                                • 人工知能(AI)
                                                                                                                                                • DBRX
                                                                                                                                                • データベース
                                                                                                                                                • データ管理
                                                                                                                                                • データウェアハウス
                                                                                                                                                • データエンジニアリング
                                                                                                                                                • データサイエンス
                                                                                                                                                • アプリケーション開発
                                                                                                                                                ご利用料金
                                                                                                                                                • 料金設定の概要
                                                                                                                                                • 料金計算ツール
                                                                                                                                                統合とデータ
                                                                                                                                                • マーケットプレイス
                                                                                                                                                • IDE 統合
                                                                                                                                                • パートナーコネクト
                                                                                                                                                ソリューション
                                                                                                                                                業種別
                                                                                                                                                • 通信
                                                                                                                                                • 金融サービス
                                                                                                                                                • 医療・ライフサイエンス
                                                                                                                                                • 製造
                                                                                                                                                • メディア・エンタメ
                                                                                                                                                • 官公庁・公共機関
                                                                                                                                                • リテール・消費財
                                                                                                                                                • 全て表示
                                                                                                                                                クロスインダストリーソリューション
                                                                                                                                                • サイバーセキュリティ
                                                                                                                                                • マーケティング
                                                                                                                                                データの移行
                                                                                                                                                プロフェッショナルサービス
                                                                                                                                                ソリューションアクセラレータ
                                                                                                                                                業種別
                                                                                                                                                • 通信
                                                                                                                                                • 金融サービス
                                                                                                                                                • 医療・ライフサイエンス
                                                                                                                                                • 製造
                                                                                                                                                • メディア・エンタメ
                                                                                                                                                • 官公庁・公共機関
                                                                                                                                                • リテール・消費財
                                                                                                                                                • 全て表示
                                                                                                                                                クロスインダストリーソリューション
                                                                                                                                                • サイバーセキュリティ
                                                                                                                                                • マーケティング
                                                                                                                                                リソース
                                                                                                                                                ドキュメント
                                                                                                                                                カスタマーサポート
                                                                                                                                                コミュニティ
                                                                                                                                                トレーニング・認定試験
                                                                                                                                                • トレーニング
                                                                                                                                                • 認定
                                                                                                                                                • 無料版
                                                                                                                                                • 大学との連携
                                                                                                                                                • Databricks アカデミー
                                                                                                                                                イベント
                                                                                                                                                • DATA+AI サミット
                                                                                                                                                • Data+AI ワールドツアー
                                                                                                                                                • Data Intelligence Days
                                                                                                                                                • イベントカレンダー
                                                                                                                                                ブログ・ポッドキャスト
                                                                                                                                                • Databricks ブログ
                                                                                                                                                • Databricks Mosaic AIリサーチブログ
                                                                                                                                                • Data Brew ポッドキャスト
                                                                                                                                                • Data+AI のチャンピオンシリーズ
                                                                                                                                                トレーニング・認定試験
                                                                                                                                                • トレーニング
                                                                                                                                                • 認定
                                                                                                                                                • 無料版
                                                                                                                                                • 大学との連携
                                                                                                                                                • Databricks アカデミー
                                                                                                                                                イベント
                                                                                                                                                • DATA+AI サミット
                                                                                                                                                • Data+AI ワールドツアー
                                                                                                                                                • Data Intelligence Days
                                                                                                                                                • イベントカレンダー
                                                                                                                                                ブログ・ポッドキャスト
                                                                                                                                                • Databricks ブログ
                                                                                                                                                • Databricks Mosaic AIリサーチブログ
                                                                                                                                                • Data Brew ポッドキャスト
                                                                                                                                                • Data+AI のチャンピオンシリーズ
                                                                                                                                                企業情報
                                                                                                                                                企業概要
                                                                                                                                                • Databricks について
                                                                                                                                                • 経営陣
                                                                                                                                                • Databricks Ventures
                                                                                                                                                • ご相談・お問い合わせ
                                                                                                                                                採用情報
                                                                                                                                                • 採用情報概要
                                                                                                                                                • 求人情報
                                                                                                                                                プレス・ニュース記事
                                                                                                                                                • ニュースルーム
                                                                                                                                                • 受賞歴と業界評価
                                                                                                                                                セキュリティと信頼
                                                                                                                                                企業概要
                                                                                                                                                • Databricks について
                                                                                                                                                • 経営陣
                                                                                                                                                • Databricks Ventures
                                                                                                                                                • ご相談・お問い合わせ
                                                                                                                                                採用情報
                                                                                                                                                • 採用情報概要
                                                                                                                                                • 求人情報
                                                                                                                                                プレス・ニュース記事
                                                                                                                                                • ニュースルーム
                                                                                                                                                • 受賞歴と業界評価
                                                                                                                                                databricks logo

                                                                                                                                                Databricks Inc.
                                                                                                                                                160 Spear Street, 15th Floor
                                                                                                                                                San Francisco, CA 94105
                                                                                                                                                1-866-330-0121

                                                                                                                                                採用情報

                                                                                                                                                © Databricks 2025. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.

                                                                                                                                                • プライバシー通知
                                                                                                                                                • |利用規約
                                                                                                                                                • |現代奴隷法に関する声明
                                                                                                                                                • |カリフォルニア州のプライバシー権利
                                                                                                                                                • |プライバシー設定