メインコンテンツへジャンプ
ログイン
      • Databricks を知る
        • For App Developers
          • エグゼクティブ向け
            • スタートアップ向け
              • レイクハウスアーキテクチャ
                • Databricks AIリサーチ
                • 導入事例
                  • 注目の導入事例
                  • パートナー
                    • パートナー概要
                      Databricks パートナー エコシステムの詳細
                      • パートナースポットライト
                        注目のパートナーの発表
                        • パートナープログラム
                          特典、レベル、パートナーになる方法をご覧ください
                          • クラウドプロバイダー
                            AWS、Azure、GCP 上の Databricks
                            • パートナーを探す
                              ニーズに合った Databricks パートナーを見つける
                              • パートナーソリューション
                                業界別および移行ソリューションを見つける
                              • Databricks プラットフォーム
                                • プラットフォームの概要
                                  データ・分析・AI のための統合プラットフォーム
                                  • データ管理
                                    データの信頼性・セキュリティ・パフォーマンス
                                    • 共有
                                      オープン、セキュア、ゼロコピーでのデータ共有
                                      • データウェアハウジング
                                        バッチ、ストリーミングデータのための ETL とオーケストレーション
                                        • ガバナンス
                                          データ・分析・AI のための統合ガバナンス
                                          • データエンジニアリング
                                            バッチ、ストリーミングデータのための ETL とオーケストレーション
                                            • 人工知能(AI)
                                              ML と生成 AI アプリケーションの構築とデプロイメント
                                              • ビジネス生産性
                                                統合された検索、チャット、ダッシュボード、アプリ
                                                • BI
                                                  実世界データのインテリジェント分析
                                                  • アプリケーション開発
                                                    安全なデータと AI アプリを迅速に構築
                                                    • Database
                                                      Postgres for data apps and AI agents
                                                      • セキュリティ
                                                        AI時代のために構築されたオープンなエージェント型SIEM
                                                      • 統合とデータ
                                                        • マーケットプレイス
                                                          データ、分析、AI のためのオープンマーケットプレイス
                                                          • IDE 統合
                                                            お気に入りの IDE(統合開発環境)でレイクハウスを構築
                                                            • パートナーコネクト
                                                              Databricks エコシステムの検索と統合
                                                            • ご利用料金
                                                              • Databricks のご利用料金
                                                                料金設定、DBU、その他
                                                                • コスト計算ツール
                                                                  クラウド利用でのコンピュートコストの試算
                                                                • オープンソース
                                                                  • オープンソーステクノロジー
                                                                    プラットフォームを支えるイノベーションをもっと詳しく
                                                                  • 業界向け Databricks
                                                                    • テレコミュニケーション
                                                                      • メディア・エンターテイメント
                                                                        • 金融サービス
                                                                          • 官公庁・公共機関
                                                                            • 医療・ライフサイエンス
                                                                              • リテール・消費財
                                                                                • 製造
                                                                                  • 全て見る
                                                                                  • クロスインダストリーソリューション
                                                                                    • AI Agents
                                                                                      • AI ガバナンス
                                                                                        • サイバーセキュリティ
                                                                                          • マーケティング
                                                                                          • 移行・デプロイメント
                                                                                            • データの移行
                                                                                              • プロフェッショナルサービス
                                                                                              • ソリューションアクセラレータ
                                                                                                • ソリューションアクセラレータ一覧
                                                                                                  成果を加速
                                                                                                • トレーニング・認定試験
                                                                                                  • トレーニング概要
                                                                                                    ニーズに合わせたカリキュラムを探す
                                                                                                    • Databricks アカデミー
                                                                                                      Databricks ラーニングプラットフォームにサインインする
                                                                                                      • 認定
                                                                                                        スキル・認定で差別化を図る
                                                                                                        • 無料版
                                                                                                          専門家向けデータとAIツールを無料で学べます
                                                                                                          • 大学との連携
                                                                                                            Databricks を教材として活用
                                                                                                          • イベント
                                                                                                            • DATA+AI サミット
                                                                                                              • Data+AI ワールドツアー
                                                                                                                • AI Days
                                                                                                                  • イベントカレンダー
                                                                                                                  • ブログ・ポッドキャスト
                                                                                                                    • Databricks ブログ
                                                                                                                      最新情報、製品発表、その他の情報
                                                                                                                      • AI ブログ
                                                                                                                        当社のAI研究とエンジニアリングの取り組みをご覧ください
                                                                                                                        • Data Brew ポッドキャスト
                                                                                                                          ご相談・お問い合わせ
                                                                                                                          • ポッドキャスト:Data+AI のチャンピオン
                                                                                                                            イノベーションを支えるデータリーダーのインサイト
                                                                                                                          • お役立ちリソース
                                                                                                                            • カスタマーサポート
                                                                                                                              • ドキュメント
                                                                                                                                • コミュニティ
                                                                                                                                • もっと詳しく
                                                                                                                                  • リソースセンター
                                                                                                                                    • デモセンター
                                                                                                                                      • アーキテクチャ センター
                                                                                                                                      • 企業概要
                                                                                                                                        • Databricks について
                                                                                                                                          • 経営陣
                                                                                                                                            • Databricks Ventures
                                                                                                                                              • ご相談・お問い合わせ
                                                                                                                                              • 採用情報
                                                                                                                                                • 採用情報概要
                                                                                                                                                  • 求人情報
                                                                                                                                                  • プレス・ニュース記事
                                                                                                                                                    • ニュースルーム
                                                                                                                                                      • 受賞歴と業界評価
                                                                                                                                                      • セキュリティと信頼
                                                                                                                                                        • セキュリティと信頼
                                                                                                                                                    • 是非ご検討ください!
                                                                                                                                                    • デモを見る
                                                                                                                                                    • ログイン
                                                                                                                                                    • Databricks 無料トライアル
                                                                                                                                                    1. すべてのブログ
                                                                                                                                                    2. /
                                                                                                                                                      Data + AIの基盤
                                                                                                                                                    • クイック定義:ファインチューニング、RAG、および主要用語
                                                                                                                                                    • ファインチューニングの仕組みと理解
                                                                                                                                                    • ファインチューニングの実行:技術的なステップの解説
                                                                                                                                                    • 企業向けAIシステムにおけるRAGの運用方法
                                                                                                                                                    • データ品質と検索:データエンジニア向けガイダンス
                                                                                                                                                    • 主な違い:ファインチューニングとRAGの使い分け
                                                                                                                                                    • RAGとファインチューニングの両方を使用する場合(ハイブリッドパターン)
                                                                                                                                                    • ファインチューニングのユースケースとプロジェクト
                                                                                                                                                    • RAGのユースケースとハイブリッドデプロイの例
                                                                                                                                                    • AIモデルの運用:役割と責任
                                                                                                                                                    • データの品質、コンプライアンス、ガバナンスのチェックリスト
                                                                                                                                                    • コスト、パフォーマンス、スケーリングに関する考慮事項
                                                                                                                                                    • テスト、監視、および継続的なメンテナンス
                                                                                                                                                    • 意思決定フレームワーク:エンタープライズAIにおける選択方法
                                                                                                                                                    • 実践的なテンプレートと実装に向けた次のステップ
                                                                                                                                                    • RAGとファインチューニングに関するFAQ
                                                                                                                                                    • クイック定義:ファインチューニング、RAG、および主要用語
                                                                                                                                                    • ファインチューニングの仕組みと理解
                                                                                                                                                    • ファインチューニングの実行:技術的なステップの解説
                                                                                                                                                    • 企業向けAIシステムにおけるRAGの運用方法
                                                                                                                                                    • データ品質と検索:データエンジニア向けガイダンス
                                                                                                                                                    • 主な違い:ファインチューニングとRAGの使い分け
                                                                                                                                                    • RAGとファインチューニングの両方を使用する場合(ハイブリッドパターン)
                                                                                                                                                    • ファインチューニングのユースケースとプロジェクト
                                                                                                                                                    • RAGのユースケースとハイブリッドデプロイの例
                                                                                                                                                    • AIモデルの運用:役割と責任
                                                                                                                                                    • データの品質、コンプライアンス、ガバナンスのチェックリスト
                                                                                                                                                    • コスト、パフォーマンス、スケーリングに関する考慮事項
                                                                                                                                                    • テスト、監視、および継続的なメンテナンス
                                                                                                                                                    • 意思決定フレームワーク:エンタープライズAIにおける選択方法
                                                                                                                                                    • 実践的なテンプレートと実装に向けた次のステップ
                                                                                                                                                    • RAGとファインチューニングに関するFAQ
                                                                                                                                                    Data + AIの基盤

                                                                                                                                                    RAG vs ファインチューニング:AIモデルとAIシステムにおける企業の意思決定

                                                                                                                                                    エンタープライズAIにおけるRAGとファインチューニングの選択基準を理解しましょう。それぞれの手法をいつ使用すべきか、いつ両方を組み合わせるべきか、そして組織でどちらかをどのように運用化するかを解説します。

                                                                                                                                                    によって Databricks Staff による投稿

                                                                                                                                                    • RAGはクエリ実行時にAIモデルを外部データに接続するため、再トレーニングは不要です。情報が頻繁に変更される場合、回答の根拠を示す必要がある場合、またはラベル付きのトレーニングデータが利用できない場合に最適な選択肢となります。
                                                                                                                                                    • ファインチューニングは、ドメイン固有の動作、出力の一貫性、専門用語に合わせてモデルの重みを永続的に調整します。これは、基礎となる知識が安定しており、クエリの量が初期のトレーニングコストに見合う場合に最も効果的です。
                                                                                                                                                    • RAGとファインチューニングの両方を組み合わせたハイブリッドアプローチは、通常、どちらか一方のみを使用する場合よりも優れたパフォーマンスを発揮します。ファインチューニングが動作の一貫性を担保し、RAGがライブのナレッジベースから最新の事実に基づいた回答を維持します。

                                                                                                                                                    現在、多くの企業のAIロードマップにおいて、RAGとファインチューニングのどちらを採用すべきかという議論が交わされています。どちらのアプローチも、コスト、機能、制約の異なるトレードオフを伴う独自のメカニズムを通じて、大規模言語モデルを組織のニーズに適応させます。

                                                                                                                                                    本質的に、RAGとファインチューニングの選択は、推論時に新しい知識を注入するか、デプロイ前にモデルの重みにドメインの専門知識を組み込むかの違いです。検索拡張生成は、AIシステムを外部データソースに動的に接続するのに対し、ファインチューニングは特定のトレーニングプロセスを通じてモデルの内部の重みを永続的に変更します。RAGは主にモデルに新しい知識を注入するために使用され、ファインチューニングは動作、トーン、またはタスクの構造を変更するのに最適です。

                                                                                                                                                    このガイドでは、ファインチューニングの仕組み、本番環境におけるRAGシステムの運用方法、およびRAGとファインチューニングを組み合わせたハイブリッドアプローチが適しているケースについて解説します。主なテーマとして、ファインチューニングのユースケースと技術要件、検索設計とパイプラインアーキテクチャ、両アプローチにおけるデータパイプライン、ガバナンス、およびこの選択を検討しているチームのための意思決定フレームワークを取り上げます。

                                                                                                                                                    クイック定義:ファインチューニング、RAG、および主要用語

                                                                                                                                                    ファインチューニングとは?

                                                                                                                                                    ファインチューニングとは、厳選されたデータセットで追加のトレーニングを行うことにより、事前学習済みモデルを特定のドメインタスクに適応させるプロセスです。このプロセスでは、教師あり学習を通じてモデルの内部パラメータを永続的に変更し、新しい動作、出力構造、またはドメイン固有の知識をモデルに学習させます。このように適応されたモデルは、パラメータ内にドメイン知識を直接保持するため、推論時に外部からの検索を行うことなく、一貫した回答を生成できます。RAGとファインチューニングのどちらを採用するかを評価する前に、このファインチューニングの仕組みを理解しておくことが不可欠です。

                                                                                                                                                    検索拡張生成(RAG)とは?

                                                                                                                                                    検索拡張生成(RAG)は、推論時に大規模言語モデルを外部のナレッジベースに接続します。パラメータに知識を組み込むのではなく、RAGモデルはベクトルデータベースやその他のドキュメントストアから関連情報を取得し、生成前にユーザーのプロンプトを拡張します。これにより、AIモデルは再トレーニングを行うことなく最新のデータにアクセスできるようになります。これは、情報が頻繁に変更されるアプリケーションにおいて非常に有用です。

                                                                                                                                                    ハイブリッドアプローチとは?

                                                                                                                                                    ハイブリッドアプローチは、モデルのトレーニングと検索拡張生成(RAG)を組み合わせて、それぞれの強みを活かす手法です。多くの企業がこの統合アプローチを採用しており、ドメインの理解と出力の一貫性のためにモデルトレーニングを利用し、リアルタイムデータや動的なドキュメントストアへのアクセスにはRAGを利用しています。

                                                                                                                                                    知っておくべき基本用語

                                                                                                                                                    主要用語:ファインチューニング済みモデル(追加の教師あり学習を通じて適応されたLLM)、RAGシステム(検索と生成を組み合わせたアーキテクチャ)、トレーニングデータ(モデルのファインチューニングに使用される厳選されたサンプル)、LoRAなどのパラメータ効率の良いファインチューニング手法、ナレッジベース(推論時に検索パイプラインがクエリを実行するドキュメントストア)。

                                                                                                                                                    ファインチューニングの仕組みと理解

                                                                                                                                                    ファインチューニングは、ドメイン固有のデータに対して集中的なトレーニングプロセスを実行することで、モデルの内部の重みを調整します。ゼロからの事前学習とは異なり、このアプローチはすでに能力を持つベースモデルから開始し、特定のタスクに特化させます。この技術は設計上静的であり、モデルの知識はトレーニング時点の特定のドメインのスナップショットに固定されます。更新するには、新しいドメイン固有のデータを収集し、別のトレーニングサイクルを実行する必要があります。ファインチューニングは、モデルの動作を調整して、現在の出力と厳選されたサンプルに示されている望ましい動作とのギャップを縮小します。そのため、情報の最新性よりも一貫性やフォーマットが重要視される、変化の遅い知識に適しています。

                                                                                                                                                    教師あり再トレーニングの概要

                                                                                                                                                    ファインチューニングのプロセスは、通常、教師あり学習の形式に従います。トレーニングデータは、望ましい動作を示す入力と出力のペアで構成されます。たとえば、臨床アプリケーション向けの医学用語のQ&Aや、法務向けのファインチューニング用の契約書言語のサンプルなどです。トレーニングプロセス中、モデルの重みは出力とラベル付きサンプルの間のギャップを最小限に抑えるように更新されます。ファインチューニングには、高品質なデータ、MLの専門知識、および実質的な計算リソースが必要であり、これらのコストはRAGシステムのオーバーヘッドとは大きく異なります。

                                                                                                                                                    パラメータ効率の良いファインチューニング手法

                                                                                                                                                    フルパラメータのファインチューニングはすべてのパラメータを更新するため、コストがかかります。Low-Rank Adaptation(LoRA)などのパラメータ効率の良いファインチューニング技術は、追加された重みの小さなサブセットのみをトレーニングすることでこのコストを削減し、AIチームにとってモデルのファインチューニングを大幅に導入しやすくします。これらの手法は、パフォーマンスのメリットをほとんど維持しながら、トレーニングコストを大幅に削減します。

                                                                                                                                                    ファインチューニングの実行:技術的なステップの解説

                                                                                                                                                    ファインチューニングデータセットのデータ準備

                                                                                                                                                    データの準備は最も重要なステップです。トレーニングを開始する前に、高品質なデータを厳選し、ラベル付けし、クレンジングする必要があります。これらのサンプルは、適応されたモデルが本番環境で遭遇するクエリの実際の分布を反映している必要があります。トレーニングデータが限られていると、通常は一貫性のない結果が生じ、不正確なデータはエラーをモデルパラメータに直接伝播させるため、検証が必須条件となります。

                                                                                                                                                    トレーニング、検証、および評価指標

                                                                                                                                                    トレーニングデータが準備されると、ファインチューニングプロセスは、ホールドアウトされた検証セットを介して監視される教師ありループを実行します。モデルのパフォーマンスは、タスク固有の指標(ドメイン固有のタスクにおける正確性、生成品質スコア、または指示に従うように適応されたモデル用のカスタム評価基準など)を通じて追跡されます。トレーニングを開始する前にファインチューニングの目標を定義しておく必要があります。チェックポイント機能を使用することで、デプロイに最適なチェックポイントを選択できます。

                                                                                                                                                    企業向けAIシステムにおけるRAGの運用方法

                                                                                                                                                    検索拡張生成(RAG)は、クエリ実行時にAIシステムを外部データに接続することで機能します。本番デプロイに向けてRAGとファインチューニングを評価しているチームにとって、各ステージでRAGがどのように機能するかを理解することは不可欠です。

                                                                                                                                                    RAGアーキテクチャ:検索、拡張、生成

                                                                                                                                                    RAGは3つのステップに従います。第一に、ユーザーのクエリが数値ベクトルに埋め込まれます。第二に、そのベクトルがベクトルデータベースを検索し、意味的に最も類似しているドキュメントのチャンクを抽出します。第三に、取得されたコンテキストがLLMに送信されるプロンプトに挿入され、LLMは静的な知識だけに頼るのではなく、その外部コンテキストに基づいた回答を生成します。取得したデータからの引用をユーザーに提示することもできるため、適応モデルでは容易に実現できないトレーサビリティが可能になります。

                                                                                                                                                    RAGの主要コンポーネントとベクトルデータベース

                                                                                                                                                    機能するRAGモデルには、埋め込みモデル、ドキュメントの埋め込みを保存およびインデックス登録するためのベクトルデータベース、類似性検索のための検索システム、および生成のためのLLMが必要です。Databricks AI Searchは、クエリ量の変動に合わせて自動的にスケーリングする、自動更新の検索レイヤーを提供します。ナレッジベースにコンテンツを供給するデータパイプラインは、RAGシステムを最新の状態に維持するために継続的にメンテナンスする必要があります。また、RAGは、教師ありトレーニングデータとして使用するのが難しい非構造化データ(PDF、スクレイピングされたWebページ、社内ドキュメントなど)も処理できます。

                                                                                                                                                    データ品質と検索:データエンジニア向けガイダンス

                                                                                                                                                    RAGとファインチューニングのどちらの決定も正確なデータに依存しますが、その要件はパイプラインの異なるステージで発生します。データエンジニアは、どちらのアプローチにおいても中心的な役割を果たします。

                                                                                                                                                    取り込みパイプラインと埋め込みの更新

                                                                                                                                                    検索パイプラインにおいて、データエンジニアは、新しいドキュメントをロード、チャンク化、および検索レイヤーに埋め込むための取り込みデータパイプラインを設計および維持します。埋め込みの更新頻度によって、インデックスからの新しいデータがどれだけ迅速に回答に反映されるかが決まります。最新の情報を必要とするアプリケーションでは、埋め込みを毎日更新する場合があります。変化の遅いナレッジベースでは、毎週更新します。ファインチューニングの場合、エンジニアリングチームがデータセットのキュレーション(トレーニングフレームワークが必要とする教師あり形式への厳選されたコンテンツの収集、クレンジング、フォーマット、およびバージョン管理)を担当します。

                                                                                                                                                    プロベナンス、データプライバシー、および引用戦略

                                                                                                                                                    RAGはプロベナンス(来歴)において本質的な強みを持っています。取得されたデータが明示的にLLMに渡されるため、RAGパイプラインは各回答に対して特定のソースドキュメントを引用できます。適応されたモデルは内部パラメータから回答を合成するため、特定の出力を特定のソース資料まで遡って追跡することが困難であり、これは規制の厳しい業界において重大なガバナンス上の制限となります。データプライバシーも重要な差別化要因です。プライベートデータを管理された検索レイヤーに保持することで、組織は再トレーニングを行うことなくアクセスを更新または制限できます。機密データでトレーニングされた適応モデルは、その情報が意図しない出力に現れるのを防ぐために、慎重なガバナンスが必要です。

                                                                                                                                                    主な違い:ファインチューニングとRAGの使い分け

                                                                                                                                                    知識の最新性と更新頻度

                                                                                                                                                    検索パイプラインは、データがナレッジベースにインデックス登録されるとすぐに新しいデータを反映するため、再トレーニングは不要です。これにより、新しいデータが継続的に到着する場合にRAGが最適となります。ファインチューニングされたモデルは、トレーニング時点の正確なデータのスナップショットに制限され、更新には新しいデータを収集して別のトレーニングサイクルを実行する必要があります。情報が頻繁に変更されるアプリケーション(現在の市場状況を参照する財務アドバイザリーツールや、最近の訴訟ファイルを引用する法務アシスタントなど)では、RAGが決定的な優位性を提供します。モデルトレーニングは、モデルの重みに組み込まれることでメリットが得られ、かつ急速には変化しない、長期的なドメイン固有の知識に最適です。

                                                                                                                                                    コストプロファイルとインフラストラクチャのニーズ

                                                                                                                                                    モデルのファインチューニングには、初期のトレーニングコストが大きくかかりますが、より小規模で特化した適合モデルで大規模な汎用システムを代替できるようになるため、推論あたりのコストを削減できます。デプロイされたファインチューニング済みモデルは検索インフラを必要としないため、クエリの複雑さが軽減されます。検索パイプラインにはトレーニングコストはかかりませんが、インデックス作成インフラ、ベクトルデータベース、および埋め込みのメンテナンスのための継続的なオーバーヘッドが発生します。

                                                                                                                                                    ガバナンス、説明責任、監査可能性

                                                                                                                                                    これらのモデルは、関連する知識が不足しているときにそれを伝えることができないため、特定のドメイン外でハルシネーションを起こすリスクが高くなります。知識の有無にかかわらず、自信に満ちた回答を生成してしまうためです。RAGは、検索された正確なデータに基づいて回答を生成(グラウンディング)することでハルシネーションを軽減し、組織が検索レイヤーで機密データへのアクセスを制御できるようにします。規制当局の監査において、RAGは情報源の引用を通じて容易な監査可能性を提供しますが、ファインチューニングでは、モデルのパラメータにバイアスが組み込まれるのを防ぐために、トレーニングデータの品質を管理する必要があります。

                                                                                                                                                    RAGとファインチューニングの両方を使用する場合(ハイブリッドパターン)

                                                                                                                                                    本番環境において、RAGとファインチューニングのどちらを選択するかは、単純な二者択一ではないことがほとんどです。多くの本番レベルのAIシステムは、RAGとファインチューニングの両方のメリットを活かしつつ、それぞれの制限を緩和するハイブリッドアプローチを採用しています。

                                                                                                                                                    迅速な成果(Quick Wins)を得るためにRAGから始める

                                                                                                                                                    大規模なラベル付きデータセットや豊富な計算リソースを持たない組織は、迅速に成果を上げるために、まずRAGから始めるべきです。モデルを再トレーニングすることなく、関連データを即座に取り込むことができ、デプロイにディープラーニングの専門知識も必要ありません。本番環境の検索パイプラインから観察されるクエリパターンは、どのクエリタイプを改善すべきかを正確に示してくれるため、後に効果的なファインチューニング用データセットを設計するために必要なドメイン固有のデータを提供してくれます。

                                                                                                                                                    大量処理やパフォーマンスが重視されるフロー向けのファインチューニング

                                                                                                                                                    検索パイプラインが本番環境で稼働し、クエリパターンが把握できたら、チームはレイテンシと出力の一貫性が最も重要となる大量処理フロー向けにファインチューニングを検討すべきです。ファインチューニングは、RAGがコンテキストを追加するだけでは対応できない、モデルのトーン、フォーマット、専門的な推論プロセスの変更に効果を発揮します。RAGの検索レイヤーと並行してファインチューニングされたコンポーネントを使用することで、ナレッジベースを最新に保ちながら、ドメインの正確性を実現できます。

                                                                                                                                                    ハイブリッドアプローチ:RAGとファインチューニングの組み合わせ

                                                                                                                                                    ハイブリッドアプローチでは、ドメインの理解と出力構造のためにファインチューニングを使用し、RAG検索によって最新の事実や動的なコンテンツを提供します。RAGとファインチューニングを併用することで、組織は厳選されたドメインデータでモデルをファインチューニングしつつ、RAGを活用してトレーニング時には存在しなかった最新情報を提供できます。具体的な例として、法律用語や推論パターンに基づいてファインチューニングされた法律文書分析システムが挙げられます。このシステムでは、RAGが最新の法令や判例ファイルを検索します。この組み合わせ手法により、動作の一貫性があり、かつ事実に基づいた最新のAIシステムを構築できます。RAGパイプラインとファインチューニングを連携させるには慎重なオーケストレーションが必要ですが、どちらか一方のみのアプローチよりも常に優れたパフォーマンスを発揮します。

                                                                                                                                                    ファインチューニングのユースケースとプロジェクト

                                                                                                                                                    医療および法律分野におけるファインチューニングの例

                                                                                                                                                    これは、医療レポートの作成、法的契約書の起草、または構造化された臨床文書の大規模な作成において、優れたファインチューニングの選択肢となります。医療用語でファインチューニングされたモデルは、呼び出しごとに入念なプロンプトエンジニアリングを行わなくても、正しい用語と文書構造を生成します。法律分野のファインチューニングプロジェクトでは、管轄区域固有の言語や契約書テンプレートでモデルをトレーニングし、適合されたモデルが組織のスタイルガイドに沿った文書を起草できるようにします。どちらのケースも、専門知識の変化が緩やかで、出力フォーマットが一貫しているため、ファインチューニングの初期コストをかける価値が十分にあります。

                                                                                                                                                    コード生成とドメインの専門知識

                                                                                                                                                    コード生成は、ファインチューニングの強力なユースケースです。独自のコードベース、社内API、または組織固有のコーディング標準でトレーニングされたファインチューニング済みモデルは、そのコードベース内の専門的なタスクにおいて、汎用的なAIモデルを凌駕します。コードでモデルをファインチューニングすることで、特定のタスクにおいて、より小規模なシステムで大規模な汎用モデルと同等のパフォーマンスを発揮させることができます。コード生成を目的としたファインチューニングプロジェクトでは、自然言語の指示と正しいコード出力をペアにした教師あり学習のサンプルを使用するため、ラベル付きデータの収集が容易です。大規模運用における推論あたりのコスト効率の高さは、通常、初期投資に見合うものです。

                                                                                                                                                    レポート

                                                                                                                                                    エンタープライズ向けエージェントAIプレイブック

                                                                                                                                                    読む
                                                                                                                                                    image

                                                                                                                                                    RAGのユースケースとハイブリッドデプロイの例

                                                                                                                                                    エンタープライズAIカスタマーサポートとQ&A

                                                                                                                                                    RAGは、継続的に更新されるナレッジベースを参照するカスタマーサポートボット、社内規定ドキュメントを検索する社内HRツール、特定のケースファイルから関連情報を抽出する必要があるリサーチアシスタントに最適です。RAGは、モデルの記憶からもっともらしいが誤っている可能性のある回答を生成するのではなく、検索された正確なコンテキストに基づいて回答を生成(グラウンディング)するため、これらの状況におけるハルシネーションを大幅に削減します。RAGシステムでは、きめ細かなデータアクセス制御が可能です。検索レイヤーでユーザーの権限レベルに応じて検索データを制限できるため、権限のないユーザーへの回答に機密データが含まれるのを防ぐことができます。モデルのトレーニングデータ以外の外部知識ソースを必要とするあらゆるユースケースにおいて、RAGは正確性を実現するための最も実用的なアプローチを提供します。

                                                                                                                                                    ハイブリッドケーススタディ:法律文書分析

                                                                                                                                                    実用的な例として、ベースモデルが法律用語や推論パターンに基づいてファインチューニングされている法律文書分析システムがあります。同時に、RAGは、継続的に更新されるドキュメントストアから、各クエリに関連する最新の法律や規制の更新情報を検索します。ファインチューニングされたコンポーネントが解釈のスタイルと出力フォーマットを処理し、検索システムが知識の最新性を担保します。この組み合わせ手法により、専門的な知識と最新の事実に基づく根拠(グラウンディング)の両方が提供されます。これは、検索パイプラインやモデルトレーニングの単独アプローチでは達成できない成果です。

                                                                                                                                                    AIモデルの運用:役割と責任

                                                                                                                                                    データエンジニア、MLエンジニア、DevOps

                                                                                                                                                    エンジニアリングチームは、ファインチューニング用データセットとRAG検索システムの両方にデータを供給するデータパイプラインを所有します。モデルトレーニングにおいて、エンジニアリングチームはドメイン固有のデータを収集し、ラベル付け基準を適用し、再現性のためにデータセットのバージョン管理を行います。

                                                                                                                                                    検索パイプラインにおいて、エンジニアリングチームはドキュメント取り込みパイプラインを設計し、埋め込みの更新スケジュールを管理し、検索の健全性を監視します。MLエンジニアは、ベースモデルの選択、トレーニングの実行、ホールドアウトされたベンチマークに対する適合モデルの評価など、モデルトレーニングのワークフローを担当します。DevOpsチームは、両方のAIシステムのサービングインフラを管理し、本番環境のクエリボリュームにおいてレイテンシのSLAが満たされるようにします。

                                                                                                                                                    AIシステムのガバナンスチェックリスト

                                                                                                                                                    RAGとファインチューニングの両方のデプロイにおけるガバナンスには、以下を含める必要があります。すべてのトレーニングデータセットおよび検索ドキュメントストアに関する文書化されたデータリネージ、ファインチューニングの準備段階と検索レイヤーの両方におけるプライベートデータへのアクセス制御、品質ドリフトに関するファインチューニング済みモデル出力の定期的な監査、およびどのプライベートデータがファインチューニングに許容され、どれが制御されたRAG検索に許容されるかを規定するポリシー。Unity Catalogは、単一のプラットフォームでトレーニングデータ資産や検索インデックスへのアクセスを管理するための統合されたガバナンスを提供します。

                                                                                                                                                    データの品質、コンプライアンス、ガバナンスのチェックリスト

                                                                                                                                                    データの品質は、RAGとファインチューニングの両方において基礎となるものです。どの段階であっても不備があれば、デプロイ時の出力の質の低下につながります。

                                                                                                                                                    データ検証のステップ

                                                                                                                                                    ファインチューニングの場合、トレーニングを開始する前に検証を行う必要があります。重複の削除、フォーマットの正規化、ラベルの正確性の検証、および事実の正確性に基づくフィルタリングです。検索パイプラインの場合、検証はインデックス登録されたドキュメントに適用されます。古いコンテンツ、一貫性のないフォーマット、破損したプロベナンス(来歴)リンクがないか確認します。信頼性の高い出力を得るためには、あらゆる段階で正確なデータを使用することが不可欠です。

                                                                                                                                                    保持、アクセス制御、モデルのドリフト

                                                                                                                                                    検索パイプラインとファインチューニング済みモデルの両方において、ドリフトの継続的な監視が必要です。ドメイン固有の知識が進化するにつれて、ファインチューニング済みモデルは陳腐化する可能性があります。トレーニングデータに反映されていない新しい規制や用語の移行は、時間の経過とともにモデルのパフォーマンスを低下させます。検索パイプラインでは、取り込みパイプラインが検索インデックスを最新の状態に維持できない場合、データ品質のドリフトが発生します。ベースモデルからの一般的な知識は、最新のドメインに正確なソース資料の代わりにはなりません。ファインチューニングに使用されるトレーニングサンプルは、本番運用のデータと同じガバナンスポリシーの下で保持されるべきであり、文書化された保持期間とプラットフォームによって強制されるアクセス制御が適用される必要があります。

                                                                                                                                                    コスト、パフォーマンス、スケーリングに関する考慮事項

                                                                                                                                                    推論コストとファインチューニングのトレーニングコスト

                                                                                                                                                    ファインチューニングには高い初期トレーニングコストがかかりますが、より小規模で特化した適合モデルで大規模な汎用システムを代替できるようになるため、推論あたりのコストを削減できます。このアプローチのコスト効率は、推論コストの削減額がトレーニングへの投資額を上回るような、大量のクエリが発生する場合に明確になります。検索パイプラインはこれとは逆のコスト構造を持っています。トレーニングコストはかかりませんが、各推論呼び出しにおいて、生成前にクエリの埋め込み、ベクトルデータベースの検索、関連データのランキングを行う必要があります。RAGとファインチューニングのコスト分析では、トレーニングへの投資とクエリごとのオーバーヘッドの両方を考慮する必要があります。

                                                                                                                                                    大規模な検索におけるレイテンシへの影響

                                                                                                                                                    RAGは、埋め込み、検索、ランク付け、取得、生成という複数のステップからなるプロセスを必要とするため、ファインチューニングされたモデルを直接呼び出す場合と比較してレイテンシが増加します。レイテンシに敏感なアプリケーションでは、ファインチューニングの方が高速な推論パスを提供できる可能性があります。最新のデータやトレーサビリティが必要なアプリケーションでは、オーバーヘッドが増えるものの、依然としてRAGが適切な選択肢となります。インデックス化されたドキュメントの最新データベースを維持すること自体、継続的なエンジニアリングの責任を伴います。

                                                                                                                                                    テスト、監視、および継続的なメンテナンス

                                                                                                                                                    RAGおよび調整済みモデルで監視すべきメトリクス

                                                                                                                                                    調整済みモデルの監視では、ホールドアウトされたベンチマークセットに対する精度、出力の一貫性スコア、およびドメイン外クエリに対するハルシネーション率など、モデルのパフォーマンスメトリクスを長期的に追跡する必要があります。検索パイプラインの監視では、適切なドキュメントが返されているかどうかの検索精度や、LLMが取得したデータをどれだけ正確に使用しているかを評価する生成の忠実度スコアを追跡する必要があります。MLflowは、ファインチューニングの実験追跡とRAGの評価パイプラインの両方をサポートしており、両方のアプローチにわたって統一されたオブザーバビリティを提供します。

                                                                                                                                                    再評価と再学習のスケジュール設定

                                                                                                                                                    ファインチューニングされたモデルは、ドリフトを検出するために、更新されたベンチマークデータセットに対して少なくとも四半期に一度は再評価する必要があります。モデルのパフォーマンスが許容可能なしきい値を下回った場合は、新しくキュレーションされたサンプルを使用して、新しい学習サイクルを開始する必要があります。検索パイプラインでは、ナレッジベースが正確かつ最新の状態に保たれるよう、インジェストパイプラインを継続的に監視する必要があります。検索精度と出力品質の両方のアラートしきい値をプロアクティブに設定することで、本番環境のユーザーに影響が及ぶ前に、チームが機能低下を検出できるようにします。

                                                                                                                                                    意思決定フレームワーク:エンタープライズAIにおける選択方法

                                                                                                                                                    意思決定ツリー:RAGとファインチューニングの基準

                                                                                                                                                    本番環境の各ユースケースにおいて、RAGとファインチューニングのどちらを選択すべきかを判断するために、このフレームワークをご活用ください。

                                                                                                                                                    • アプリケーションにリアルタイムデータや頻繁な更新が必要ですか? → RAG
                                                                                                                                                    • 主な目的は、モデルのトーン、フォーマット、または動作を変更することですか? → ファインチューニング
                                                                                                                                                    • キュレーションされた学習データが、ラベル付きサンプルとして十分な規模で利用可能ですか? → ファインチューニングが有効な可能性があります。
                                                                                                                                                    • アプリケーションに、追跡可能で引用可能な回答が必要ですか? → RAG
                                                                                                                                                    • チームのリソースが限られており、学習用の計算リソースが不足していますか? → RAGから開始してください。
                                                                                                                                                    • 高いクエリボリュームにおいて、レイテンシが極めて重要なユースケースですか? → ファインチューニングを検討してください。
                                                                                                                                                    • アプリケーションに、ドメインの専門知識と最新の事実の両方が必要ですか? → ハイブリッドアプローチ

                                                                                                                                                    可能な限り両方のアプローチを試験的に導入し、定義された成功基準に照らしてモデルのパフォーマンスを測定し、実証的な結果に基づいて各ワークロードにおけるRAGとファインチューニングの最終決定を行ってください。

                                                                                                                                                    段階的な導入計画

                                                                                                                                                    段階的なアプローチにより、RAGとファインチューニングの選択におけるリスクを軽減できます。フェーズ1:RAGをデプロイしてユースケースを検証し、本番環境から実際のクエリデータを収集します。フェーズ2:観察されたクエリパターンを使用して、ファインチューニング用のサンプルをキュレーションします。RAGシステムが最も苦手とする部分が、学習データセットの理想的な開始点となります。フェーズ3:知識の最新性を維持するためにRAGの検索機能を残しつつ、最も価値が高く、ボリュームの大きいフローにファインチューニングを導入します。この構造により、チームは学習用の計算リソースを投入する前に、モデルの動作を検証し、ファインチューニングに必要な学習データを収集できます。

                                                                                                                                                    実践的なテンプレートと実装に向けた次のステップ

                                                                                                                                                    最小限のRAGパイプラインのチェックリスト

                                                                                                                                                    最小限のRAGパイプラインには、非構造化データをロードしてチャンク化するドキュメントインジェストプロセス、チャンクをベクトル化する埋め込みモデル、結果の埋め込みを保存してインデックス化するベクトルデータベース、類似度検索のための検索システム、取得したデータとユーザーのクエリを組み合わせるプロンプトテンプレート、そして生成のためのLLMが必要です。これにより、クエリ実行時に関連情報が提示されます。RAGモデルを本番環境に接続する前に、テストクエリに対して検索精度を検証する必要があります。検索のストレステストを行い、モデルのパラメータの外部にあるナレッジソースが関連データとして提示されることを確認します。

                                                                                                                                                    ファインチューニングのパイロットプロジェクトのスコープ設定

                                                                                                                                                    モデリングのパイロットプロジェクトは、測定可能な成功基準を持つ単一のタスクタイプなど、限定的で明確に定義されたユースケースから開始する必要があります。ベースモデルを選択する前に、ターゲットタスクに必要なドメイン知識を特定します。ホールドアウトされた検証用スプリットを含め、少なくとも数百件の高品質な学習データのサンプルを収集します。LoRAを使用したパラメータ効率の良いファインチューニングにより、単一のGPUインフラストラクチャでの学習が可能になります。ファインチューニングを開始する前に評価メトリクスを定義し、ベースラインとの差分を利用して、これらの取り組みをさらに拡大するための根拠とします。

                                                                                                                                                    RAGとファインチューニングに関するFAQ

                                                                                                                                                    RAGよりも優れた方法はありますか?

                                                                                                                                                    すべてのエンタープライズAIのユースケースにおいて、検索拡張生成(RAG)よりも普遍的に優れた単一の方法はありません。アプリケーションに最新の情報、追跡可能な回答、および学習コストをかけない迅速なデプロイが必要な場合、RAGは非常に優れています。動作の一貫性と低レイテンシの推論が最優先されるアプリケーションでは、多くの場合、ファインチューニングがRAGシステムを上回ります。プロンプトエンジニアリングは、外部知識の要件がないチームにとってよりシンプルな代替手段を提供しますが、ファインチューニングのような深みや、RAGのような最新性はありません。ファインチューニングとRAGの検索を組み合わせるハイブリッドアプローチは、通常、どちらか一方を単独で使用するよりも優れたパフォーマンスを発揮します。

                                                                                                                                                    企業がRAGではなくファインチューニングを選択するのはなぜですか?

                                                                                                                                                    アプリケーションが専門的なドメイン動作や一貫した出力フォーマットを必要とする場合、または外部知識へのアクセスを制限する制約下で動作する場合、企業はRAGよりもファインチューニングを選択すべきです。既存のモデルではドメイン固有のタスクで十分なパフォーマンスを発揮できない場合や、特定の学習データによって修正可能なバイアスが存在する場合に、ファインチューニングの選択が適しています。医療用語、法的契約の慣行、独自のコーディング標準など、ドメイン固有の知識が安定的で変化が遅い場合、ファインチューニングは効果的に機能し、事前の学習投資が多くの推論呼び出し全体で償却されます。また、このアプローチでは外部の検索インフラを維持する必要がなくなるため、情報の最新性が主な要件ではないチームにとって、運用の複雑さが軽減されます。

                                                                                                                                                    RAGのデメリットは何ですか?

                                                                                                                                                    RAGの主なデメリットには、検索レイテンシ、継続的なインフラの複雑さ、および検索品質への依存が挙げられます。RAGは検索の品質に依存します。検索システムに欠陥がある場合や、ナレッジベースに不正確なデータが含まれている場合、LLMは正しい回答を生成できない可能性があります。RAGでは、ベクトルデータベース、チャンク化戦略、埋め込みモデルの継続的な管理が必要となり、これは調整済みモデルにはない運用オーバーヘッドとなります。複数のステップからなる推論パイプラインは、ファインチューニングされたモデルを直接呼び出す場合と比較してレイテンシを増加させます。永続的な動作変更を目的とする場合、RAGシステムでは対応できないため、依然として広範なファインチューニングが必要となります。

                                                                                                                                                    RAGとファインチューニングを組み合わせることはできますか?

                                                                                                                                                    はい。RAGとファインチューニングの組み合わせは可能なだけでなく、多くの成熟したエンタープライズAIデプロイメントにおいて推奨されるパターンです。ハイブリッドアプローチでは、ドメインの理解と出力フォーマットにファインチューニングを適用し、推論時にはRAGの検索によって最新の事実を提供します。RAGとファインチューニングを組み合わせることで、一貫性があり、ドメインに対して正確で、事実に基づいた最新のAIシステムを実現できます。RAGパイプラインとファインチューニングを連携させるには慎重なオーケストレーションが必要ですが、複雑なユースケースにおいては、どちらか一方のアプローチを単独で使用するよりも大幅に優れた結果をもたらします。

                                                                                                                                                    (このブログ記事はAI翻訳ツールを使用して翻訳されています) 原文記事

                                                                                                                                                    最新の投稿を受信トレイで受け取る

                                                                                                                                                    ブログを購読して、最新の投稿を受信トレイにお届けします。

                                                                                                                                                    Sign up

                                                                                                                                                    すべてのブログを見る
                                                                                                                                                    databricks logo
                                                                                                                                                    Databricks を選ぶ理由
                                                                                                                                                    Databricks を選ぶ理由
                                                                                                                                                    • For App Developers
                                                                                                                                                    • エグゼクティブ向け
                                                                                                                                                    • スタートアップ向け
                                                                                                                                                    • レイクハウスアーキテクチャ
                                                                                                                                                    • Databricks AIリサーチ
                                                                                                                                                    導入事例
                                                                                                                                                    • 注目の導入事例
                                                                                                                                                    パートナー
                                                                                                                                                    • パートナー概要
                                                                                                                                                    • パートナープログラム
                                                                                                                                                    • パートナーを探す
                                                                                                                                                    • パートナースポットライト
                                                                                                                                                    • クラウドプロバイダー
                                                                                                                                                    • パートナーソリューション
                                                                                                                                                    Databricks を選ぶ理由
                                                                                                                                                    • For App Developers
                                                                                                                                                    • エグゼクティブ向け
                                                                                                                                                    • スタートアップ向け
                                                                                                                                                    • レイクハウスアーキテクチャ
                                                                                                                                                    • Databricks AIリサーチ
                                                                                                                                                    導入事例
                                                                                                                                                    • 注目の導入事例
                                                                                                                                                    パートナー
                                                                                                                                                    • パートナー概要
                                                                                                                                                    • パートナープログラム
                                                                                                                                                    • パートナーを探す
                                                                                                                                                    • パートナースポットライト
                                                                                                                                                    • クラウドプロバイダー
                                                                                                                                                    • パートナーソリューション
                                                                                                                                                    製品
                                                                                                                                                    レイクハウスプラットフォーム
                                                                                                                                                    • プラットフォーム
                                                                                                                                                    • 共有
                                                                                                                                                    • データガバナンス
                                                                                                                                                    • 人工知能(AI)
                                                                                                                                                    • BI
                                                                                                                                                    • Database
                                                                                                                                                    • データ管理
                                                                                                                                                    • データウェアハウス
                                                                                                                                                    • データエンジニアリング
                                                                                                                                                    • ビジネス生産性
                                                                                                                                                    • アプリケーション開発
                                                                                                                                                    • セキュリティ
                                                                                                                                                    ご利用料金
                                                                                                                                                    • 料金設定の概要
                                                                                                                                                    • 料金計算ツール
                                                                                                                                                    オープンソース
                                                                                                                                                    統合とデータ
                                                                                                                                                    • マーケットプレイス
                                                                                                                                                    • IDE 統合
                                                                                                                                                    • パートナーコネクト
                                                                                                                                                    レイクハウスプラットフォーム
                                                                                                                                                    • プラットフォーム
                                                                                                                                                    • 共有
                                                                                                                                                    • データガバナンス
                                                                                                                                                    • 人工知能(AI)
                                                                                                                                                    • BI
                                                                                                                                                    • Database
                                                                                                                                                    • データ管理
                                                                                                                                                    • データウェアハウス
                                                                                                                                                    • データエンジニアリング
                                                                                                                                                    • ビジネス生産性
                                                                                                                                                    • アプリケーション開発
                                                                                                                                                    • セキュリティ
                                                                                                                                                    ご利用料金
                                                                                                                                                    • 料金設定の概要
                                                                                                                                                    • 料金計算ツール
                                                                                                                                                    統合とデータ
                                                                                                                                                    • マーケットプレイス
                                                                                                                                                    • IDE 統合
                                                                                                                                                    • パートナーコネクト
                                                                                                                                                    ソリューション
                                                                                                                                                    業種別
                                                                                                                                                    • 通信
                                                                                                                                                    • 金融サービス
                                                                                                                                                    • 医療・ライフサイエンス
                                                                                                                                                    • 製造
                                                                                                                                                    • メディア・エンタメ
                                                                                                                                                    • 官公庁・公共機関
                                                                                                                                                    • リテール・消費財
                                                                                                                                                    • 全て表示
                                                                                                                                                    クロスインダストリーソリューション
                                                                                                                                                    • AI エージェント
                                                                                                                                                    • AI ガバナンス
                                                                                                                                                    • サイバーセキュリティ
                                                                                                                                                    • マーケティング
                                                                                                                                                    データの移行
                                                                                                                                                    プロフェッショナルサービス
                                                                                                                                                    ソリューションアクセラレータ
                                                                                                                                                    業種別
                                                                                                                                                    • 通信
                                                                                                                                                    • 金融サービス
                                                                                                                                                    • 医療・ライフサイエンス
                                                                                                                                                    • 製造
                                                                                                                                                    • メディア・エンタメ
                                                                                                                                                    • 官公庁・公共機関
                                                                                                                                                    • リテール・消費財
                                                                                                                                                    • 全て表示
                                                                                                                                                    クロスインダストリーソリューション
                                                                                                                                                    • AI エージェント
                                                                                                                                                    • AI ガバナンス
                                                                                                                                                    • サイバーセキュリティ
                                                                                                                                                    • マーケティング
                                                                                                                                                    リソース
                                                                                                                                                    ドキュメント
                                                                                                                                                    カスタマーサポート
                                                                                                                                                    コミュニティ
                                                                                                                                                    トレーニング・認定試験
                                                                                                                                                    • トレーニング
                                                                                                                                                    • 認定
                                                                                                                                                    • 無料版
                                                                                                                                                    • 大学との連携
                                                                                                                                                    • Databricks アカデミー
                                                                                                                                                    イベント
                                                                                                                                                    • DATA+AI サミット
                                                                                                                                                    • Data+AI ワールドツアー
                                                                                                                                                    • AI Days
                                                                                                                                                    • イベントカレンダー
                                                                                                                                                    ブログ・ポッドキャスト
                                                                                                                                                    • Databricks ブログ
                                                                                                                                                    • AI ブログ
                                                                                                                                                    • Data Brew ポッドキャスト
                                                                                                                                                    • Data+AI のチャンピオンシリーズ
                                                                                                                                                    トレーニング・認定試験
                                                                                                                                                    • トレーニング
                                                                                                                                                    • 認定
                                                                                                                                                    • 無料版
                                                                                                                                                    • 大学との連携
                                                                                                                                                    • Databricks アカデミー
                                                                                                                                                    イベント
                                                                                                                                                    • DATA+AI サミット
                                                                                                                                                    • Data+AI ワールドツアー
                                                                                                                                                    • AI Days
                                                                                                                                                    • イベントカレンダー
                                                                                                                                                    ブログ・ポッドキャスト
                                                                                                                                                    • Databricks ブログ
                                                                                                                                                    • AI ブログ
                                                                                                                                                    • Data Brew ポッドキャスト
                                                                                                                                                    • Data+AI のチャンピオンシリーズ
                                                                                                                                                    企業情報
                                                                                                                                                    企業概要
                                                                                                                                                    • Databricks について
                                                                                                                                                    • 経営陣
                                                                                                                                                    • Databricks Ventures
                                                                                                                                                    • ご相談・お問い合わせ
                                                                                                                                                    採用情報
                                                                                                                                                    • 採用情報概要
                                                                                                                                                    • 求人情報
                                                                                                                                                    プレス・ニュース記事
                                                                                                                                                    • ニュースルーム
                                                                                                                                                    • 受賞歴と業界評価
                                                                                                                                                    セキュリティと信頼
                                                                                                                                                    企業概要
                                                                                                                                                    • Databricks について
                                                                                                                                                    • 経営陣
                                                                                                                                                    • Databricks Ventures
                                                                                                                                                    • ご相談・お問い合わせ
                                                                                                                                                    採用情報
                                                                                                                                                    • 採用情報概要
                                                                                                                                                    • 求人情報
                                                                                                                                                    プレス・ニュース記事
                                                                                                                                                    • ニュースルーム
                                                                                                                                                    • 受賞歴と業界評価
                                                                                                                                                    databricks logo

                                                                                                                                                    Databricks Inc.
                                                                                                                                                    160 Spear Street, 15th Floor
                                                                                                                                                    San Francisco, CA 94105
                                                                                                                                                    1-866-330-0121

                                                                                                                                                    採用情報

                                                                                                                                                    © Databricks 2026. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.

                                                                                                                                                    • プライバシー通知
                                                                                                                                                    • |利用規約
                                                                                                                                                    • |現代奴隷法に関する声明
                                                                                                                                                    • |カリフォルニア州のプライバシー権利
                                                                                                                                                    • |プライバシー設定