メインコンテンツへジャンプ
ログイン
      • Databricks を知る
        • エグゼクティブ向け
          • スタートアップ向け
            • レイクハウスアーキテクチャ
              • Databricks AIリサーチ
              • 導入事例
                • 注目の導入事例
                • パートナー
                  • パートナー概要
                    Databricks パートナー エコシステムの詳細
                    • パートナースポットライト
                      注目のパートナーの発表
                      • パートナープログラム
                        特典、レベル、パートナーになる方法をご覧ください
                        • クラウドプロバイダー
                          AWS、Azure、GCP 上の Databricks
                          • パートナーを探す
                            ニーズに合った Databricks パートナーを見つける
                            • パートナーソリューション
                              業界別および移行ソリューションを見つける
                            • Databricks プラットフォーム
                              • プラットフォームの概要
                                データ・分析・AI のための統合プラットフォーム
                                • データ管理
                                  データの信頼性・セキュリティ・パフォーマンス
                                  • 共有
                                    オープン、セキュア、ゼロコピーでのデータ共有
                                    • データウェアハウジング
                                      バッチ、ストリーミングデータのための ETL とオーケストレーション
                                      • ガバナンス
                                        データ・分析・AI のための統合ガバナンス
                                        • データエンジニアリング
                                          バッチ、ストリーミングデータのための ETL とオーケストレーション
                                          • 人工知能(AI)
                                            ML と生成 AI アプリケーションの構築とデプロイメント
                                            • データサイエンス
                                              データサイエンスの大規模な連携
                                              • BI
                                                実世界データのインテリジェント分析
                                                • アプリケーション開発
                                                  安全なデータと AI アプリを迅速に構築
                                                  • データベース
                                                    データアプリとAIエージェントのための Postgres
                                                    • セキュリティ
                                                      AI時代のために構築されたオープンなエージェント型SIEM
                                                    • 統合とデータ
                                                      • マーケットプレイス
                                                        データ、分析、AI のためのオープンマーケットプレイス
                                                        • IDE 統合
                                                          お気に入りの IDE(統合開発環境)でレイクハウスを構築
                                                          • パートナーコネクト
                                                            Databricks エコシステムの検索と統合
                                                          • ご利用料金
                                                            • Databricks のご利用料金
                                                              料金設定、DBU、その他
                                                              • コスト計算ツール
                                                                クラウド利用でのコンピュートコストの試算
                                                              • オープンソース
                                                                • オープンソーステクノロジー
                                                                  プラットフォームを支えるイノベーションをもっと詳しく
                                                                • 業界向け Databricks
                                                                  • 通信
                                                                    • メディア・エンターテイメント
                                                                      • 金融サービス
                                                                        • 官公庁・公共機関
                                                                          • 医療・ライフサイエンス
                                                                            • リテール・消費財
                                                                              • 製造
                                                                                • 全て見る
                                                                                • クロスインダストリーソリューション
                                                                                  • AI Agents
                                                                                    • サイバーセキュリティ
                                                                                      • マーケティング
                                                                                      • 移行・デプロイメント
                                                                                        • データの移行
                                                                                          • プロフェッショナルサービス
                                                                                          • ソリューションアクセラレータ
                                                                                            • ソリューションアクセラレータ一覧
                                                                                              成果を加速
                                                                                            • トレーニング・認定試験
                                                                                              • トレーニング概要
                                                                                                ニーズに合わせたカリキュラムを探す
                                                                                                • Databricks アカデミー
                                                                                                  Databricks ラーニングプラットフォームにサインインする
                                                                                                  • 認定
                                                                                                    スキル・認定で差別化を図る
                                                                                                    • 無料版
                                                                                                      専門家向けデータとAIツールを無料で学べます
                                                                                                      • 大学との連携
                                                                                                        Databricks を教材として活用
                                                                                                      • イベント
                                                                                                        • DATA+AI サミット
                                                                                                          • Data+AI ワールドツアー
                                                                                                            • AI Days
                                                                                                              • イベントカレンダー
                                                                                                              • ブログ・ポッドキャスト
                                                                                                                • Databricks ブログ
                                                                                                                  最新情報、製品発表、その他の情報
                                                                                                                  • Databricks AI R&Dブログ
                                                                                                                    AI研究とエンジニアリングの成果を見る
                                                                                                                    • Data Brew ポッドキャスト
                                                                                                                      ご相談・お問い合わせ
                                                                                                                      • ポッドキャスト:Data+AI のチャンピオン
                                                                                                                        イノベーションを支えるデータリーダーのインサイト
                                                                                                                      • お役立ちリソース
                                                                                                                        • カスタマーサポート
                                                                                                                          • ドキュメント
                                                                                                                            • コミュニティ
                                                                                                                            • もっと詳しく
                                                                                                                              • リソースセンター
                                                                                                                                • デモセンター
                                                                                                                                  • アーキテクチャ センター
                                                                                                                                  • 企業概要
                                                                                                                                    • Databricks について
                                                                                                                                      • 経営陣
                                                                                                                                        • Databricks Ventures
                                                                                                                                          • ご相談・お問い合わせ
                                                                                                                                          • 採用情報
                                                                                                                                            • 採用情報概要
                                                                                                                                              • 求人情報
                                                                                                                                              • プレス・ニュース記事
                                                                                                                                                • ニュースルーム
                                                                                                                                                  • 受賞歴と業界評価
                                                                                                                                                  • セキュリティと信頼
                                                                                                                                                    • セキュリティと信頼
                                                                                                                                                • 是非ご検討ください!
                                                                                                                                                • デモを見る
                                                                                                                                                • ログイン
                                                                                                                                                • Databricks 無料トライアル
                                                                                                                                                1. ブログ
                                                                                                                                                2. /
                                                                                                                                                  製品
                                                                                                                                                3. /
                                                                                                                                                  記事

                                                                                                                                                埋め込みモデルのファインチューニングによる検索とRAGの改善

                                                                                                                                                Improving Retrieval and RAG with Embedding Model Finetuning

                                                                                                                                                公開日: 2025年2月20日

                                                                                                                                                製品2 min read

                                                                                                                                                によって ジェイコブ・ポーテス、アンドリュー・ドロズドフ、エリカ・ジ・ユエン、ヴィンセント・チェン、ショーン・クリンスキー、Milo Cress、Colton Peltier、Sam Havens 、 マイケル・カービン による投稿

                                                                                                                                                この投稿を共有する

                                                                                                                                                最新の投稿を通知します

                                                                                                                                                Summary

                                                                                                                                                • ファインチューニングされた埋め込みモデルが検索とRAGの精度を向上させる方法
                                                                                                                                                • ベンチマーク全体での主要なパフォーマンス向上
                                                                                                                                                • Databricksでの埋め込みモデルのファインチューニングの開始方法

                                                                                                                                                RetrievalとRAGのための埋め込みモデルのファインチューニング

                                                                                                                                                要約: ドメイン固有のデータで埋め込みモデルをファインチューニングすると、ベクトル検索とRetrieval-Augmented Generation (RAG) の精度が大幅に向上します。Databricksを使用すると、埋め込みモデルのファインチューニング、デプロイ、評価が簡単に行え、手動ラベリングなしで合成データを利用して検索を最適化できます。

                                                                                                                                                重要性: ベクトル検索またはRAGシステムが最適な結果を返さない場合、埋め込みモデルのファインチューニングはパフォーマンスを向上させるためのシンプルかつ強力な方法です。財務文書、ナレッジベース、社内コードドキュメントなど、どのようなデータでも、ファインチューニングによってより関連性の高い検索結果と、より優れた下流のLLM応答が得られます。

                                                                                                                                                調査結果: 3つのエンタープライズデータセットで2つの埋め込みモデルをファインチューニングしてテストしたところ、検索メトリクス (Recall@10) と下流RAGパフォーマンスに大幅な改善が見られました。これは、ファインチューニングが、既存のデータのみを利用して、手動ラベリングを必要とせずに精度の向上に大きく貢献できることを意味します。

                                                                                                                                                埋め込みのファインチューニングを試してみませんか?開始に役立つリファレンスソリューションを提供しています。Databricksは、ベクトル検索、RAG、リランキング、埋め込みのファインチューニングを容易にします。詳細については、Databricksアカウントエグゼクティブまたはソリューションアーキテクトにお問い合わせください。

                                                                                                                                                ドメイン固有のファインチューニングは検索精度を向上させることができます
                                                                                                                                                図1 ドメイン固有のファインチューニングは検索精度を向上させることができます。3つのデータセットにおける2つの埋め込みモデルのRecall@10。「FT」=ハイパーパラメータチューニング後の最適なファインチューニング済みモデル。OpenAIモデルはtext-embedding-3-largeです。

                                                                                                                                                なぜ埋め込みをファインチューニングするのか?

                                                                                                                                                埋め込みモデルは、最新のベクトル検索およびRAGシステムを支えています。埋め込みモデルはテキストをベクトルに変換し、キーワードだけでなく意味に基づいて関連コンテンツを見つけられるようにします。しかし、市販のモデルは特定のドメインに最適化されていない場合があるため、ファインチューニングが役立ちます。

                                                                                                                                                ドメイン固有のデータで埋め込みモデルをファインチューニングすると、いくつかの点で役立ちます。

                                                                                                                                                • 検索精度の向上: カスタム埋め込みにより、データに合わせた検索結果が改善されます。
                                                                                                                                                • RAGパフォーマンスの強化: より良い検索結果は、ハルシネーションを減らし、より根拠のある生成AI応答を可能にします。
                                                                                                                                                • コストとレイテンシの改善: 小規模なファインチューニング済みモデルが、大規模で高価な代替モデルよりも優れたパフォーマンスを発揮する場合があります。

                                                                                                                                                このブログ記事では、埋め込みモデルのファインチューニングが、タスク固有のエンタープライズユースケースにおける検索およびRAGパフォーマンスを向上させる効果的な方法であることを示します。

                                                                                                                                                結果: ファインチューニングは効果的

                                                                                                                                                2つの埋め込みモデル (gte-large-en-v1.5 および e5-mistral-7b-instruct) を合成データでファインチューニングし、当社のDomain Intelligence Benchmark Suite (DIBS) (FinanceBench、ManufactQA、Databricks DocsQA) の3つのデータセットで評価しました。その後、OpenAIのtext-embedding-3-largeと比較しました。

                                                                                                                                                主なポイント:

                                                                                                                                                • ファインチューニングにより、データセット全体で検索精度が向上し、多くの場合、ベースラインモデルを大幅に上回りました。
                                                                                                                                                • ファインチューニング済み埋め込みは、多くの場合、リランキングと同等またはそれ以上のパフォーマンスを示し、スタンドアロンソリューションとしても強力であることを示しました。
                                                                                                                                                • 検索精度の向上は、FinanceBenchでのRAGパフォーマンスの向上につながり、エンドツーエンドのメリットを示しました。

                                                                                                                                                検索パフォーマンス

                                                                                                                                                3つのデータセットを比較した結果、埋め込みのファインチューニングが2つのデータセットで精度を向上させることがわかりました。図1に示すように、FinanceBenchとManufactQAでは、ファインチューニング済み埋め込みはベースバージョンよりも優れたパフォーマンスを発揮し、場合によってはOpenAIのAPIモデル (薄いグレー) を上回りました。しかし、Databricks DocsQAでは、OpenAI text-embedding-3-largeの精度がすべてのファインチューニング済みモデルを上回りました。これは、モデルが公開されているDatabricksのドキュメントでトレーニングされている可能性があるためと考えられます。これは、ファインチューニングが効果的である一方で、トレーニングデータセットと評価タスクに強く依存することを示しています。

                                                                                                                                                ファインチューニング vs. リランキング

                                                                                                                                                voyageai/rerank-1を使用したAPIベースのリランキングの結果と比較しました (図2)。リランカーは通常、埋め込みモデルによって取得された上位k件の結果を取得し、これらの結果を検索クエリとの関連性に基づいて並べ替え、並べ替えられた上位k件 (この場合はk=30、次にk=10) を返します。これは、リランカーが通常、埋め込みモデルよりも大きく強力なモデルであり、クエリとドキュメント間の相互作用をより表現力豊かにモデル化するため機能します。

                                                                                                                                                ドメイン固有のファインチューニングはリランキングと競合する可能性があります
                                                                                                                                                図2 ドメイン固有のファインチューニングはリランキングと競合する可能性があります。3つのデータセットにおけるRecall@10。「FT」=ハイパーパラメータチューニング後の最適なファインチューニング済みモデル。これらの実験すべてで使用されたリランカーは、ファインチューニングなしのvoyageai/rerank-1です。「openai」リトリーバーはtext-embedding-3-largeです。

                                                                                                                                                調査結果は以下の通りです。

                                                                                                                                                • gte-large-en-v1.5のファインチューニングは、FinanceBenchとManufactQAでリランキングを上回りました。
                                                                                                                                                • OpenAIのtext-embedding-3-largeはリランキングの恩恵を受けましたが、一部のデータセットでは改善はわずかでした。
                                                                                                                                                • Databricks DocsQAでは、リランキングの影響は小さかったですが、ファインチューニングでも改善が見られ、これらの手法のデータセット依存性を示しています。

                                                                                                                                                リランカーは通常、埋め込みモデルと比較して、クエリごとの推論レイテンシとコストが追加されます。ただし、既存のベクトルデータベースで使用でき、場合によっては新しい埋め込みモデルでデータを再埋め込みするよりもコスト効率が高いことがあります。リランカーを使用するかどうかの選択は、ドメインとレイテンシ/コスト要件によって異なります。

                                                                                                                                                ファインチューニングはRAGパフォーマンスを向上させる

                                                                                                                                                FinanceBenchでは、検索精度の向上は、GPT-4oと組み合わせた場合のRAG精度の向上に直接つながりました (付録参照)。しかし、Databricks DocsQAのように検索がすでに強力なドメインでは、ファインチューニングによる大きな改善は見られませんでした。これは、ファインチューニングが検索が明確なボトルネックである場合に最も効果的であることを示しています。

                                                                                                                                                ガイド

                                                                                                                                                モダンアナリティクスへのコンパクトガイド

                                                                                                                                                読む
                                                                                                                                                Your compact guide to modern analytics

                                                                                                                                                埋め込みモデルのファインチューニングと評価方法

                                                                                                                                                ここでは、合成データ生成、ファインチューニング、評価に関する技術的な詳細をいくつか紹介します。

                                                                                                                                                埋め込みモデル

                                                                                                                                                2つのオープンソース埋め込みモデルをファインチューニングしました。

                                                                                                                                                • gte-large-en-v1.5 は、BERT Large (4億3400万パラメータ、1.75 GB) に基づく人気の埋め込みモデルです。 modestなサイズとオープンライセンスのため、このモデルで実験を行うことにしました。この埋め込みモデルは、Databricks Foundation Model APIでも現在サポートされています。
                                                                                                                                                • e5-mistral-7b-instruct は、強力なLLM (この場合はMistral-7b-instruct-v0.1) を基盤とする新しいクラスの埋め込みモデルに属します。e5-mistral-7b-instructは、MTEBなどの標準的な埋め込みベンチマークで優れており、より長くニュアンスのあるプロンプトを処理できますが、gte-large-en-v1.5よりもはるかに大きく (70億パラメータを持つため)、サービングにはわずかに遅く、コストも高くなります。

                                                                                                                                                その後、OpenAIのtext-embedding-3-largeと比較しました。

                                                                                                                                                評価データセット

                                                                                                                                                すべてのモデルを、Domain Intelligence Benchmark Suite (DIBS) の以下のデータセットで評価しました: FinanceBench、ManufactQA、Databricks DocsQA。

                                                                                                                                                データセット説明クエリ数コーパス数
                                                                                                                                                FinanceBenchSEC 10-K文書に関する質問で、人間が作成したものです。360件のSEC 10-K提出書類のスーパーセットから個々のページを検索します。15053,399
                                                                                                                                                ManufactQA電子機器メーカーの公開フォーラムからサンプリングされた質疑応答です。6,7876,787
                                                                                                                                                Databricks DocsQADatabricksの専門家が作成した、公開されているDatabricksのドキュメントに基づいた質問です。1397,561

                                                                                                                                                主な検索メトリックとしてrecall@10を報告します。これは、正しい文書が検索された上位10件に含まれているかどうかを測定します。

                                                                                                                                                埋め込みモデルの品質のゴールドスタンダードは、MTEBベンチマークです。これには、BEIRなどの検索タスクや、その他の多くの非検索タスクが含まれています。gte-large-en-v1.5やe5-mistral-7b-instructのようなモデルはMTEBで良好な結果を示しますが、社内エンタープライズタスクでどのようにパフォーマンスを発揮するかを確認したいと思いました。

                                                                                                                                                トレーニングデータ

                                                                                                                                                上記の各ベンチマークに合わせて調整された合成データで、個別のモデルをトレーニングしました。

                                                                                                                                                トレーニングセット説明ユニークサンプル数
                                                                                                                                                Synthetic FinanceBench2,400件のSEC 10-K文書から生成されたクエリ~6,000
                                                                                                                                                Synthetic Databricks Docs QA公開されているDatabricksのドキュメントから生成されたクエリ。8,727
                                                                                                                                                ManufactQA電子機器製造業のPDFから生成されたクエリ14,220

                                                                                                                                                各ドメインのトレーニングセットを生成するために、既存の文書を使用し、Llama 3 405BなどのLLMを使用して、各文書の内容に基づいたサンプルクエリを生成しました。その後、LLM-as-a-judge (GPT4o) によって合成クエリの品質がフィルタリングされました。フィルタリングされたクエリとその関連文書は、ファインチューニングのための対照ペアとして使用されました。対照トレーニングではインバッチネガティブを使用しましたが、ハードネガティブを追加することでパフォーマンスをさらに向上させることができます(付録参照)。

                                                                                                                                                ハイパーパラメータチューニング

                                                                                                                                                以下についてスイープを実行しました。

                                                                                                                                                • 学習率、バッチサイズ、ソフトマックス温度
                                                                                                                                                • エポック数(1〜3エポックをテスト)
                                                                                                                                                • クエリプロンプトのバリエーション(例:「Query:」対指示ベースのプロンプト)
                                                                                                                                                • プーリング戦略(平均プーリング対ラストトークンプーリング)

                                                                                                                                                すべてのファインチューニングは、オープンソースのmosaicml/composer、mosaicml/llm-foundry、およびmosaicml/streamingライブラリを使用して、Databricksプラットフォーム上で行われました。

                                                                                                                                                Databricksでのベクトル検索とRAGの改善方法

                                                                                                                                                ファインチューニングは、ベクトル検索とRAGのパフォーマンスを向上させるためのアプローチの1つにすぎません。以下に、その他のアプローチをいくつか挙げます。

                                                                                                                                                検索精度の向上:

                                                                                                                                                • より優れた埋め込みモデルを使用する:多くのユーザーは、気づかないうちに古い埋め込みを使用しています。パフォーマンスの高いモデルに単純に置き換えるだけで、すぐに改善が得られます。上位モデルについては、MTEBリーダーボードを確認してください。
                                                                                                                                                • ハイブリッド検索を試す:密な埋め込みとキーワードベースの検索を組み合わせて、精度を向上させます。Databricks Vector Searchは、ワンクリックソリューションでこれを容易にします。
                                                                                                                                                • リランカーを使用する:リランカーは、関連性に基づいて結果を並べ替えることで、結果を絞り込むことができます。Databricksでは、これを組み込み機能として提供しています(現在プライベートプレビュー中)。試すには、アカウントエグゼクティブにお問い合わせください。

                                                                                                                                                RAGの改善:

                                                                                                                                                • プロンプトを最適化する:LLMプロンプティングのわずかな変更で、応答を劇的に改善できます。DSPyは、このプロセスを自動化するのに役立ちます(DatabricksでDSPyを使用してGenAIアプリを構築するを参照)。
                                                                                                                                                • LLMをアップグレードする:検索は強力だが回答が弱い場合は、より優れた生成モデルの使用を検討してください。
                                                                                                                                                • LLMをファインチューニングする:ドメインがユニークで十分なデータがある場合は、Llama 3のようなモデルをファインチューニングすることで、RAGの品質をさらに向上させることができます。詳細については、Databricksモデルトレーニング:特定のタスクと知識のために独自のLLMをDatabricksでファインチューニングするを参照してください。

                                                                                                                                                Databricksでのファインチューニングを開始する

                                                                                                                                                埋め込みのファインチューニングは、AIシステムでの検索とRAGを改善するための簡単な勝利となる可能性があります。Databricksでは、以下のことが可能です。

                                                                                                                                                • スケーラブルなインフラストラクチャ上で埋め込みモデルをファインチューニングおよびサービングする。
                                                                                                                                                • ベクトル検索、リランキング、RAGのための組み込みツールを使用する。
                                                                                                                                                • ユースケースに最適なモデルを見つけるために、さまざまなモデルを迅速にテストする。

                                                                                                                                                試してみませんか?ファインチューニングを容易にするためのリファレンスソリューションを構築しました。アクセスについては、Databricksのアカウントエグゼクティブまたはソリューションアーキテクトにお問い合わせください。

                                                                                                                                                付録

                                                                                                                                                 

                                                                                                                                                サイズ

                                                                                                                                                FinanceBench Recall@10

                                                                                                                                                ManufactQA Recall@10

                                                                                                                                                DocsQA Recall@10

                                                                                                                                                ベースライン

                                                                                                                                                ファインチューニング済み

                                                                                                                                                ベースライン

                                                                                                                                                ファインチューニング済み

                                                                                                                                                ベースライン

                                                                                                                                                ファインチューニング済み

                                                                                                                                                gte-large-en-v1.5

                                                                                                                                                0.4B

                                                                                                                                                0.293

                                                                                                                                                0.552

                                                                                                                                                0.821

                                                                                                                                                0.873

                                                                                                                                                0.849

                                                                                                                                                0.884

                                                                                                                                                e5-mistral-7b-instruct

                                                                                                                                                7B

                                                                                                                                                0.479

                                                                                                                                                0.670

                                                                                                                                                0.836

                                                                                                                                                0.913

                                                                                                                                                0.899

                                                                                                                                                0.899

                                                                                                                                                text-embedding-3-large

                                                                                                                                                不明

                                                                                                                                                0.44

                                                                                                                                                N/A

                                                                                                                                                0.895

                                                                                                                                                N/A

                                                                                                                                                0.95

                                                                                                                                                N/A

                                                                                                                                                表1:gte-large-en-v1.5、e5-mistral-7b-instruct、text-embedding-3-largeの比較。図1と同じデータ。

                                                                                                                                                合成トレーニングデータの生成

                                                                                                                                                すべてのデータセットで、トレーニングセットのクエリはテストセットのクエリと同じではありませんでした。ただし、Databricks DocsQA(FinanceBenchやManufactQAは除く)の場合、合成クエリを生成するために使用されたドキュメントは、評価セットで使用されたドキュメントと同じでした。私たちの研究の焦点は、特定のタスクとドメインでの検索精度を向上させること(ゼロショットの汎用的な埋め込みモデルとは対照的に)であるため、これは特定のプロダクションユースケースにおいて有効なアプローチと見なしています。FinanceBenchとManufactQAでは、合成データを生成するために使用されたドキュメントは、評価に使用されたコーパスと重複しませんでした。

                                                                                                                                                対照学習のためのネガティブパッセージの選択には、さまざまな方法があります。ランダムに選択することも、事前に定義することもできます。最初のケースでは、ネガティブパッセージはトレーニングバッチ内から選択されます。これらはしばしば「インバッチネガティブ」または「ソフトネガティブ」と呼ばれます。2番目のケースでは、ユーザーは意味的に難しいテキスト例を事前に選択します。つまり、クエリに関連している可能性があるが、わずかに間違っているか無関係です。この2番目のケースは、時々「ハードネガティブ」と呼ばれます。この作業では、インバッチネガティブのみを使用しました。文献によると、ハードネガティブを使用すると、さらに良い結果が得られる可能性が高いとのことです。

                                                                                                                                                ファインチューニングの詳細

                                                                                                                                                すべてのファインチューニング実験で、最大シーケンス長は2048に設定されました。その後、すべてのチェックポイントを評価しました。すべてのベンチマーキングで、コーパスドキュメントは2048トークンに切り詰められ(チャンク化されず)、これは特定のデータセットにとって妥当な制約でした。クエリプロンプトとプーリング戦略全体をスキャンした後、各ベンチマークで最も強力なベースラインを選択しました。

                                                                                                                                                RAGパフォーマンスの向上

                                                                                                                                                RAGシステムは、リトリーバーと生成モデルの両方で構成されます。リトリーバーは、特定のクエリに関連するドキュメントのセットを選択し、それを生成モデルに渡します。私たちは、単純なRAGシステムの最初のリトリーバルステージ(Long Context RAG Performance of LLMsおよびThe Long Context RAG Capabilities of OpenAI o1 and Google Geminiで説明されている一般的なアプローチに従って)に使用するために、最高のファインチューニング済みgte-large-en-v1.5モデルを選択しました。具体的には、最大長512トークンのドキュメントをk=10個取得し、GPT4oを生成LLMとして使用しました。最終的な精度は、LLM-as-a-judge(GPT4o)を使用して評価されました。

                                                                                                                                                Improving RAG Performance
                                                                                                                                                図3:ファインチューニングされた検索はRAGパフォーマンスを向上させることができます。ファインチューニングされたgteは、FinanceBenchではRAGパフォーマンスを向上させますが、Databricks DocsQAでは向上させません。

                                                                                                                                                FinanceBenchでは、図3に示すように、ファインチューニングされた埋め込みモデルを使用すると、下流のRAG精度が向上します。さらに、text-embedding-3-largeとも競争力があります。これは、gteのファインチューニングがベースラインgte(図1)と比較してRecall@10の大幅な改善につながったため、予想されることです。この例は、特定のドメインとデータセットにおける埋め込みモデルのファインチューニングの有効性を強調しています。

                                                                                                                                                Databricks DocsQAデータセットでは、ベースラインgteを上回るファインチューニング済みgteモデルを使用しても、改善は見られませんでした。これは、図1および図2におけるベースラインモデルとファインチューニング済みモデルの差が小さいことを考えると、ある程度予想されることです。興味深いことに、text-embedding-3-largeは、gteモデルのいずれよりも(わずかに)高いRecall@10を持っていますが、それにより下流のRAG精度が高くなるわけではありません。図1に示すように、すべての埋め込みモデルはDatabricks DocsQAデータセットで比較的高いRecall@10を持っていました。これは、検索がRAGのボトルネックではない可能性が高く、このデータセットで埋め込みモデルをファインチューニングすることが必ずしも最も有益なアプローチではないことを示唆しています。

                                                                                                                                                このブログ記事に関するフィードバックをいただいたQuinn Leng氏とMatei Zaharia氏に感謝いたします。

                                                                                                                                                (このブログ記事はAI翻訳ツールを使用して翻訳されています) 原文記事

                                                                                                                                                最新の投稿を通知します

                                                                                                                                                関連記事

                                                                                                                                                この投稿を共有する

                                                                                                                                                Databricksの投稿を見逃さないようにしましょう

                                                                                                                                                興味のあるカテゴリを購読して、最新の投稿を受信トレイに届けましょう

                                                                                                                                                Sign up

                                                                                                                                                databricks logo
                                                                                                                                                Databricks を選ぶ理由
                                                                                                                                                Databricks を選ぶ理由
                                                                                                                                                • エグゼクティブ向け
                                                                                                                                                • スタートアップ向け
                                                                                                                                                • レイクハウスアーキテクチャ
                                                                                                                                                • Databricks AIリサーチ
                                                                                                                                                導入事例
                                                                                                                                                • 注目の導入事例
                                                                                                                                                パートナー
                                                                                                                                                • パートナー概要
                                                                                                                                                • パートナープログラム
                                                                                                                                                • パートナーを探す
                                                                                                                                                • パートナースポットライト
                                                                                                                                                • クラウドプロバイダー
                                                                                                                                                • パートナーソリューション
                                                                                                                                                Databricks を選ぶ理由
                                                                                                                                                • エグゼクティブ向け
                                                                                                                                                • スタートアップ向け
                                                                                                                                                • レイクハウスアーキテクチャ
                                                                                                                                                • Databricks AIリサーチ
                                                                                                                                                導入事例
                                                                                                                                                • 注目の導入事例
                                                                                                                                                パートナー
                                                                                                                                                • パートナー概要
                                                                                                                                                • パートナープログラム
                                                                                                                                                • パートナーを探す
                                                                                                                                                • パートナースポットライト
                                                                                                                                                • クラウドプロバイダー
                                                                                                                                                • パートナーソリューション
                                                                                                                                                製品
                                                                                                                                                レイクハウスプラットフォーム
                                                                                                                                                • プラットフォーム
                                                                                                                                                • 共有
                                                                                                                                                • データガバナンス
                                                                                                                                                • 人工知能(AI)
                                                                                                                                                • BI
                                                                                                                                                • データベース
                                                                                                                                                • データ管理
                                                                                                                                                • データウェアハウス
                                                                                                                                                • データエンジニアリング
                                                                                                                                                • データサイエンス
                                                                                                                                                • アプリケーション開発
                                                                                                                                                • セキュリティ
                                                                                                                                                ご利用料金
                                                                                                                                                • 料金設定の概要
                                                                                                                                                • 料金計算ツール
                                                                                                                                                オープンソース
                                                                                                                                                統合とデータ
                                                                                                                                                • マーケットプレイス
                                                                                                                                                • IDE 統合
                                                                                                                                                • パートナーコネクト
                                                                                                                                                レイクハウスプラットフォーム
                                                                                                                                                • プラットフォーム
                                                                                                                                                • 共有
                                                                                                                                                • データガバナンス
                                                                                                                                                • 人工知能(AI)
                                                                                                                                                • BI
                                                                                                                                                • データベース
                                                                                                                                                • データ管理
                                                                                                                                                • データウェアハウス
                                                                                                                                                • データエンジニアリング
                                                                                                                                                • データサイエンス
                                                                                                                                                • アプリケーション開発
                                                                                                                                                • セキュリティ
                                                                                                                                                ご利用料金
                                                                                                                                                • 料金設定の概要
                                                                                                                                                • 料金計算ツール
                                                                                                                                                統合とデータ
                                                                                                                                                • マーケットプレイス
                                                                                                                                                • IDE 統合
                                                                                                                                                • パートナーコネクト
                                                                                                                                                ソリューション
                                                                                                                                                業種別
                                                                                                                                                • 通信
                                                                                                                                                • 金融サービス
                                                                                                                                                • 医療・ライフサイエンス
                                                                                                                                                • 製造
                                                                                                                                                • メディア・エンタメ
                                                                                                                                                • 官公庁・公共機関
                                                                                                                                                • リテール・消費財
                                                                                                                                                • 全て表示
                                                                                                                                                クロスインダストリーソリューション
                                                                                                                                                • サイバーセキュリティ
                                                                                                                                                • マーケティング
                                                                                                                                                データの移行
                                                                                                                                                プロフェッショナルサービス
                                                                                                                                                ソリューションアクセラレータ
                                                                                                                                                業種別
                                                                                                                                                • 通信
                                                                                                                                                • 金融サービス
                                                                                                                                                • 医療・ライフサイエンス
                                                                                                                                                • 製造
                                                                                                                                                • メディア・エンタメ
                                                                                                                                                • 官公庁・公共機関
                                                                                                                                                • リテール・消費財
                                                                                                                                                • 全て表示
                                                                                                                                                クロスインダストリーソリューション
                                                                                                                                                • サイバーセキュリティ
                                                                                                                                                • マーケティング
                                                                                                                                                リソース
                                                                                                                                                ドキュメント
                                                                                                                                                カスタマーサポート
                                                                                                                                                コミュニティ
                                                                                                                                                トレーニング・認定試験
                                                                                                                                                • トレーニング
                                                                                                                                                • 認定
                                                                                                                                                • 無料版
                                                                                                                                                • 大学との連携
                                                                                                                                                • Databricks アカデミー
                                                                                                                                                イベント
                                                                                                                                                • DATA+AI サミット
                                                                                                                                                • Data+AI ワールドツアー
                                                                                                                                                • AI Days
                                                                                                                                                • イベントカレンダー
                                                                                                                                                ブログ・ポッドキャスト
                                                                                                                                                • Databricks ブログ
                                                                                                                                                • Databricks AI R&Dブログ
                                                                                                                                                • Data Brew ポッドキャスト
                                                                                                                                                • Data+AI のチャンピオンシリーズ
                                                                                                                                                トレーニング・認定試験
                                                                                                                                                • トレーニング
                                                                                                                                                • 認定
                                                                                                                                                • 無料版
                                                                                                                                                • 大学との連携
                                                                                                                                                • Databricks アカデミー
                                                                                                                                                イベント
                                                                                                                                                • DATA+AI サミット
                                                                                                                                                • Data+AI ワールドツアー
                                                                                                                                                • AI Days
                                                                                                                                                • イベントカレンダー
                                                                                                                                                ブログ・ポッドキャスト
                                                                                                                                                • Databricks ブログ
                                                                                                                                                • Databricks AI R&Dブログ
                                                                                                                                                • Data Brew ポッドキャスト
                                                                                                                                                • Data+AI のチャンピオンシリーズ
                                                                                                                                                企業情報
                                                                                                                                                企業概要
                                                                                                                                                • Databricks について
                                                                                                                                                • 経営陣
                                                                                                                                                • Databricks Ventures
                                                                                                                                                • ご相談・お問い合わせ
                                                                                                                                                採用情報
                                                                                                                                                • 採用情報概要
                                                                                                                                                • 求人情報
                                                                                                                                                プレス・ニュース記事
                                                                                                                                                • ニュースルーム
                                                                                                                                                • 受賞歴と業界評価
                                                                                                                                                セキュリティと信頼
                                                                                                                                                企業概要
                                                                                                                                                • Databricks について
                                                                                                                                                • 経営陣
                                                                                                                                                • Databricks Ventures
                                                                                                                                                • ご相談・お問い合わせ
                                                                                                                                                採用情報
                                                                                                                                                • 採用情報概要
                                                                                                                                                • 求人情報
                                                                                                                                                プレス・ニュース記事
                                                                                                                                                • ニュースルーム
                                                                                                                                                • 受賞歴と業界評価
                                                                                                                                                databricks logo

                                                                                                                                                Databricks Inc.
                                                                                                                                                160 Spear Street, 15th Floor
                                                                                                                                                San Francisco, CA 94105
                                                                                                                                                1-866-330-0121

                                                                                                                                                採用情報

                                                                                                                                                © Databricks 2026. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.

                                                                                                                                                • プライバシー通知
                                                                                                                                                • |利用規約
                                                                                                                                                • |現代奴隷法に関する声明
                                                                                                                                                • |カリフォルニア州のプライバシー権利
                                                                                                                                                • |プライバシー設定