2025年12月11日

OpenAI GPT-5.2 and Responses API on Databricks: 信頼性の高いデータ対応エージェントシステムの構築

• OpenAI GPT-5.2とResponses APIがDatabricksで利用可能になり、チームは最小限のインテグレーション作業で、推論、マルチモーダル、ツール使用のエージェントを統一された方法で構築できるようになりました
• Agent Bricksを使用すると、開発者はGPT-5.2をガバナンスの効いたデータに安全に接続し、MCPツールを呼び出すとともに、すべての応答の正確性と信頼性を評価できます
• これらの機能が一体となることで、安全に動作し、一貫した結果を提供し、実際のエンタープライズワークフロー全体に拡張できる、信頼性の高いデータ対応エージェントが実現します

OpenAI GPT-5.2 が Databricks で利用可能になりました。これにより、チームは Databricks Data Intelligence Platform 内で OpenAI の最新モデルに初日からアクセスできます。このリリースでは、Responses API のネイティブサポートも追加されています。これにより、OpenAI モデルの全機能が解放され、開発者はエージェントシステムをより迅速に、かつはるかに少ないカスタム統合作業で構築できるようになります。

Databricks Agent Bricksと組み合わせることで、開発者はモデルをガバナンスの効いたデータに安全に接続し、カスタムメトリクスですべての応答を評価し、エージェントを大規模かつ確実にデプロイおよび監視できます。これらの機能を組み合わせることで、企業のデータとプロセスに基づいて正確に推論し、安全に行動できる AI エージェントを構築するための基盤となります。

GPT-5.2の特長とメリット

GPT-5.2 は、エンタープライズおよびエージェントワークフローで最も重要な領域において GPT-5.1 を改善しています。具体的には、中〜高難度タスクにおける精度およびトークン効率、指示追従性と出力フォーマットの一貫性、段階的かつ意図的な推論、ならびに冗長性を抑えたタスク指向の応答が向上しています。また、グラウンディングに対してより保守的なバイアスを持つよう調整されており、入力があいまいまたは情報が不足していた場合でも、明確な根拠に基づく推論を優先し、応答のドリフトを低減します。

これらの改善は、精度と構造化された実行に依存するユースケースに直接的なメリットをもたらします。

構造化抽出とドキュメント/PDF分析：グラウンディングの強化とクリーンなフォーマットにより、ドリフトやフィールドの欠損を低減します。
コーディングとエージェントワークフロー：指示への追従性とツールのグラウンディングが向上し、より信頼性の高いマルチステップ実行が可能になります。
金融およびマルチモーダルタスクでは、より明確な推論とあいまいさの低減によって一貫性と正確性が向上します。

これらの改善が実際のエンタープライズワークロードにどのように反映されるかを理解するために、私たちは GPT-5.2 をOfficeQAで評価しました。OfficeQA は、顧客が日常的に実行するドキュメント量の多い、複数ステップの分析タスクの種類をテストするために設計された Databricks のベンチマークです。米国財務省公報の 89,000 ページから構築された OfficeQA は、複数のドキュメントにわたる情報検索、複雑な表の解釈、実際のエンタープライズデータに基づいた正確な計算を実行するモデルの能力を測定します。

完全なベンチマークと最も困難なサブセットの両方で、GPT-5.2 はこれまでで最強の OpenAI パフォーマンスを達成し、エージェント設定とオラクルページベースラインの両方で GPT-5.1 を上回っています。これらの改善は、文書中心ワークロードに対する GPT-5.2 のグラウンディングの強化、推論の安定性向上、および信頼性の改善を示しています。

OfficeQAでのエージェントのパフォーマンス — Preview of performance of AI agents on OfficeQA-All (246 examples) and OfficeQA-Hard (113 examples), including a Claude Opus 4.5 Agent, a GPT-5.1 Agent using the OpenAI File Search & Retrieval API, and a GPT-5.2 Agent with reasoning_effort = high.

「OpenAI GPT-5.2 は、エンタープライズにおけるエージェントタスクで優れた性能を発揮するように設計されており、中程度から複雑なワークロードで高い精度と優れたトークン効率を提供します。GPT-5.2を提供できることを嬉しく思います。Databricks Agent Bricks で初日から利用可能であり、顧客がエンタープライズのユースケース全体で正確かつ安全に推論する AI エージェントを構築・デプロイするための強力な基盤を提供します。」—Nikunj Handa、API製品リード、OpenAI

DatabricksにResponses APIが新登場

Responses API が Databricks で提供開始され、開発者は、ツールの呼び出し、ファイル処理、ドキュメントを横断した情報取得、および構造化された出力を行うエージェントを単一のインターフェースで構築できるようになりました。これにより、モデルは単一のリクエスト内でMCP ツールを呼び出し、コンピュータ操作アクションの実行、画像生成を行うことが可能となり、手動のオーケストレーションレイヤーが不要になります。応答は型付けされ順序付けられたアイテムとして返されるため、自由形式のメッセージを扱うよりも、統合、検証、デバッグの信頼性がはるかに高くなります。API はテキスト、画像、ツール呼び出しを 1 つの一貫したフローで処理するため、マルチモーダルおよびツール駆動のワークロードの実装が大幅に容易になります。そしてまもなく、Responses API は Databricks 上のすべての基盤モデルにわたる統一インターフェースとして利用可能になり、マルチモーダルおよびツール駆動のワークロードの構築とスケーリングがさらに容易になります。

Responses API と Agent Bricks を使用して信頼できる AI エージェントを構築

GPT-5.2 と Responses API が Databricks で利用可能になり、Agent Bricks と統合されたことで、チームはガバナンスの効いたデータに基づいたのエージェントを構築し、完全なトレーサビリティで実際のアクションを実行できるようになりました。GPT-5.2とResponses APIは、Databricks と OpenAI の戦略的パートナーシップを基盤としており、すでに多くの企業において AI ワークロードの開発とデプロイメントを加速する役割を果たし始めています。

「DatabricksとOpenAIのパートナーシップは、私たちにとって驚異的なものでした。OpenAI SDK と APIs、およびすべての Databricks コンポーネントを使用しています。Databricksでは数日で、場合によってはワークショップ中にアプリを開発・デプロイし、MVPやPOCを構築できます。これにより、チームは今日あるツールを使って、知見を活用し、アクションを起こし、アプリケーションとソリューションを再考する方法を確認できます。」—Richard Masters、Virgin Atlantic、データ&AI担当バイスプレジデント

MCPツールでデータインテリジェンスを追加

エージェントは内部のデータやサービスにアクセスする必要がありますが、これを管理および監査できる方法で実行するのは困難です。Responses APIを使用すると、GPT-5.2は推論プロセスの一環としてMCPツールを直接呼び出せます。これによりエージェントは、プラットフォームを離れることなくDeltaテーブルへのクエリー、特徴量の取得、内部APIのトリガーが可能になります。Agent BricksはMCP Catalogを介してエージェントが使用できるツールを定義し、MLflowがトレースと評価を記録するため、開発者は各ツールがどのように呼び出されたかを確認できます。これにより、自社固有のデータを活用するエージェントであっても、ガバナンスと可観測性を備えた統制された実行経路のもとで、根拠に基づく意思決定を行わせることが可能になります。

統合APIでマルチモーダルAIエージェントを構築

マルチモーダルワークフローは多くの場合、複数のEndpoint、カスタムルーティング、そして壊れやすい前処理を必要とします。Responses API は、テキスト、画像、PDF などのファイルを単一の推論ステップでネイティブ入力として扱うことで、この複雑さを解消します。GPT-5.2 は、インターフェースを切り替えることなく、ドキュメントの要約、グラフからの情報抽出、スキャンされたページの分析、新しいビジュアルの生成を行うことができます。すべてが Databricks 上で実行されるため、データは統制された状態に保たれ、リネージも維持されます。

Agent Bricks を使用した信頼性の高い AI エージェントの評価とデプロイ

AI エージェントがデータとツールに接続されたら、次のステップは、実際のワークロード全体で信頼性の高い動作を保証することです。Agent Bricksは、MLflowで各ランの詳細なトレースをキャプチャし、評価によってリグレッションを検出し、ロジックを改良しながらバージョンを追跡します。これにより、変更のテスト、出力の比較、パフォーマンスの高いエージェントバージョンの本番運用へのプロモートを行うための、再現性のあるエンタープライズグレードのワークフローが提供されます。

次のステップ

まず、Databricks AI Playground で GPT-5.2 を使用して、プロンプト、ツール呼び出し、マルチモーダル入力を短時間で検証します。慣れてきたら、 Agent Bricks を使用して、レイクハウスに接続された MCP ツールを登録し、小規模なデータ認識エージェントを構築し、トレースおよび評価機能により期待する信頼性を満たすまで反復的に改善します。エージェントが対象データに対して一貫した動作を示すようになった段階で、本番環境へ昇格（プロダクションデプロイ）します。