2025年6月21日

Data + AI Summit 2025で発表された Databricks の新機能

によってハンリン・タン, アキル・グプタ, Patrick Wendell（パトリック・ウェンデル）、ナヴィン・ラオによる投稿

Agent Bricks：タスクを記述することで、ドメイン固有の高品質なエージェントを構築します—エージェントブリックは評価を自動生成し、品質とコストの最適化を行います。
MLflow 3.0: GenAI向けに再設計され、エージェントの観察可能性、プロンプトバージョニング、Databricksの外部で実行されているエージェントでもクロスプラットフォームの監視が可能です。
サーバーレスGPUコンピューティング：インフラストラクチャの管理なしにトレーニングと推論を実行することができます。完全に管理され、自動スケーリングするGPUが現在ベータ版で利用可能です。

昨年、Databricks は「データインテリジェンス」── 企業データをもとに推論できるAI ── を発表し、エージェントシステムの構築・運用を可能にする Databricks スタック をリリースしました。それ以来、数千社のお客様がAIを実運用に取り入れてきました。

そして今年の Data + AI Summit では、いくつかの注目製品を新たに発表します：

Agent Bricks（ベータ版）を発表！

Agent Bricks は、あなたのデータに最適化された高品質なAIエージェントを、簡単に構築できる新しい仕組みです。
エージェントにやらせたいタスクの概要と、接続したい企業データを指定するだけで、あとは Agent Bricks が自動で最適化してくれます。

Agent Bricks は以下のような業界共通のユースケースに最適化されています：

構造化情報の抽出
信頼性の高い知識アシスタンス
カスタムテキストの変換
複数エージェントによるシステム構築

さらに、Databricks の研究チームによる最新のエージェント研究成果を活用し、評価プロセスやエージェントの品質向上も自動で行われます。

詳しくは Agent Bricks の技術解説ブログをご覧ください。

MLflow 3.0 発表

MLflow 3 は、生成AI時代に最適化された新しい設計のもとで生まれ変わりました。モニタリング、評価、ライフサイクル管理といった機能が大幅に強化されています。

MLflow 3 を使えば、Databricks外で稼働しているエージェントも含めて、あらゆる場所にデプロイされたエージェントの監視と可視化が可能になります。
たとえば、AWS、GCP、さらにはオンプレミス環境にデプロイされたエージェントも、MLflow 3 に接続して統合的にオブザーバビリティを確保することができます。

MLflow 3.0 — Figure 2: Real-time observability is now available even for agents deployed outside of Databricks

MLflow 3 にはさらに、プロンプトレジストリ機能も新たに追加されました。
これにより、エージェントシステムで使用する LLMプロンプトを登録・バージョン管理・テスト・デプロイすることが可能になります。

AI Functions in SQL：さらに高速・マルチモーダル対応へ

AI Functions を使えば、生成AIの力をSQLから直接呼び出すことができます。

今年はその性能が大幅に強化され、処理速度が最大3倍、コストは最大4分の1と、他社と比べて圧倒的な効率を実現。
さらに、マルチモーダル対応（例：画像＋テキスト）にも拡張され、大規模データの変換や分析もこれまでにないスピードで可能になります。

SQLのAI関数 — Figure 3: Document intelligence arrives at Databricks with the introduction of ai_parse in SQL.

パフォーマンスの向上に加え、AI Functions はマルチモーダル対応へと進化しました。これにより、テキストだけでなく、画像やその他のデータ形式もシームレスに扱えるようになります。

たとえば、ai_parse_document のような新機能を使えば、複雑なドキュメントから構造化された情報を簡単に抽出可能に。これまで処理が難しかった企業内コンテンツからも、手軽にインサイトを得られるようになります。

AI関数は今、3倍速くなりました — Figure 4: AI Functions in SQL is now more than 3x faster than the competition on scaled workloads

ストレージ最適化ベクター検索（パブリックプレビュー）

Databricks AI Search は、多くの検索システムや特に RAG（Retrieval-Augmented Generation）エージェントの中核を担っており、Databricks 製品群の中でも急成長中のプロダクトのひとつです。

今回、この基盤をゼロから再設計し、コンピュートとストレージの分離アーキテクチャを採用。新しい Storage-Optimized AI Search は、数十億ベクトル規模にスケール可能で、コストを 最大7分の1 に削減できるようになりました。

これにより、コスト面で難しかった高度な RAG アプリケーションやセマンティック検索システムの構築が、現実的かつ大規模に可能となります。カスタマーサポートのチャットボットから、企業内の高度な文書検索まで、あらゆるユースケースでスケーラブルな展開が実現できます。

技術的な詳細やベンチマークについては、こちらのブログ記事をご覧ください。

サーバレス GPU コンピュート（ベータ版）

Databricks における サーバレスコンピュートが大きく進化し、ついに GPU対応が加わりました！

これにより、モデルの学習、推論、大規模データ変換といった AIワークロードを GPU で高速化しながら、GPU の管理やプロビジョニングといった煩雑な作業は不要に。完全にマネージドなサービスとして、誰でも手軽に GPU のパワーを活用できるようになります。

Databricks プラットフォームに完全統合されており、A10G（ベータ）や今後登場予定の H100 にオンデマンドでアクセス可能。長期契約やリザベーションに縛られることもありません。

ノートブックをサーバレス GPU 上で実行したり、ジョブとして送信することも可能で、Unity Catalog によるガバナンスも適用されます。

サーバーレスGPUコンピューティング — Figure 5: Serverless notebooks and jobs can now run on GPUs, with A10G in Beta and H100s coming soon

大規模モデルサービングの進化

現在のエンタープライズAIアプリケーションには、高いスループットと低レイテンシが求められています。
Databricks の 新しいモデルサービング基盤は、1秒あたり25万クエリ（QPS）超の処理に対応。リアルタイムのオンライン機械学習ワークロードも、Databricks にお任せいただければ、インフラや信頼性の課題を気にせず、AIモデルの開発に集中できます。

LLMサービング向け推論エンジンを新たに開発

LLM（大規模言語モデル）のサービングに向けて、Databricks独自の推論エンジンをすべてのリージョンで提供開始しました。

このエンジンは、Meta LlamaなどのオープンソースLLMの推論を高速化する独自のカーネルや最適化技術を搭載しており、
一般的なワークロードでは、vLLM-v1 などの高度に最適化されたOSSエンジンと比べて、最大1.5倍の高速化を実現しています。

これらの革新とサービングインフラ全体の組み合わせにより、Databricks上でのLLM運用は、DIYによる独自サービングよりも高速・簡単・低コストに実現可能です。

チャットボットやレコメンデーションエンジンといったユースケースにも対応できるスケーラビリティで、最も要求の厳しいエンタープライズAIワークロードにも十分対応します。

DatabricksのMCPサポート

Anthropicが提唱する Model Context Protocol（MCP） は、大規模言語モデル（LLM）にツールやナレッジを提供するための人気の高いプロトコルです。
今回この MCPがDatabricksプラットフォームにネイティブ統合されました。

Databricks Apps を使えば、MCPサーバーをシームレスにホスト・運用でき、追加のインフラ管理は不要。
また、Playground環境内でMCP対応モデルと直接対話・テストが可能なため、さまざまなモデル構成や機能を手軽に試すことができます。

これにより、MCP準拠のサービス開発や運用がこれまで以上にシンプルかつスピーディに行えるようになります。

MCPサポート — Figure 6: Quickly prototype MCP servers with built-in Playground support

また、Databricks ホスト型の MCP サーバー が新たに登場し、UC Functions、Genie、AI Search などと連携させて、エージェントが Databricks の機能を直接活用できるようになりました。詳細はドキュメンテーションをご参照ください。

AI Gateway が一般提供開始！

Agent Bricks AI Gateway が正式リリースされました。
これは、あらゆる AI サービスへの統一されたエントリーポイントであり、中央集約型のガバナンス、利用ログ管理、制御機能を通じて、組織全体のAIアプリケーションを一元管理できます。

今回の正式リリースにあたり、以下のような多くの新機能も追加されました：

複数プロバイダー間での自動フェイルオーバー
個人情報（PII）検知や安全性を確保するためのガードレール
利用制限（レートリミット）ポリシーの適用
ワークロードの使用状況の可視化
Databricks 上でも外部サービスでも適用可能な安全制御

AI Gateway を使えば、すべてのAIワークロードに対して、安全かつ効率的な統制と運用が可能になります。

ここからはじめましょう

今回の発表は、エンタープライズAIをより身近に、高性能に、そしてコスト効率よく提供するという私たちの継続的な取り組みを体現するものです。
すべての機能は Databricks のデータインテリジェンスプラットフォームの上に構築されており、企業データの力を最大限に引き出しながら、求められるガバナンスとセキュリティ要件をしっかりと満たすことができます。

新機能を今すぐ試してみませんか？
無料プランから始めることも、Databricks担当者にお問い合わせいただき、これらの革新がどのようにAIの取り組みを加速できるかをご相談いただくことも可能です。