によって ハンリン・タン, アキル・グプタ, Patrick Wendell(パトリック・ウェンデル) 、 ナヴィン・ラオ による投稿
昨年、Databricks は「データインテリジェンス」── 企業データをもとに推論できるAI ── を発表し、エージェントシステムの構築・運用を可能にする Databricks スタック をリリースしました。それ以来、数千社のお客様がAIを実運用に取り入れてきました。
そして今年の Data + AI Summit では、いくつかの注目製品を新たに発表します:
Agent Bricks は、あなたのデータに最適化された高品質なAIエージェントを、簡単に構築できる新しい仕組みです。
エージェントにやらせたいタスクの概要と、接続したい企業データを指定するだけで、あとは Agent Bricks が自動で最適化してくれます。
Agent Bricks は以下のような業界共通のユースケースに最適化されています:
さらに、Databricks の研究チームによる最新のエージェント研究成果を活用し、評価プロセスやエージェントの品質向上も自動で行われます。
詳しくは Agent Bricks の技術解説ブログ をご覧ください。
MLflow 3 は、生成AI時代に最適化された新しい設計のもとで生まれ変わりました。モニタリング、評価、ライフサイクル管理といった機能が大幅に強化されています。
MLflow 3 を使えば、Databricks 外で稼働しているエージェントも含めて、あらゆる場所にデプロイされたエージェントの監視と可視化が可能になります。
たとえば、AWS、GCP、さらにはオンプレミス環境にデプロイされたエージェントも、MLflow 3 に接続して統合的にオブザーバビリティを確保することができます。
MLflow 3 にはさらに、プロンプトレジストリ機能も新たに追加されました。
これにより、エージェントシステムで使用する LLMプロンプトを登録・バージョン管理・テスト・デプロイすることが可能になります。
AI Functions を使えば、生成AIの力をSQLから直接呼び出すことができます。
今年はその性能が大幅に強化され、処理速度が最大3倍、コストは最大4分の1と、他社と比べて圧倒的な効率を実現。
さらに、マルチモーダル対応(例:画像+テキスト)にも拡張され、大規模データの変換や分析もこれまでにないスピードで可能になります。
パフォーマンスの向上に加え、AI Functions はマルチモーダル対応へと進化しました。これにより、テキストだけでなく、画像やその他のデータ形式もシームレスに扱えるようになります。
たとえば、ai_parse_document のような新機能を使えば、複雑なドキュメントから構造化された情報を簡単に抽出可能に。これまで処理が難しかった企業内コンテンツからも、手軽にインサイトを得られるようになります。
Databricks AI Search は、多くの検索システムや特に RAG(Retrieval-Augmented Generation)エージェントの中核を担っており、Databricks 製品群の中でも急成長中のプロダクトのひとつです。
今回、この基盤をゼロから再設計し、コンピュートとストレージの分離アーキテクチャを採用。新しい Storage-Optimized AI Search は、数十億ベクトル規模にスケール可能で、コストを 最大7分の1 に削減できるようになりました。
これにより、コスト面で難しかった高度な RAG アプリケーションやセマンティック検索システムの構築が、現実的かつ大規模に可能となります。カスタマーサポートのチャットボットから、企業内の高度な文書検索まで、あらゆるユースケースでスケーラブルな展開が実現できます。
技術的な詳細やベンチマークについては、こちらのブログ記事をご覧ください。
Databricks における サーバレスコンピュートが大きく進化し、ついに GPU対応が加わりました!
これにより、モデルの学習、推論、大規模データ変換といった AIワークロードを GPU で高速化しながら、GPU の管理やプロビジョニングといった煩雑な作業は不要に。完全にマネージドなサービスとして、誰でも手軽に GPU のパワーを活用できるようになります。
Databricks プラットフォームに完全統合されており、A10G(ベータ)や今後登場予定の H100 にオンデマンドでアクセス可能。長期契約やリザベーションに縛られることもありません。
ノートブックをサーバレス GPU 上で実行したり、ジョブとして送信することも可能で、Unity Catalog によるガバナンスも適用されます。
現在のエンタープライズAIアプリケーションには、高いスループットと低レイテンシが求められています。
Databricks の 新しいモデルサービング基盤は、1秒あたり25万クエリ(QPS)超の処理に対応。リアルタイムのオンライン機械学習ワークロードも、Databricks にお任せいただければ、インフラや信頼性の課題を気にせず、AIモデルの開発に集中できます。
LLM(大規模言語モデル)のサービングに向けて、Databricks独自の推論エンジンをすべてのリージョンで提供開始しました。
このエンジンは、Meta LlamaなどのオープンソースLLMの推論を高速化する独自のカーネルや最適化技術を搭載しており、
一般的なワークロードでは、vLLM-v1 などの高度に最適化されたOSSエンジンと比べて、最大1.5倍の高速化を実現しています。
これらの革新とサービングインフラ全体の組み合わせにより、Databricks上でのLLM運用は、DIYによる独自サービングよりも高速・簡単・低コストに実現可能です。
チャットボットやレコメンデーションエンジンといったユースケースにも対応できるスケーラビリティで、最も要求の厳しいエンタープライズAIワークロードにも十分対応します。
Anthropicが提唱する Model Context Protocol(MCP) は、大規模言語モデル(LLM)にツールやナレッジを提供するための人気の高いプロトコルです。
今回この MCPがDatabricksプラットフォームにネイティブ統合されました。
Databricks Apps を使えば、MCPサーバーをシームレスにホスト・運用でき、追加のインフラ管理は不要。
また、Playground環境内でMCP対応モデルと直接対話・テストが可能なため、さまざまなモデル構成や機能を手軽に試すことができます。
これにより、MCP準拠のサービス開発や運用がこれまで以上にシンプルかつスピーディに行えるようになります。
また、Databricks ホスト型の MCP サーバー が新たに登場し、UC Functions、Genie、AI Search などと連携させて、エージェントが Databricks の機能を直接活用できるようになりました。詳細はドキュメンテーションをご参照ください。
Agent Bricks AI Gateway が正式リリースされました。
これは、あらゆる AI サービスへの統一されたエントリーポイントであり、中央集約型のガバナンス、利用ログ管理、制御機能を通じて、組織全体のAIアプリケーションを一元管理できます。
今回の正式リリースにあたり、以下のような多くの新機能も追加されました:
AI Gateway を使えば、すべてのAIワークロードに対して、安全かつ効率的な統制と運用が可能になります。
今回の発表は、エンタープライズAIをより身近に、高性能に、そしてコスト効率よく提供するという私たちの継続的な取り組みを体現するものです。
すべての機能は Databricks のデータインテリジェンスプラットフォームの上に構築されており、企業データの力を最大限に引き出しながら、求められるガバナンスとセキュリティ要件をしっかりと満たすことができます。
新機能を今すぐ試してみませんか?
無料プランから始めることも、Databricks担当者にお問い合わせいただき、これらの革新がどのようにAIの取り組みを加速できるかをご相談いただくことも可能です。
ブログを購読して、最新の投稿を受信トレイにお届けします。