Databricks上で、実行時間の長いデータおよびML開発ワークフローを管理、ガバナンス、オーケストレーションします。
によって ジュリア・ブルイエット, ガル・オシュリ 、 ウェストン・ハッチンス による投稿
Genie Codeは、データおよびMLチームがDatabricks上でシステムをより迅速に構築・改善できるよう支援します。過去1年間で、DatabricksのGenie製品は10倍以上に成長し、Databricksのお客様の90%に利用されています。各チームは、モデルやパイプラインの構築、障害のデバッグ、ダッシュボードの作成、ノートブックでのデータ分析、本番システムの改善にGenieを活用しています。
Data + AI Summit 2026において、より複雑でエージェント指向のデータおよびMLワークフローに対応するため、Genie Codeを拡張します。新しいフルページのコマンドセンター、本番環境のデータおよびMLエンジニアリング向けのアップグレード、そしてスケジュールされたタスクを導入します。
これらのアップデートは、Databricks全体におけるAIネイティブなデータおよびMLワークフローへの大きな移行の一環です。Genie CodeはデータチームによるデータおよびMLシステムの構築、デバッグ、改善を支援します。また、エージェント指向の自動化を運用にまで拡張するために、Genie ZeroOpsを導入しました。これらの製品を組み合わせることで、システムの構築から運用、そして継続的な改善に至るライフサイクル全体において、チームはより迅速に行動できるようになります。
主な新機能は以下の通りです。
データやMLの開発が1つのプロンプトだけで完結することはほとんどありません。ユーザーは、既存のロジックを調査し、複数のアセットを更新し、コードを実行し、出力をレビューし、その結果に基づいて次のステップを調整する必要があります。そのような作業は、ノートブック、SQL、Lakeflowパイプライン、ダッシュボード、ジョブ、モデル、サービングエンドポイント、Unity Catalogアセットなど、多岐にわたる可能性があります。
このような複雑なデータおよびML作業向けに、専用のコマンドセンターを提供できるよう、Genie Codeのエクスペリエンスを再設計しました。小さなサイドパネルで長時間のタスクを管理する代わりに、フルページのエクスペリエンスを使用して、タスクの指示、進捗の追跡、出力の確認、そして継続的な反復作業を行うことができます。

複数のGenie Codeスレッドを管理し、スレッドが実行中なのか入力待ちなのかを確認し、新しい結果の準備ができたらそれぞれのスレッドに戻ることができます。スレッドの名前変更、過去の会話の検索が可能で、プロジェクトの進行に合わせて状況を常に把握できます。
Genie Codeは私の働き方を完全に変えました。毎日、異なるノートブックやアセットを対象とした15以上の並行スレッドを実行していますが、それらすべてをタブ間で管理することは、私のワークフローにおける最大のストレス要因の1つでした。同時セッションが可能なフルページのGenie Codeは、コンテキストを失うことなく、すべてを並行して実行できる真のワークスペースを提供してくれます。— Moritz Schiek氏(Bosch、ソリューションコンサルタント)
また、コマンドセンターによってカスタマイズ機能が見つけやすくなりました。指示、スキル、コネクタがより見やすくなり、チームは適切な標準、ツール、ワークスペースの知識を用いてGenie Codeを導くことができます。
フルページのコマンドセンターにアクセスするには、Genie Codeのサイドパネルを開き、左上にある最大化ボタンをクリックします。
MLプロジェクトにおいて、モデルの作成はほんの一部にすぎません。ほとんどの時間はその周辺のエンジニアリングに費やされます。生のデータを特徴量に変換し、実験を実行し、候補モデルを本番環境にデプロイし、実際のトラフィックが到達した後にその健全性を維持する作業です。この作業は時間がかかり、コストも高いため、多くのチームがユースケースの数に比べてはるかに少ないモデルしか運用できていないのが現状です。
機械学習向けのGenie Codeは、まさ にそのエンジニアリング領域をターゲットにしています。これはGenie Codeに組み込まれた一連の機能とインテリジェンスのアップグレードであるため、新しいツールを導入する必要はありません。すでに使用しているものと同じエージェントが、既存のDatabricks MLスタック全体における本番環境のMLエンジニアリングのスペシャリストになります。

Genie Codeの専門知識は2つのソースに基づいています。1つ目はDatabricksです。私たちは10年以上にわたり、お客様とともに本番環境でのMLを運用してきました。その中で、モデルがどこで壊れるのか、チームがどこで時間を浪費するのか、そして「正常に動作するモデル」と「一見正しそうに見えて警告なしに失敗するモデル」の違いは何かを見てきました。Genie Codeは作業時にこれらの教訓を適用し、不均衡データの補正や特徴量の品質チェックなど、経験豊富な実務者が行うような細かな処理を処理します。
2つ目は、お客様のチームです。一般的なコーディングエージェントは、過去の実験、ビジネス指標、評価セット、あるいは目的の優先順位などを把握していないため、推測に頼るしかありません。Genie Ontologyはそのギャップを埋めます。チームがどのように特徴量を構築し、モデルをトレーニングし、候補を評価するかを学習するため、Genie Code は無関係なデフォルト設定に頼ることなく、それらのパターンに従います。
これら両方の知識を備えたGenie Codeは、日々のモデル開発においてより強力なパートナーとなります。チームのパターンに沿って特徴量を記述し、関連する多数のファイルにわたって調整された編集を行い、コードを実行・デバッグし、独自の評価スクリプトを使用して候補を比較します。ユーザーはプロセスを把握した上で、何を採用するかを決定できます。

Genie Codeは、Databricks MLスタック全体とネイティブに統合されました。最新のアップグレードは以下の通りです。
その結果、一般的なコーディングエージェントよりも、実世界のデータサイエンスタスクをはるかに高い頻度で完了できるエージェントが実現しました。
Genie Codeを使用することで、生のデータからガバナンスの効いた本番対応のMLワークフローへの移行を90分で実現できました。Databricks上の本番MLワークフローを独自に理解しているため、Deltaテーブルの作成、データの探索、モデルのトレーニングと比較、MLflowおよびUnity Catalogへの登録、そして最良モデルのサービングエンドポイントへのデプロイを支援してくれました。最も重要なビジネス成果の最適化に時間を割く余裕さえ生まれました。— Radu Dragusin氏(Danfoss、Data & AI担当プリンシパルエンジニア)
これまで、Genie Codeは主にインタラクティブなものでした。ユーザーが質問し、Genieが回答し、作業の進行に合わせてユーザーが関与し続けるという形です。スケジュールされたタスクは、それを変えるものです。
まもなく提供されるスケジュールされたタスク機能により、PCの前にいないときでもGenie Codeが代わりに作業を行い、戻ってきたときにレビュー用の結果を提示してくれるようになります。 スケジュールされたタスクは、プロンプトと、オプションでノートブック、ワークフロー、ダッシュボードなどの関連アセットから開始されます。タスクが実行されると、Genie Codeは結果を含むスレッドを作成し、ユーザーはそれをレビュー、微調整、またはインタラクティブに継続できます。
例えば、データチームはGenie Codeに対し、夜間ジョブの結果の確認、パイプライン実行の要約、ダッシュボード指標の変化の説明、週次分析の作成、チームミーティング前のモデルパフォーマンスのレビューなどを依頼できます。ユーザーは、作業の実行中にプロンプトを手動で再実行したり、アクティブなチャットにとどまったりする必要はありません。
スケジュールされたタスクにより、Genie Codeはインタラクティブな支援から自律的な作業へと移行します。これにより、結果の可視性、レビュー可能性、精度を維持しながら、重要なワークフローを継続させることができます。
Genie ZeroOpsは、このアプローチを本番環境の運用にまで拡張します。稼働中のシステムを監視し、問題を調査し、チームがレビューして承認するための修正案を準備します。MLシステムの場合、これにはモデルのドリフト、サービングエラー、上流パイプラインの問題などが含まれます。データエンジニアリングシステムの場合、監視や診断から、修復や最適化へとチームが移行するのを支援します。
Databricksワークスペースをお持ちであれば、すでにGenie Codeをご利用いただけます。今すぐワークスペースでGenie Codeを開き、フルページのエクスペリエンスをお試しください。Genieファミリーがどのように本番運用へと拡張されるかについては、Genie ZeroOpsのローンチブログをご覧ください。
(このブログ記事はAI翻訳ツールを使用して翻訳されています) 原文記事
ブログを購読して、最新の投稿を受信トレイにお届けします。