メインコンテンツへジャンプ
ログイン
      • Databricks を知る
        • エグゼクティブ向け
          • スタートアップ向け
            • レイクハウスアーキテクチャ
              • Mosaic Research
              • 導入事例
                • 注目の導入事例
                • パートナー
                  • クラウドプロバイダ
                    Databricks on AWS、Azure、GCP
                    • コンサルティング・SI
                      Databricks の構築・デプロイ、Databricks への移行のエキスパート
                      • 技術パートナー
                        既存のツールをレイクハウスに接続
                        • C&SI パートナー
                          レイクハウスの構築・デプロイメント、レイクハウスへの移行
                          • データパートナー
                            データコンシューマーのエコシステムにアクセス
                            • パートナーソリューション
                              業界・移行のニーズに応じたカスタムソリューション
                              • Databricks で構築
                                ビジネスの創造・マーケティング・成長
                              • Databricks プラットフォーム
                                • プラットフォームの概要
                                  データ・分析・AI のための統合プラットフォーム
                                  • データ管理
                                    データの信頼性・セキュリティ・パフォーマンス
                                    • 共有
                                      オープン、セキュア、ゼロコピーでのデータ共有
                                      • データウェアハウジング
                                        バッチ、ストリーミングデータのための ETL とオーケストレーション
                                        • ガバナンス
                                          データ・分析・AI のための統合ガバナンス
                                          • データエンジニアリング
                                            バッチ、ストリーミングデータのための ETL とオーケストレーション
                                            • 人工知能(AI)
                                              ML と生成 AI アプリケーションの構築とデプロイメント
                                              • データサイエンス
                                                データサイエンスの大規模な連携
                                                • BI
                                                  実世界データのインテリジェント分析
                                                  • アプリケーション開発
                                                    安全なデータと AI アプリを迅速に構築
                                                    • データベース
                                                      データアプリとAIエージェントのための Postgres
                                                    • 統合とデータ
                                                      • マーケットプレイス
                                                        データ、分析、AI のためのオープンマーケットプレイス
                                                        • IDE 統合
                                                          お気に入りの IDE(統合開発環境)でレイクハウスを構築
                                                          • パートナーコネクト
                                                            Databricks エコシステムの検索と統合
                                                          • ご利用料金
                                                            • Databricks のご利用料金
                                                              料金設定、DBU、その他
                                                              • コスト計算ツール
                                                                クラウド利用でのコンピュートコストの試算
                                                              • オープンソース
                                                                • オープンソーステクノロジー
                                                                  プラットフォームを支えるイノベーションをもっと詳しく
                                                                • 業界向け Databricks
                                                                  • 通信
                                                                    • メディア・エンターテイメント
                                                                      • 金融サービス
                                                                        • 官公庁・公共機関
                                                                          • 医療・ライフサイエンス
                                                                            • リテール・消費財
                                                                              • 製造
                                                                                • 全て見る
                                                                                • クロスインダストリーソリューション
                                                                                  • サイバーセキュリティ
                                                                                    • マーケティング
                                                                                    • 移行・デプロイメント
                                                                                      • データの移行
                                                                                        • プロフェッショナルサービス
                                                                                        • ソリューションアクセラレータ
                                                                                          • ソリューションアクセラレータ一覧
                                                                                            成果を加速
                                                                                          • トレーニング・認定試験
                                                                                            • トレーニング概要
                                                                                              ニーズに合わせたカリキュラムを探す
                                                                                              • Databricks アカデミー
                                                                                                Databricks ラーニングプラットフォームにサインインする
                                                                                                • 認定
                                                                                                  スキル・認定で差別化を図る
                                                                                                  • 無料版
                                                                                                    専門家向けデータとAIツールを無料で学べます
                                                                                                    • 大学との連携
                                                                                                      Databricks を教材として活用
                                                                                                    • イベント
                                                                                                      • DATA+AI サミット
                                                                                                        • Data+AI ワールドツアー
                                                                                                          • Data Intelligence Days
                                                                                                            • イベントカレンダー
                                                                                                            • ブログ・ポッドキャスト
                                                                                                              • Databricks ブログ
                                                                                                                最新情報、製品発表、その他の情報
                                                                                                                • Databricks Mosaic AIリサーチブログ
                                                                                                                  AI世代に関する最新リサーチ
                                                                                                                  • Data Brew ポッドキャスト
                                                                                                                    ご相談・お問い合わせ
                                                                                                                    • ポッドキャスト:Data+AI のチャンピオン
                                                                                                                      イノベーションを支えるデータリーダーのインサイト
                                                                                                                    • お役立ちリソース
                                                                                                                      • カスタマーサポート
                                                                                                                        • ドキュメント
                                                                                                                          • コミュニティ
                                                                                                                          • もっと詳しく
                                                                                                                            • リソースセンター
                                                                                                                              • デモセンター
                                                                                                                                • アーキテクチャ センター
                                                                                                                                • 企業概要
                                                                                                                                  • Databricks について
                                                                                                                                    • 経営陣
                                                                                                                                      • Databricks Ventures
                                                                                                                                        • ご相談・お問い合わせ
                                                                                                                                        • 採用情報
                                                                                                                                          • 採用情報概要
                                                                                                                                            • 求人情報
                                                                                                                                            • プレス・ニュース記事
                                                                                                                                              • ニュースルーム
                                                                                                                                                • 受賞歴と業界評価
                                                                                                                                                • セキュリティと信頼
                                                                                                                                                  • セキュリティと信頼
                                                                                                                                              • 是非ご検討ください!
                                                                                                                                              • デモを見る
                                                                                                                                              • ログイン
                                                                                                                                              • Databricks 無料トライアル
                                                                                                                                              1. ブログ
                                                                                                                                              2. /
                                                                                                                                                オープンソース
                                                                                                                                              3. /
                                                                                                                                                記事

                                                                                                                                              Apache Spark™ に「宣言的パイプライン」がついに登場!

                                                                                                                                              データ変換の現場で鍛えられた、信頼のオープンスタンダード

                                                                                                                                              Bringing Declarative Pipelines to the Apache Spark™ Open Source Project

                                                                                                                                              Published: June 20, 2025

                                                                                                                                              オープンソース1分未満

                                                                                                                                              Michael Armbrust、Sandy Ryza、Denny Lee、ジェームズ・マローン、マット・ジョーンズ による投稿

                                                                                                                                              この投稿を共有する

                                                                                                                                              最新の投稿を通知します

                                                                                                                                              Summary

                                                                                                                                              • 我々は、Declarative Pipelines - 信頼性の高いデータパイプラインを一部の作業で構築するための実証済みの宣言的API - をApache Spark™に寄贈しています。
                                                                                                                                              • この標準は、バッチとストリーミングのワークロードを跨いでパイプライン開発を簡素化します。
                                                                                                                                              • 実際の経験が数年にわたり、この柔軟でSparkネイティブなアプローチをバッチおよびストリーミングパイプラインの両方に形成しました。

                                                                                                                                              Apache Spark™ は、今やビッグデータ処理における事実上の標準エンジンとなっており、世界中の大手企業のワークロードを支えています。過去10年間で、Apache Spark は汎用コンピューティングエンジンから、オープンレイクハウスアーキテクチャにおける中核レイヤーへと進化してきました。Spark SQL、Structured Streaming、オープンテーブル形式、統合ガバナンスといった機能は、現代のデータプラットフォームにおける重要な柱となっています。

                                                                                                                                              そしてこの進化は、最新版の Apache Spark 4.0 のリリースによってさらに加速しています。ストリーミング、Python、SQL、セミ構造化データの分野で大きな進歩がありました。詳しい内容はこちらをご覧ください。

                                                                                                                                              この堅牢な Apache Spark の基盤の上に、私たちはオープンソースへの新たな貢献を発表します:

                                                                                                                                              信頼性とスケーラビリティを兼ね備えた Declarative Pipelines(宣言型パイプライン) を Apache Spark に寄贈

                                                                                                                                              宣言型パイプライン は、堅牢かつスケーラブルなデータパイプラインを構築するための実績ある標準であり、これを Apache Spark プロジェクトへ寄贈します。

                                                                                                                                              この貢献により、Apache Spark の宣言的アプローチは、単一のクエリだけでなくパイプライン全体へと拡張されます。つまり、ユーザーは「パイプラインが何をすべきか」を記述するだけで、「どのように実行するか」は Spark が自動的に判断してくれるという設計です。

                                                                                                                                              この API は、長年にわたる実際の Apache Spark ワークロードの観察をもとに設計されており、バッチ処理とストリーミング処理の両方を含む、よくあるユースケースをカバーしています。私たちが培ってきた知見を、宣言的 API として形にしました。

                                                                                                                                              データフローグラフ
                                                                                                                                              Sample Dataflow Graph

                                                                                                                                              宣言的APIでETLがもっとシンプルに、もっと保守しやすく

                                                                                                                                              私たちは、長年にわたり実際のSparkユーザーと取り組んできた中で、プロダクション向けパイプライン構築に共通する課題を数多く見てきました:

                                                                                                                                              • インクリメンタル取り込みやデータセットのマテリアライズのタイミングを判断するための“つなぎコード”に多くの時間がかかっている
                                                                                                                                                 このような作業はどのチームでも発生しますが、差別化にはつながらず、肝心のビジネスロジックに集中できません。

                                                                                                                                              • 同じようなパターンがチーム間で何度も再実装されてしまい、非効率かつ一貫性がない
                                                                                                                                                 結果として運用負荷が増大します。

                                                                                                                                              • テストやデータの流れ(リネージ)、CI/CD、モニタリングを一貫して管理できる標準的なフレームワークが存在しない

                                                                                                                                              こうした課題に対し、Databricksでは「DLT(Delta Live Tables)」という製品を通じて、よくあるエンジニアリングのベストプラクティスを宣言的アプローチでプロダクトに落とし込んできました。

                                                                                                                                              DLTでは、処理の全てを自分で組み立てる必要はありません。テーブルの最終状態を定義するだけで、依存関係のマッピング、エラーハンドリング、チェックポイント、障害時のリトライなどはエンジンが自動で処理してくれます。

                                                                                                                                              その結果、生産性・信頼性・保守性は大きく向上し、特に複雑なパイプラインを運用するチームにとっては大きなブレイクスルーとなりました。

                                                                                                                                              学びを活かし、次のステージへ

                                                                                                                                              DLTのローンチ以降、私たちは多くのことを学びました。

                                                                                                                                              • 宣言的アプローチが非常に効果を発揮する領域

                                                                                                                                              • 逆に、柔軟性や細かな制御が求められるケース

                                                                                                                                              • 複雑なロジックやストリーミングのオーケストレーションを自動化することの価値

                                                                                                                                              • 開発者の自由と移植性を担保するためには、オープンなSpark APIの上に構築することが不可欠であるということ

                                                                                                                                              こうした知見をもとに、私たちは新たな方向性に踏み出しました:

                                                                                                                                              それが、「宣言的パイプライン開発のための、オープンソースかつSparkネイティブなフレームワーク」です。

                                                                                                                                              クエリからエンドツーエンドのパイプラインへ:Sparkの宣言的進化の次なるステージ

                                                                                                                                              Apache Spark SQL によって、クエリ実行は「宣言的」に進化しました。開発者は、低レベルな RDD コードでジョインや集計処理を書く代わりに、「求める結果をSQLで記述」するだけでよくなり、残りは Spark が自動で処理してくれるようになりました。

                                                                                                                                              そして今回、Spark Declarative Pipelines により、この宣言的アプローチがクエリ単体から複数テーブルにまたがるパイプライン全体へと拡張されます。
                                                                                                                                              開発者は「どのようなデータセットが必要で、どのように生成されるか」を定義するだけで、Spark が最適な実行計画を自動で導出し、依存関係の管理やインクリメンタル処理を行ってくれます。

                                                                                                                                              Spark Declarative Pipelinesの実際の動作
                                                                                                                                              Spark Declarative Pipelines in action

                                                                                                                                              Spark 宣言型パイプライン の特徴

                                                                                                                                              オープン性と再利用性(コンポーザビリティ)を重視して設計された Spark Declarative Pipelines は、以下の機能を備えています:

                                                                                                                                              • テーブルや変換処理を定義するための宣言的API

                                                                                                                                              • バッチ処理とストリーミング処理の両方をネイティブにサポート

                                                                                                                                              • データ依存を自動で追跡し、実行順序やバックフィルも自動管理する、データに気づいたオーケストレーション

                                                                                                                                              • ストリーミング処理のための自動チェックポイント、リトライ、インクリメンタル実行

                                                                                                                                              • SQLとPythonの両方に対応

                                                                                                                                              • Sparkの実行プランに完全アクセスできるため、実行の透明性を確保

                                                                                                                                              そして何よりも重要なのは、このフレームワークが「Apache Sparkそのもの」だということです。
                                                                                                                                              ラッパーやブラックボックス的な仕組みは一切なく、Sparkのオープンな構造の上で動作します。

                                                                                                                                              オープンソースで実現する、新たな標準

                                                                                                                                              今回の貢献は、Apache Spark、Delta Lake、そしてオープンデータコミュニティ全体にわたる長年の取り組みの集大成です。DLTで得た知見をもとにしながら、より柔軟に、より拡張可能に、そして完全にオープンソースとして設計されています。

                                                                                                                                              そしてこれは始まりにすぎません。私たちはこのフレームワークを、Apache Spark エコシステム全体が共通基盤として活用できるよう提供します。独自のパイプラインを構築する場合も、業界特化の抽象化を行う場合も、Spark本体に貢献する場合も、このフレームワークがあなたを支援します。

                                                                                                                                              「宣言的なパイプラインは、現代のデータエンジニアリングの複雑さをシンプルで直感的なプログラミングモデルの下に隠します。エンジニアリングマネージャーとして、私のエンジニアがビジネスに最も重要なことに集中できることが大好きです。このレベルのイノベーションが今、オープンソース化されていることを見るのは興奮しています-これにより、さらに多くのチームがアクセスできるようになります。” — Jian (Miracle) Zhou, Senior Engineering Manager, Navy Federal Credit Union

                                                                                                                                              ネイビーフェデラルクレジットユニオン

                                                                                                                                              「84.51では、データパイプラインを構築しやすく、維持しやすくする方法を常に探しています。特に、よりオープンで柔軟なツールに移行するにつれて。宣言的なアプローチは、管理するコードの量を減らすのに大いに役立ち、バッチとストリーミングの両方をサポートするのが容易になり、別々のシステムを縫い合わせる必要がなくなりました。このフレームワークをSpark Declarative Pipelinesとしてオープンソース化することは、Sparkコミュニティにとって大きなステップです。” — Brad Turnbaugh, Sr. Data Engineer, 84.51°

                                                                                                                                              8451

                                                                                                                                              今後の展望

                                                                                                                                              詳細は今後、Apache Sparkのドキュメンテーションで随時公開される予定です。
                                                                                                                                              それまでの間は、提案に関するJiraとコミュニティディスカッションをご覧いただけます。

                                                                                                                                              もし今 Apache Spark でパイプラインを構築しているなら、ぜひこの宣言的モデルを試してみてください。
                                                                                                                                              私たちの目標は、すべての人にとってパイプライン開発をもっとシンプルに、信頼性高く、そして協調的なものにすることです。

                                                                                                                                              Lakehouse の本質は、単なるオープンなストレージではありません。
                                                                                                                                              オープンなフォーマット、オープンなエンジン、そしてそれらの上に構築するためのオープンなパターンが揃って初めて、真のLakehouseが実現します。

                                                                                                                                              私たちは、宣言的パイプラインが Apache Spark 開発における新たな標準となると信じています。
                                                                                                                                              そしてその未来を、オープンに、コミュニティと共に築いていけることを楽しみにしています。

                                                                                                                                              最新の投稿を通知します

                                                                                                                                              関連記事

                                                                                                                                              この投稿を共有する

                                                                                                                                              Databricksの投稿を見逃さないようにしましょう

                                                                                                                                              興味のあるカテゴリを購読して、最新の投稿を受信トレイに届けましょう

                                                                                                                                              Sign up

                                                                                                                                              次は何ですか?

                                                                                                                                              Booting Databricks VMs 7x Faster for Serverless Compute

                                                                                                                                              データエンジニアリング

                                                                                                                                              November 25, 2024/1分未満

                                                                                                                                              DatabricksのサーバーレスコンピュートでVM起動を7倍高速化

                                                                                                                                              Batch Inference on Fined Tuned Llama Models with Mosaic AI Model Serving

                                                                                                                                              製品

                                                                                                                                              December 10, 2024/2分で読めます

                                                                                                                                              ファインチューニングされたラマモデルに対するバッチ推論とMosaic AIモデル提供

                                                                                                                                              databricks logo
                                                                                                                                              Databricks を選ぶ理由
                                                                                                                                              Databricks を選ぶ理由
                                                                                                                                              • エグゼクティブ向け
                                                                                                                                              • スタートアップ向け
                                                                                                                                              • レイクハウスアーキテクチャ
                                                                                                                                              • Mosaic Research
                                                                                                                                              導入事例
                                                                                                                                              • 注目の導入事例
                                                                                                                                              パートナー
                                                                                                                                              • クラウドプロバイダ
                                                                                                                                              • 技術パートナー
                                                                                                                                              • データパートナー
                                                                                                                                              • Databricks で構築
                                                                                                                                              • コンサルティング・SI
                                                                                                                                              • C&SI パートナー
                                                                                                                                              • パートナーソリューション
                                                                                                                                              Databricks を選ぶ理由
                                                                                                                                              • エグゼクティブ向け
                                                                                                                                              • スタートアップ向け
                                                                                                                                              • レイクハウスアーキテクチャ
                                                                                                                                              • Mosaic Research
                                                                                                                                              導入事例
                                                                                                                                              • 注目の導入事例
                                                                                                                                              パートナー
                                                                                                                                              • クラウドプロバイダ
                                                                                                                                              • 技術パートナー
                                                                                                                                              • データパートナー
                                                                                                                                              • Databricks で構築
                                                                                                                                              • コンサルティング・SI
                                                                                                                                              • C&SI パートナー
                                                                                                                                              • パートナーソリューション
                                                                                                                                              製品
                                                                                                                                              レイクハウスプラットフォーム
                                                                                                                                              • プラットフォーム
                                                                                                                                              • 共有
                                                                                                                                              • データガバナンス
                                                                                                                                              • 人工知能(AI)
                                                                                                                                              • DBRX
                                                                                                                                              • データベース
                                                                                                                                              • データ管理
                                                                                                                                              • データウェアハウス
                                                                                                                                              • データエンジニアリング
                                                                                                                                              • データサイエンス
                                                                                                                                              • アプリケーション開発
                                                                                                                                              ご利用料金
                                                                                                                                              • 料金設定の概要
                                                                                                                                              • 料金計算ツール
                                                                                                                                              オープンソース
                                                                                                                                              統合とデータ
                                                                                                                                              • マーケットプレイス
                                                                                                                                              • IDE 統合
                                                                                                                                              • パートナーコネクト
                                                                                                                                              レイクハウスプラットフォーム
                                                                                                                                              • プラットフォーム
                                                                                                                                              • 共有
                                                                                                                                              • データガバナンス
                                                                                                                                              • 人工知能(AI)
                                                                                                                                              • DBRX
                                                                                                                                              • データベース
                                                                                                                                              • データ管理
                                                                                                                                              • データウェアハウス
                                                                                                                                              • データエンジニアリング
                                                                                                                                              • データサイエンス
                                                                                                                                              • アプリケーション開発
                                                                                                                                              ご利用料金
                                                                                                                                              • 料金設定の概要
                                                                                                                                              • 料金計算ツール
                                                                                                                                              統合とデータ
                                                                                                                                              • マーケットプレイス
                                                                                                                                              • IDE 統合
                                                                                                                                              • パートナーコネクト
                                                                                                                                              ソリューション
                                                                                                                                              業種別
                                                                                                                                              • 通信
                                                                                                                                              • 金融サービス
                                                                                                                                              • 医療・ライフサイエンス
                                                                                                                                              • 製造
                                                                                                                                              • メディア・エンタメ
                                                                                                                                              • 官公庁・公共機関
                                                                                                                                              • リテール・消費財
                                                                                                                                              • 全て表示
                                                                                                                                              クロスインダストリーソリューション
                                                                                                                                              • サイバーセキュリティ
                                                                                                                                              • マーケティング
                                                                                                                                              データの移行
                                                                                                                                              プロフェッショナルサービス
                                                                                                                                              ソリューションアクセラレータ
                                                                                                                                              業種別
                                                                                                                                              • 通信
                                                                                                                                              • 金融サービス
                                                                                                                                              • 医療・ライフサイエンス
                                                                                                                                              • 製造
                                                                                                                                              • メディア・エンタメ
                                                                                                                                              • 官公庁・公共機関
                                                                                                                                              • リテール・消費財
                                                                                                                                              • 全て表示
                                                                                                                                              クロスインダストリーソリューション
                                                                                                                                              • サイバーセキュリティ
                                                                                                                                              • マーケティング
                                                                                                                                              リソース
                                                                                                                                              ドキュメント
                                                                                                                                              カスタマーサポート
                                                                                                                                              コミュニティ
                                                                                                                                              トレーニング・認定試験
                                                                                                                                              • トレーニング
                                                                                                                                              • 認定
                                                                                                                                              • 無料版
                                                                                                                                              • 大学との連携
                                                                                                                                              • Databricks アカデミー
                                                                                                                                              イベント
                                                                                                                                              • DATA+AI サミット
                                                                                                                                              • Data+AI ワールドツアー
                                                                                                                                              • Data Intelligence Days
                                                                                                                                              • イベントカレンダー
                                                                                                                                              ブログ・ポッドキャスト
                                                                                                                                              • Databricks ブログ
                                                                                                                                              • Databricks Mosaic AIリサーチブログ
                                                                                                                                              • Data Brew ポッドキャスト
                                                                                                                                              • Data+AI のチャンピオンシリーズ
                                                                                                                                              トレーニング・認定試験
                                                                                                                                              • トレーニング
                                                                                                                                              • 認定
                                                                                                                                              • 無料版
                                                                                                                                              • 大学との連携
                                                                                                                                              • Databricks アカデミー
                                                                                                                                              イベント
                                                                                                                                              • DATA+AI サミット
                                                                                                                                              • Data+AI ワールドツアー
                                                                                                                                              • Data Intelligence Days
                                                                                                                                              • イベントカレンダー
                                                                                                                                              ブログ・ポッドキャスト
                                                                                                                                              • Databricks ブログ
                                                                                                                                              • Databricks Mosaic AIリサーチブログ
                                                                                                                                              • Data Brew ポッドキャスト
                                                                                                                                              • Data+AI のチャンピオンシリーズ
                                                                                                                                              企業情報
                                                                                                                                              企業概要
                                                                                                                                              • Databricks について
                                                                                                                                              • 経営陣
                                                                                                                                              • Databricks Ventures
                                                                                                                                              • ご相談・お問い合わせ
                                                                                                                                              採用情報
                                                                                                                                              • 採用情報概要
                                                                                                                                              • 求人情報
                                                                                                                                              プレス・ニュース記事
                                                                                                                                              • ニュースルーム
                                                                                                                                              • 受賞歴と業界評価
                                                                                                                                              セキュリティと信頼
                                                                                                                                              企業概要
                                                                                                                                              • Databricks について
                                                                                                                                              • 経営陣
                                                                                                                                              • Databricks Ventures
                                                                                                                                              • ご相談・お問い合わせ
                                                                                                                                              採用情報
                                                                                                                                              • 採用情報概要
                                                                                                                                              • 求人情報
                                                                                                                                              プレス・ニュース記事
                                                                                                                                              • ニュースルーム
                                                                                                                                              • 受賞歴と業界評価
                                                                                                                                              databricks logo

                                                                                                                                              Databricks Inc.
                                                                                                                                              160 Spear Street, 15th Floor
                                                                                                                                              San Francisco, CA 94105
                                                                                                                                              1-866-330-0121

                                                                                                                                              採用情報

                                                                                                                                              © Databricks 2025. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.

                                                                                                                                              • プライバシー通知
                                                                                                                                              • |利用規約
                                                                                                                                              • |現代奴隷法に関する声明
                                                                                                                                              • |カリフォルニア州のプライバシー権利
                                                                                                                                              • |プライバシー設定