メインコンテンツへジャンプ
ログイン
      • Databricks を知る
        • エグゼクティブ向け
          • スタートアップ向け
            • レイクハウスアーキテクチャ
              • Mosaic Research
              • 導入事例
                • 注目の導入事例
                • パートナー
                  • パートナー概要
                    Databricks パートナー エコシステムの詳細
                    • パートナースポットライト
                      注目のパートナーの発表
                      • パートナープログラム
                        特典、レベル、パートナーになる方法をご覧ください
                        • クラウドプロバイダー
                          AWS、Azure、GCP 上の Databricks
                          • パートナーを探す
                            ニーズに合った Databricks パートナーを見つける
                            • パートナーソリューション
                              業界別および移行ソリューションを見つける
                            • Databricks プラットフォーム
                              • プラットフォームの概要
                                データ・分析・AI のための統合プラットフォーム
                                • データ管理
                                  データの信頼性・セキュリティ・パフォーマンス
                                  • 共有
                                    オープン、セキュア、ゼロコピーでのデータ共有
                                    • データウェアハウジング
                                      バッチ、ストリーミングデータのための ETL とオーケストレーション
                                      • ガバナンス
                                        データ・分析・AI のための統合ガバナンス
                                        • データエンジニアリング
                                          バッチ、ストリーミングデータのための ETL とオーケストレーション
                                          • 人工知能(AI)
                                            ML と生成 AI アプリケーションの構築とデプロイメント
                                            • データサイエンス
                                              データサイエンスの大規模な連携
                                              • BI
                                                実世界データのインテリジェント分析
                                                • アプリケーション開発
                                                  安全なデータと AI アプリを迅速に構築
                                                  • データベース
                                                    データアプリとAIエージェントのための Postgres
                                                  • 統合とデータ
                                                    • マーケットプレイス
                                                      データ、分析、AI のためのオープンマーケットプレイス
                                                      • IDE 統合
                                                        お気に入りの IDE(統合開発環境)でレイクハウスを構築
                                                        • パートナーコネクト
                                                          Databricks エコシステムの検索と統合
                                                        • ご利用料金
                                                          • Databricks のご利用料金
                                                            料金設定、DBU、その他
                                                            • コスト計算ツール
                                                              クラウド利用でのコンピュートコストの試算
                                                            • オープンソース
                                                              • オープンソーステクノロジー
                                                                プラットフォームを支えるイノベーションをもっと詳しく
                                                              • 業界向け Databricks
                                                                • 通信
                                                                  • メディア・エンターテイメント
                                                                    • 金融サービス
                                                                      • 官公庁・公共機関
                                                                        • 医療・ライフサイエンス
                                                                          • リテール・消費財
                                                                            • 製造
                                                                              • 全て見る
                                                                              • クロスインダストリーソリューション
                                                                                • AI Agents
                                                                                  • サイバーセキュリティ
                                                                                    • マーケティング
                                                                                    • 移行・デプロイメント
                                                                                      • データの移行
                                                                                        • プロフェッショナルサービス
                                                                                        • ソリューションアクセラレータ
                                                                                          • ソリューションアクセラレータ一覧
                                                                                            成果を加速
                                                                                          • トレーニング・認定試験
                                                                                            • トレーニング概要
                                                                                              ニーズに合わせたカリキュラムを探す
                                                                                              • Databricks アカデミー
                                                                                                Databricks ラーニングプラットフォームにサインインする
                                                                                                • 認定
                                                                                                  スキル・認定で差別化を図る
                                                                                                  • 無料版
                                                                                                    専門家向けデータとAIツールを無料で学べます
                                                                                                    • 大学との連携
                                                                                                      Databricks を教材として活用
                                                                                                    • イベント
                                                                                                      • DATA+AI サミット
                                                                                                        • Data+AI ワールドツアー
                                                                                                          • AI Days
                                                                                                            • イベントカレンダー
                                                                                                            • ブログ・ポッドキャスト
                                                                                                              • Databricks ブログ
                                                                                                                最新情報、製品発表、その他の情報
                                                                                                                • Databricks Mosaic AIリサーチブログ
                                                                                                                  AI世代に関する最新リサーチ
                                                                                                                  • Data Brew ポッドキャスト
                                                                                                                    ご相談・お問い合わせ
                                                                                                                    • ポッドキャスト:Data+AI のチャンピオン
                                                                                                                      イノベーションを支えるデータリーダーのインサイト
                                                                                                                    • お役立ちリソース
                                                                                                                      • カスタマーサポート
                                                                                                                        • ドキュメント
                                                                                                                          • コミュニティ
                                                                                                                          • もっと詳しく
                                                                                                                            • リソースセンター
                                                                                                                              • デモセンター
                                                                                                                                • アーキテクチャ センター
                                                                                                                                • 企業概要
                                                                                                                                  • Databricks について
                                                                                                                                    • 経営陣
                                                                                                                                      • Databricks Ventures
                                                                                                                                        • ご相談・お問い合わせ
                                                                                                                                        • 採用情報
                                                                                                                                          • 採用情報概要
                                                                                                                                            • 求人情報
                                                                                                                                            • プレス・ニュース記事
                                                                                                                                              • ニュースルーム
                                                                                                                                                • 受賞歴と業界評価
                                                                                                                                                • セキュリティと信頼
                                                                                                                                                  • セキュリティと信頼
                                                                                                                                              • 是非ご検討ください!
                                                                                                                                              • デモを見る
                                                                                                                                              • ログイン
                                                                                                                                              • Databricks 無料トライアル
                                                                                                                                              1. ブログ
                                                                                                                                              2. /
                                                                                                                                                データ+AI基盤
                                                                                                                                              3. /
                                                                                                                                                Topic

                                                                                                                                              Mapreduce とは何ですか?

                                                                                                                                              バッチワークロードの Hadoop エコシステムの基盤となる、マップと削減フェーズを介して大規模なデータセットを並列処理するためのプログラミング モデル

                                                                                                                                              4 Personas Agnostic 4b
                                                                                                                                              データ+AI基盤Less than a minute

                                                                                                                                              によって Databricksスタッフ による投稿

                                                                                                                                              この投稿を共有する

                                                                                                                                              最新の投稿を通知します

                                                                                                                                              Summary

                                                                                                                                              • Mapフェーズでは、クラスタノード間で入力データを並列処理し、ユーザー定義のMap関数を適用してキーと値のペアを変換し、Reduceフェーズの消費を抑えるためにソートおよびパーティション化された中間結果を出力します。
                                                                                                                                              • Reduceフェーズでは、ユーザー定義のReduce関数を使用して、同じキーを共有する中間結果を集約し、組み込みのソート、シャッフル、および結合の最適化によりネットワーク転送を最小限に抑えた最終出力を生成します。
                                                                                                                                              • フレームワークは、障害発生時のタスクの再実行、自動データパーティション分割、JobTracker/TaskTracker(Hadoop 1.x)またはYARN ResourceManager(Hadoop 2.x以降)によるジョブ調整により、フォールトトレランスを実現し、分散バッチ処理を実現します。

                                                                                                                                              MapReduce とは

                                                                                                                                              MapReduce は、Apache Hadoop エコシステムの一部であり、Java ベースの分散実行フレームワークです。開発者が実装する Map 処理と Reduce 処理の 2 つの処理ステップを公開することで、分散プログラミングの複雑さを解消します。Map 処理では、データは並列処理するタスク間で分割されます。データの各チャンクには、変換ロジックを適用できます。Map 処理が完了すると Reduce 処理が行われ、Map 処理で分割されたデータの集約を実行します。通常、MapReduce は入出力ともに Hadoop 分散ファイルシステム(HDFS)を使用します。しかし、その上に構築された Sqoop のような技術には、リレーショナルシステムにアクセスできるものがあります。

                                                                                                                                              MapReduce の歴史

                                                                                                                                              MapReduce は、2004 年に Google の Jeffery Dean 氏と Sanjay Ghemawat 氏によって Google 内で開発されました。彼らの論文「MapReduce: Simplified Data Processing on Large Clusters」において、MapReduce は関数型プログラミングでよく使用される map 関数と reduce 関数にヒントを得たものであることが示されています。当時、Google 独自の MapReduce システムは、Google File System(GFS)上で動作していました。しかし、Google は 2014 年までに、MapReduce を主要なビッグデータ処理モデルとして使用しなくなりました。かつて、MapReduce は HDFS に格納されたデータを取得できる唯一の方法でした。現在では、HDFS からデータを取得する方法として Hive や Pig といった他のクエリベースのシステムがあり、MapReduce モデルで記述されたジョブとともに実行される SQL ライクなステートメントが使用されています。

                                                                                                                                              MapReduce の仕組み

                                                                                                                                              MapReduce システムは、Map と Reduce の処理/関数の組み合わせとして一般化されていますが、通常は、3 つのステップで構成されています。それぞれのステップをご紹介します。

                                                                                                                                              • Map 処理:入力データは、小さなブロックに分割されます。Hadoop フレームワークは、処理するデータのサイズと各 Mapper サーバーで利用可能なメモリブロックに基づいて、使用する Mapper 数を決定します。各ブロックは、Mapper に割り当てられ、処理されます。各ワーカーノードは、ローカルデータに map 関数を適用し、一時ストレージに出力を書き込みます。プライマリ(マスター)ノードでは、冗長な入力データの 1 つのコピーのみが処理されるようにします。
                                                                                                                                              • シャッフル、集約(Combine)、パーティション: ワーカーノードは、map 関数によって生成された出力キーに基づいてデータを再分配し、あるキーに属する全てのデータが同じワーカーノードに配置されるようにします。オプションの処理となる Combiner(Reducer)は、各 Mapper サーバー上で個別に実行することで各 Mapper のデータをさらに削減し、データフットプリントの削減やシャッフルとソートを容易にすることが可能です。パーティションはオプションではなく、データを Reducer に提示する方法を決定し、また特定の Reducer に割り当てる処理です。
                                                                                                                                              • Reduce 処理:Mapper の進行中に Reducer を開始することはできません。ワーカーノードは、key-value ペアの出力データの各グループを並列に処理し、key-value ペアを出力として生成します。同じキーを持つ全ての Map の出力値は、1 つの Reducer に割り当てられ、Reducer はそのキーの値を集計します。初期データのフィルタリングやソートが必須の map 関数とは異なり、reduce 関数はオプションです。

                                                                                                                                              MapReduce で考慮すべき事柄

                                                                                                                                               

                                                                                                                                              • 柔軟性に欠ける MapReduce のプログラミングパラダイム

                                                                                                                                              Map 処理と Reduce 処理のインターフェースをプログラマーに公開することで、Hadoop での分散アプリケーションの作成が容易になった一方で、MapReduce のプログラミングパラダイムで幅広いロジックを表現することは困難です。MapReduce でうまく機能しないロジックの一例として、反復処理が挙げられます。一般的に、データはメモリ上に保持されず、反復処理のロジックは MapReduce アプリケーションを連結することで処理されるため、複雑さが増してしまいます。
                                                                                                                                               

                                                                                                                                              • 読み取り/書き込みの集中

                                                                                                                                              MapReduce ジョブでは、ユーザーデータ用の分散メモリ構造の概念がないため、メモリに保存するデータはほとんどなく、データは HDFS に対して読み書きする必要があります。さらに複雑な MapReduce アプリケーションでは、より小さな MapReduce ジョブを連結して使用します。これらのジョブ間ではデータの受け渡しができないため、HDFS を介したデータ共有が必要になり、処理のボトルネックが生じます。
                                                                                                                                               

                                                                                                                                              • Java に特化

                                                                                                                                              MapReduce は Java ベースであるため、MapReduce アプリケーションを書く最も効率的な方法は、Java を使用することでしょう。そのコードは別の開発環境でコンパイルし、Hadoop クラスタにデプロイする必要があります。このような開発スタイルは、SQL などの他の技術や Python などのインタプリタ言語に慣れているデータアナリストやデータサイエンティストにはあまり採用されていません。MapReduce には、C、Python、シェルスクリプトといった他の言語で書かれた Map/Reduce ロジックを呼び出す機能が備わっています。しかし、プログラムの実行を処理するためにシステムプロセスをスピンアップする必要があり、この操作はジョブの性能に影響を与えるオーバーヘッドを発生させます。
                                                                                                                                               

                                                                                                                                              • ビッグデータ製品からのフェーズアウト

                                                                                                                                              MapReduce は、ビッグデータを扱う製品から排除される傾向にあります。一部の Hadoop ディストリビューションには MapReduce が含まれていますが、レガシーアプリケーションのサポートを目的としたものです。ビックデータを利用するユーザーは、MapReduce アプリケーションを構築するのではなく、代わりに Apache Spark のようなシンプルで高速なフレームワークを採用するようになっています。

                                                                                                                                              MapReduce の使用目的

                                                                                                                                              レガシーアプリケーションや Sqoop、Pig のような Hadoop のネイティブツールは、現在も MapReduce を活用しています。しかし、MapReduce アプリケーションの開発は非常に限られており、オープンソース技術として大きな貢献をしているとはいえません。

                                                                                                                                              5Xリーダー

                                                                                                                                              ガートナー®: Databricks、クラウドデータベースのリーダー

                                                                                                                                              レポートをダウンロード
                                                                                                                                              GM

                                                                                                                                              MapReduce と Spark に関するよくある誤解

                                                                                                                                              • MapReduce について
                                                                                                                                              • Spark について

                                                                                                                                              MapReduce のメリット

                                                                                                                                              1. スケーラビリティ
                                                                                                                                              2. 柔軟性
                                                                                                                                              3. セキュリティと認証機能
                                                                                                                                              4. 高速なデータ処理
                                                                                                                                              5. 極めてシンプルなプログラミングモデル
                                                                                                                                              6. 可用性と弾力性

                                                                                                                                              MapReduce の性能を向上させるためのヒント

                                                                                                                                              1. ユーバーモードを有効化する
                                                                                                                                              2. ネイティブなライブラリを使用する
                                                                                                                                              3. ブロックサイズを大きくする
                                                                                                                                              4. Map のタスクの所要時間を監視する
                                                                                                                                              5. データ圧縮が分割可能かどうかを特定する
                                                                                                                                              6. 削減されたタスクの数を設定する
                                                                                                                                              7. データの分割を分析する
                                                                                                                                              8. フェーズパフォーマンスの動作をシャッフルする
                                                                                                                                              9. MapReduce コードを最適化する

                                                                                                                                              MapReduce と Databricks Delta Engine の比較

                                                                                                                                              Databricks の Delta Engine は、Apache Spark と Photon と呼ばれる C++ エンジンをベースにしています。これにより、MapReduce にはない DAG 処理の柔軟性、インメモリ処理による高速性、ネイティブにコンパイルされた特別なエンジンによる圧倒的に高速なクエリ応答時間を実現します。ユーザーは、Python、Scala、R、SQL を使用して Databricks の Delta Engine を操作できます。既存の Spark アプリケーションは、データ形式として「delta」を指定するといった簡単な行の変更で、Delta Engine を使用するように変更できます。MapReduce と HDFS は、データのトランザクション一貫性や、データセット内の既存データの更新/削除をネイティブにサポートしていません。一方、Delta Engine は、データ作成者と利用者によるデータへの同時アクセスを可能にし、完全な CRUD 機能を提供します。また、MapReduce は、ビッグデータ環境における共通の問題である極小ファイルに対応するビルトイン機能を持ちませんが、Databricks の Delta Engine は、ストレージに書き込まれるデータサイズを最適化するオートコンパクション機能を備えています。OPTIMIZE コマンドを使用すると、必要に応じてファイルをコンパクトにすることも可能です。Delta のトランザクション一貫性機能により、エンドユーザーやアプリケーションがデータにアクセスしていても、この操作を実行できます。

                                                                                                                                              MapReduce の代替となる 5 つの選択肢

                                                                                                                                              1. Apache Spark
                                                                                                                                              2. Apache Storm
                                                                                                                                              3. Ceph
                                                                                                                                              4. Hydra
                                                                                                                                              5. Google BigQuery

                                                                                                                                              関連資料

                                                                                                                                              • Hadoop からレイクハウスへの移行ガイド
                                                                                                                                              • ハブの移行
                                                                                                                                              • eBook:クラウドモダナイゼーション - Hadoop からの移行による潜在価値を探るビジネスガイド
                                                                                                                                              • デモ動画:Databricks のレイクハウスプラットフォーム

                                                                                                                                              最新の投稿を通知します

                                                                                                                                              関連記事

                                                                                                                                              この投稿を共有する

                                                                                                                                              Databricksの投稿を見逃さないようにしましょう

                                                                                                                                              興味のあるカテゴリを購読して、最新の投稿を受信トレイに届けましょう

                                                                                                                                              Sign up

                                                                                                                                              次は何ですか?

                                                                                                                                              4 Personas Analytics AIBI 3a

                                                                                                                                              データ+AI基盤

                                                                                                                                              1分未満

                                                                                                                                              データストーリーテリングとは何ですか?

                                                                                                                                              4 Personas Analytics AIBI 2a

                                                                                                                                              データ+AI基盤

                                                                                                                                              1分未満

                                                                                                                                              抽出、ロード、変換 (ELT) とは何ですか?

                                                                                                                                              databricks logo
                                                                                                                                              Databricks を選ぶ理由
                                                                                                                                              Databricks を選ぶ理由
                                                                                                                                              • エグゼクティブ向け
                                                                                                                                              • スタートアップ向け
                                                                                                                                              • レイクハウスアーキテクチャ
                                                                                                                                              • Mosaic Research
                                                                                                                                              導入事例
                                                                                                                                              • 注目の導入事例
                                                                                                                                              パートナー
                                                                                                                                              • パートナー概要
                                                                                                                                              • パートナープログラム
                                                                                                                                              • パートナーを探す
                                                                                                                                              • パートナースポットライト
                                                                                                                                              • クラウドプロバイダー
                                                                                                                                              • パートナーソリューション
                                                                                                                                              Databricks を選ぶ理由
                                                                                                                                              • エグゼクティブ向け
                                                                                                                                              • スタートアップ向け
                                                                                                                                              • レイクハウスアーキテクチャ
                                                                                                                                              • Mosaic Research
                                                                                                                                              導入事例
                                                                                                                                              • 注目の導入事例
                                                                                                                                              パートナー
                                                                                                                                              • パートナー概要
                                                                                                                                              • パートナープログラム
                                                                                                                                              • パートナーを探す
                                                                                                                                              • パートナースポットライト
                                                                                                                                              • クラウドプロバイダー
                                                                                                                                              • パートナーソリューション
                                                                                                                                              製品
                                                                                                                                              レイクハウスプラットフォーム
                                                                                                                                              • プラットフォーム
                                                                                                                                              • 共有
                                                                                                                                              • データガバナンス
                                                                                                                                              • 人工知能(AI)
                                                                                                                                              • BI
                                                                                                                                              • データベース
                                                                                                                                              • データ管理
                                                                                                                                              • データウェアハウス
                                                                                                                                              • データエンジニアリング
                                                                                                                                              • データサイエンス
                                                                                                                                              • アプリケーション開発
                                                                                                                                              ご利用料金
                                                                                                                                              • 料金設定の概要
                                                                                                                                              • 料金計算ツール
                                                                                                                                              オープンソース
                                                                                                                                              統合とデータ
                                                                                                                                              • マーケットプレイス
                                                                                                                                              • IDE 統合
                                                                                                                                              • パートナーコネクト
                                                                                                                                              レイクハウスプラットフォーム
                                                                                                                                              • プラットフォーム
                                                                                                                                              • 共有
                                                                                                                                              • データガバナンス
                                                                                                                                              • 人工知能(AI)
                                                                                                                                              • BI
                                                                                                                                              • データベース
                                                                                                                                              • データ管理
                                                                                                                                              • データウェアハウス
                                                                                                                                              • データエンジニアリング
                                                                                                                                              • データサイエンス
                                                                                                                                              • アプリケーション開発
                                                                                                                                              ご利用料金
                                                                                                                                              • 料金設定の概要
                                                                                                                                              • 料金計算ツール
                                                                                                                                              統合とデータ
                                                                                                                                              • マーケットプレイス
                                                                                                                                              • IDE 統合
                                                                                                                                              • パートナーコネクト
                                                                                                                                              ソリューション
                                                                                                                                              業種別
                                                                                                                                              • 通信
                                                                                                                                              • 金融サービス
                                                                                                                                              • 医療・ライフサイエンス
                                                                                                                                              • 製造
                                                                                                                                              • メディア・エンタメ
                                                                                                                                              • 官公庁・公共機関
                                                                                                                                              • リテール・消費財
                                                                                                                                              • 全て表示
                                                                                                                                              クロスインダストリーソリューション
                                                                                                                                              • サイバーセキュリティ
                                                                                                                                              • マーケティング
                                                                                                                                              データの移行
                                                                                                                                              プロフェッショナルサービス
                                                                                                                                              ソリューションアクセラレータ
                                                                                                                                              業種別
                                                                                                                                              • 通信
                                                                                                                                              • 金融サービス
                                                                                                                                              • 医療・ライフサイエンス
                                                                                                                                              • 製造
                                                                                                                                              • メディア・エンタメ
                                                                                                                                              • 官公庁・公共機関
                                                                                                                                              • リテール・消費財
                                                                                                                                              • 全て表示
                                                                                                                                              クロスインダストリーソリューション
                                                                                                                                              • サイバーセキュリティ
                                                                                                                                              • マーケティング
                                                                                                                                              リソース
                                                                                                                                              ドキュメント
                                                                                                                                              カスタマーサポート
                                                                                                                                              コミュニティ
                                                                                                                                              トレーニング・認定試験
                                                                                                                                              • トレーニング
                                                                                                                                              • 認定
                                                                                                                                              • 無料版
                                                                                                                                              • 大学との連携
                                                                                                                                              • Databricks アカデミー
                                                                                                                                              イベント
                                                                                                                                              • DATA+AI サミット
                                                                                                                                              • Data+AI ワールドツアー
                                                                                                                                              • AI Days
                                                                                                                                              • イベントカレンダー
                                                                                                                                              ブログ・ポッドキャスト
                                                                                                                                              • Databricks ブログ
                                                                                                                                              • Databricks Mosaic AIリサーチブログ
                                                                                                                                              • Data Brew ポッドキャスト
                                                                                                                                              • Data+AI のチャンピオンシリーズ
                                                                                                                                              トレーニング・認定試験
                                                                                                                                              • トレーニング
                                                                                                                                              • 認定
                                                                                                                                              • 無料版
                                                                                                                                              • 大学との連携
                                                                                                                                              • Databricks アカデミー
                                                                                                                                              イベント
                                                                                                                                              • DATA+AI サミット
                                                                                                                                              • Data+AI ワールドツアー
                                                                                                                                              • AI Days
                                                                                                                                              • イベントカレンダー
                                                                                                                                              ブログ・ポッドキャスト
                                                                                                                                              • Databricks ブログ
                                                                                                                                              • Databricks Mosaic AIリサーチブログ
                                                                                                                                              • Data Brew ポッドキャスト
                                                                                                                                              • Data+AI のチャンピオンシリーズ
                                                                                                                                              企業情報
                                                                                                                                              企業概要
                                                                                                                                              • Databricks について
                                                                                                                                              • 経営陣
                                                                                                                                              • Databricks Ventures
                                                                                                                                              • ご相談・お問い合わせ
                                                                                                                                              採用情報
                                                                                                                                              • 採用情報概要
                                                                                                                                              • 求人情報
                                                                                                                                              プレス・ニュース記事
                                                                                                                                              • ニュースルーム
                                                                                                                                              • 受賞歴と業界評価
                                                                                                                                              セキュリティと信頼
                                                                                                                                              企業概要
                                                                                                                                              • Databricks について
                                                                                                                                              • 経営陣
                                                                                                                                              • Databricks Ventures
                                                                                                                                              • ご相談・お問い合わせ
                                                                                                                                              採用情報
                                                                                                                                              • 採用情報概要
                                                                                                                                              • 求人情報
                                                                                                                                              プレス・ニュース記事
                                                                                                                                              • ニュースルーム
                                                                                                                                              • 受賞歴と業界評価
                                                                                                                                              databricks logo

                                                                                                                                              Databricks Inc.
                                                                                                                                              160 Spear Street, 15th Floor
                                                                                                                                              San Francisco, CA 94105
                                                                                                                                              1-866-330-0121

                                                                                                                                              採用情報

                                                                                                                                              © Databricks 2026. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.

                                                                                                                                              • プライバシー通知
                                                                                                                                              • |利用規約
                                                                                                                                              • |現代奴隷法に関する声明
                                                                                                                                              • |カリフォルニア州のプライバシー権利
                                                                                                                                              • |プライバシー設定