メインコンテンツへジャンプ

マネージド Spark

Databricks 無料トライアル

マネージドSparkとは

マネージド Spark は、バッチ処理、クエリ、ストリーミング、機械学習などのオープンソースのデータツールを利用できるマネージドサービスです。ユーザーは、このような自動化を使用することで、オンデマンドでクラスタの迅速な作成や管理を容易にし、タスクが完了したときにクラスタをオフにすることができます。ワークロード、パフォーマンス要件、または既存のリソースに基づいてクラスタのサイズを設定することも可能です。さらに、数秒で柔軟にスケールアップ・ダウンできる、完全に管理された Spark クラスタへのアクセス権が付与されます。これは、ジョブの処理中でも実行できます。さらに、ユーザーは不要になったらクラスタをオフにすることで、コストを節約できます。マネージド Spark プロバイダーは、プロビジョニングを行い、全てのジョブのクラスタを保持する代わりに、一時クラスタを作成します。通常、マスターノードとワーカーノードを持つマシンのクラスタを使用します。マネージド Spark のサービスを採用することで、組織は貴重なリソースを運用ではなく分析に活用することができ、データから価値を引き出す作業に集中できるようになります。Managed Spark:マネージドSpark

マネージドSparkサービスを採用するメリット

クラスタ管理の自動化

特定のジョブのニーズに応じて管理された展開、ログ記録、および監視によって、クラスタに焦点を当てるのではなく、データに集中できます。安定性、拡張性のある高速なクラスタで分析作業ができます。

サイズ変更可能なクラスタ

クラスタを迅速に作成およびスケーリングするため、Spark クラスタの構築と構成による大量のリソース消費を心配する必要はありません。ノードは不要になった時点で自動的に解放され、スケーリングは必要に応じて実行されます。

開発者ツール

通常、クラスタを管理する方法は複数用意されています。

自動/手動の構成

クラスタ上のハードウェアとソフトウェアは自動的に設定されますが、手動での制御も可能です。

シンプルな管理

YARNリソースマネージャーなどのツールの使用により、クラスタやリソース割り当ての優先順位付けや管理をシンプルにします。

費用対効果

従量課金制のため、ユーザーは、プロセス中に消費されるコンピューティングリソースに対してのみ料金を支払います。

FAQ

マネージドSparkとは何ですか?
Sparkクラスタを自動で作成・管理し、分析や機械学習に集中できるようにするマネージドサービスです。

利用するメリットは?
クラスタ管理の自動化、動的スケーリング、コスト最適化、従量課金による柔軟性が挙げられます。

どのような利用者に適していますか?
大規模データ処理を行うが、クラスタ運用よりもデータ分析や開発にリソースを集中したい組織に最適です。

関連資料

用語集に戻る