Spark SQL
用語集のトップページへApache Spark SQL とは
Spark SQL は、Spark での SQL のネイティブサポートを可能にし、RDD(Sparkの分散データセット)や外部ソースに保存されたデータのクエリ処理を効率化します。また、RDD をリレーショナルテーブルと同様に処理することが可能です。このような優れた抽象化の統合により、開発者は複雑な分析で外部データをクエリする SQL コマンドを、容易に、単一のアプリケーション内に混在させることができます。具体的には、Spark SQL で開発者は次のことができるようになります。- Parquet ファイルや Hive テーブルからのリレーショナルデータのインポート
- インポートされたデータと既存の RDD に対する SQL クエリの実行
- Hive テーブルや Parquet ファイルへの容易な RDD の書き出し
関連リソース
用語集のトップページへ