メインコンテンツへジャンプ
ログイン
      • Databricks を知る
        • For App Developers
          • エグゼクティブ向け
            • スタートアップ向け
              • レイクハウスアーキテクチャ
                • Databricks AIリサーチ
                • 導入事例
                  • 注目の導入事例
                  • パートナー
                    • パートナー概要
                      Databricks パートナー エコシステムの詳細
                      • パートナースポットライト
                        注目のパートナーの発表
                        • パートナープログラム
                          特典、レベル、パートナーになる方法をご覧ください
                          • クラウドプロバイダー
                            AWS、Azure、GCP 上の Databricks
                            • パートナーを探す
                              ニーズに合った Databricks パートナーを見つける
                              • パートナーソリューション
                                業界別および移行ソリューションを見つける
                              • Databricks プラットフォーム
                                • プラットフォームの概要
                                  データ・分析・AI のための統合プラットフォーム
                                  • データ管理
                                    データの信頼性・セキュリティ・パフォーマンス
                                    • 共有
                                      オープン、セキュア、ゼロコピーでのデータ共有
                                      • データウェアハウジング
                                        バッチ、ストリーミングデータのための ETL とオーケストレーション
                                        • ガバナンス
                                          データ・分析・AI のための統合ガバナンス
                                          • データエンジニアリング
                                            バッチ、ストリーミングデータのための ETL とオーケストレーション
                                            • 人工知能(AI)
                                              ML と生成 AI アプリケーションの構築とデプロイメント
                                              • データサイエンス
                                                データサイエンスの大規模な連携
                                                • BI
                                                  実世界データのインテリジェント分析
                                                  • アプリケーション開発
                                                    安全なデータと AI アプリを迅速に構築
                                                    • Database
                                                      Postgres for data apps and AI agents
                                                      • セキュリティ
                                                        AI時代のために構築されたオープンなエージェント型SIEM
                                                      • 統合とデータ
                                                        • マーケットプレイス
                                                          データ、分析、AI のためのオープンマーケットプレイス
                                                          • IDE 統合
                                                            お気に入りの IDE(統合開発環境)でレイクハウスを構築
                                                            • パートナーコネクト
                                                              Databricks エコシステムの検索と統合
                                                            • ご利用料金
                                                              • Databricks のご利用料金
                                                                料金設定、DBU、その他
                                                                • コスト計算ツール
                                                                  クラウド利用でのコンピュートコストの試算
                                                                • オープンソース
                                                                  • オープンソーステクノロジー
                                                                    プラットフォームを支えるイノベーションをもっと詳しく
                                                                  • 業界向け Databricks
                                                                    • 通信
                                                                      • メディア・エンターテイメント
                                                                        • 金融サービス
                                                                          • 官公庁・公共機関
                                                                            • 医療・ライフサイエンス
                                                                              • リテール・消費財
                                                                                • 製造
                                                                                  • 全て見る
                                                                                  • クロスインダストリーソリューション
                                                                                    • AI Agents
                                                                                      • AI ガバナンス
                                                                                        • サイバーセキュリティ
                                                                                          • マーケティング
                                                                                          • 移行・デプロイメント
                                                                                            • データの移行
                                                                                              • プロフェッショナルサービス
                                                                                              • ソリューションアクセラレータ
                                                                                                • ソリューションアクセラレータ一覧
                                                                                                  成果を加速
                                                                                                • トレーニング・認定試験
                                                                                                  • トレーニング概要
                                                                                                    ニーズに合わせたカリキュラムを探す
                                                                                                    • Databricks アカデミー
                                                                                                      Databricks ラーニングプラットフォームにサインインする
                                                                                                      • 認定
                                                                                                        スキル・認定で差別化を図る
                                                                                                        • 無料版
                                                                                                          専門家向けデータとAIツールを無料で学べます
                                                                                                          • 大学との連携
                                                                                                            Databricks を教材として活用
                                                                                                          • イベント
                                                                                                            • DATA+AI サミット
                                                                                                              • Data+AI ワールドツアー
                                                                                                                • AI Days
                                                                                                                  • イベントカレンダー
                                                                                                                  • ブログ・ポッドキャスト
                                                                                                                    • Databricks ブログ
                                                                                                                      最新情報、製品発表、その他の情報
                                                                                                                      • AI ブログ
                                                                                                                        当社のAI研究とエンジニアリングの取り組みをご覧ください
                                                                                                                        • Data Brew ポッドキャスト
                                                                                                                          ご相談・お問い合わせ
                                                                                                                          • ポッドキャスト:Data+AI のチャンピオン
                                                                                                                            イノベーションを支えるデータリーダーのインサイト
                                                                                                                          • お役立ちリソース
                                                                                                                            • カスタマーサポート
                                                                                                                              • ドキュメント
                                                                                                                                • コミュニティ
                                                                                                                                • もっと詳しく
                                                                                                                                  • リソースセンター
                                                                                                                                    • デモセンター
                                                                                                                                      • アーキテクチャ センター
                                                                                                                                      • 企業概要
                                                                                                                                        • Databricks について
                                                                                                                                          • 経営陣
                                                                                                                                            • Databricks Ventures
                                                                                                                                              • ご相談・お問い合わせ
                                                                                                                                              • 採用情報
                                                                                                                                                • 採用情報概要
                                                                                                                                                  • 求人情報
                                                                                                                                                  • プレス・ニュース記事
                                                                                                                                                    • ニュースルーム
                                                                                                                                                      • 受賞歴と業界評価
                                                                                                                                                      • セキュリティと信頼
                                                                                                                                                        • セキュリティと信頼
                                                                                                                                                    • 是非ご検討ください!
                                                                                                                                                    • デモを見る
                                                                                                                                                    • ログイン
                                                                                                                                                    • Databricks 無料トライアル
                                                                                                                                                    1. すべてのブログ
                                                                                                                                                    2. /
                                                                                                                                                      プラットフォーム
                                                                                                                                                    • Databricksは、オープンソースでのVariantの取り組みを主導しています
                                                                                                                                                    • Variant とシュレッディングの仕組み
                                                                                                                                                    • 半構造化データに対する高速なパフォーマンス
                                                                                                                                                    • 今すぐ Variant をお試しください
                                                                                                                                                    • Databricksは、オープンソースでのVariantの取り組みを主導しています
                                                                                                                                                    • Variant とシュレッディングの仕組み
                                                                                                                                                    • 半構造化データに対する高速なパフォーマンス
                                                                                                                                                    • 今すぐ Variant をお試しください
                                                                                                                                                    製品
                                                                                                                                                    2025年10月10日

                                                                                                                                                    Variant のご紹介:Apache Parquet™、Delta Lake、Apache Iceberg™ における半構造化データのための新しいオープン標準

                                                                                                                                                    によって ジーン・パン, デビッド・キャッシュマン, Ryan Blue 、 Aniruth Narayanan による投稿

                                                                                                                                                    • 半構造化データのネイティブデータ型であるVariantが、Apache Parquet™コミュニティで承認され、Delta Lake、Apache Iceberg™、Apache Spark™でサポートされるようになりました
                                                                                                                                                    • Variantデータ内で頻繁に出現するフィールドを列形式化する技術であるShreddingにより、通常のVariantを使用する場合と比較して読み取りパフォーマンスが8倍、文字列を使用する場合と比較して30倍向上します
                                                                                                                                                    • VariantのShreddingはDatabricksのDBR 17.2+(DBSQL 2025.30+)でサポートされており、JSON、CSV、XMLソースから簡単に取り込むための関数が用意されています

                                                                                                                                                    半構造化データは、AI、アプリケーション ログ、テレメトリなど、あらゆる場所で利用されています。このデータは便利ですが、スキーマが変化するため、保存とクエリが困難になります。長年にわたり、このデータを文字列として保存するのが一般的な方法でした。文字列は柔軟性がありましたが、エンジンが文字列全体を解析して検索する必要があるため、クエリのパフォーマンスが低いという問題がありました。

                                                                                                                                                    Apache Parquet™で承認されたVariantデータ型は、異なるアプローチを取ります。クエリに対して柔軟かつ高いパフォーマンスを発揮する、コンパクトなバイナリ形式でデータを格納します。このアプローチは特定のエンジンや形式に縛られません。Variantは、Apache Spark™、Delta Lake、Apache Iceberg™でサポートされている、レイクハウス全体における半構造化データのためのオープンスタンダードです。

                                                                                                                                                    このブログ記事で取り上げるトピック:

                                                                                                                                                    • Variant のオープン標準への投資
                                                                                                                                                    • Variant とシュレッディングの仕組み
                                                                                                                                                    • 半構造化データに対する高速なパフォーマンス

                                                                                                                                                    Databricksは、オープンソースでのVariantの取り組みを主導しています

                                                                                                                                                    昨年、私たちはオープンソースコミュニティと協力し、Apache Spark™とDelta LakeにVariantを導入しました。この新しいデータ型は、半構造化データを文字列(パフォーマンスが低い)や構造体(柔軟性がない)として格納する場合と比較して、柔軟性とパフォーマンスの両方を提供します。

                                                                                                                                                    Variant の登場後すぐに、Apache Iceberg™ や Apache Arrow™ をはじめとする他の主要なオープンソースプロジェクトからも関心が寄せられました。エコシステムを統一するため、私たちは Variant 型を Parquet に直接組み込み、Spark 実装を Parquet-java オープンソースプロジェクトに移行することで、すべてのエンジンとフォーマットに Variant を導入することを提案し、9,600 行以上のコードをコントリビュートしました。これにより、すべてのオープンテーブルフォーマットで Variant データ型を簡単に活用できます。

                                                                                                                                                    VariantがParquetコミュニティ内で承認されたことで、レイクハウスエコシステム全体が、半構造化データのための標準的でオープンなデータ型を持つことになります。Variantはすでにオープンなテーブルフォーマットでサポートされています。Deltaは昨年からVariantのサポートを含んでおり、昨年5月にはIcebergがv3を承認し、これにはVariantのサポートが含まれています。その結果、DeltaまたはIcebergを利用するユーザーは、Variantの柔軟性とパフォーマンスの恩恵を受けられるようになりました。

                                                                                                                                                    Databricksは、オープンソースでのVariantの取り組みを主導しています

                                                                                                                                                    Parquet Variant のアーティファクトには以下が含まれます:

                                                                                                                                                    • Variant バイナリエンコーディング仕様
                                                                                                                                                    • Variant シュレッディング仕様 (Variant データをより効率的に保存するための手法)
                                                                                                                                                    • Parquetリリースバージョン2.12.0とParquet Java実装1.16.0

                                                                                                                                                    VariantをサポートするDeltaおよびIcebergプロトコルは次のとおりです。

                                                                                                                                                    • Variant をサポートする Delta Lake プロトコル
                                                                                                                                                    • VariantをサポートするIceberg V3プロトコル

                                                                                                                                                    Apache Parquet™、Apache Spark™、Apache Iceberg™、Delta Lake、Apache Arrow™など、多くのオープンソースコミュニティへの貢献に対し、関与したすべての個人および組織に感謝の意を表します。

                                                                                                                                                    Variant とシュレッディングの仕組み

                                                                                                                                                    Variantは、バイナリエンコーディング形式を使用して、データストレージのための柔軟なインターフェースを提供します。また、Variantには、パフォーマンスを向上させるためにVariantをより効率的に格納する技術である、shredding(シュレッディング)スキームもあります。

                                                                                                                                                    バイナリエンコーディングフォーマット

                                                                                                                                                    Variantデータ型は、効率的なバイナリエンコーディングスキームを利用して半構造化データを表現します。データをプレーンテキスト値(JSONなど)として格納する代わりに、Variantデータは、効率的なナビゲーションを優先するバイナリ形式で値と構造をエンコードします。

                                                                                                                                                    JSON文字列をナビゲートするには、関連するフィールドを見つけるためにJSONオブジェクト全体を読み取って処理する必要があります。Variantバイナリエンコーディングでは、Variant値内の他の場所へのオフセットを使用して、データの構造がエンコードされます。これらのオフセットを使用すると、Variant構造をナビゲートするのに値全体を読み取ったり処理したりする必要がありません。このオフセットベースのナビゲーションにより、半構造化データの処理パフォーマンスが大幅に向上します。

                                                                                                                                                    バイナリエンコーディングフォーマット

                                                                                                                                                    この例は、パス order.item.name への移動では、オフセットを使用して Variant 値のごく一部を調べるだけで済むことを示しています。これにより、処理/解析するデータ量が削減され、パフォーマンスの向上につながります。

                                                                                                                                                    Shredding(シュレッディング)

                                                                                                                                                    Shreddingは、Variant値から共通のフィールドを自動的に抽出します。これらのフィールドは、同じ列内に個別の型付きチャンクとして格納されます。Shreddingを使用しない場合、Variant値全体が単一の「バイナリBLOB」としてファイルに格納されます。

                                                                                                                                                    VariantのShreddingには、パフォーマンス上の利点がいくつかあります。

                                                                                                                                                    • I/O のプルーニング:フィールドが個別に格納されている場合、クエリに必要なフィールドのみがフェッチされます。つまり、クエリで Variant フィールドのごく一部しか必要ない場合、I/O もごく一部で済みます。
                                                                                                                                                    • データスキッピング: シュレッドされたフィールドが個別の Parquet チャンクとして保存されると、エンジンは Parquet のすべての最適化機能を利用して、行グループと列ページを効率的にスキップできます。
                                                                                                                                                    • 圧縮: シュレッドされたフィールドはカラム型であるため、データをより効率的に圧縮でき、ストレージサイズを削減できます。

                                                                                                                                                    シュレッディングにより、共通のフィールドが自動的に抽出されます。

                                                                                                                                                    この例は、Shreddingを使用すると、スキャンはクエリに必要な列のみを読み取るだけで済むことを示しています。スキャンはParquetの列統計を使用するため、無関係な行グループを完全にスキップできます。Shreddingされたファイルを読み取ることで、不要な処理を回避し、パフォーマンスが向上します。

                                                                                                                                                    半構造化データに対する高速なパフォーマンス

                                                                                                                                                    Variantのバイナリ形式とShredding技術により、半構造化データをJSON文字列として格納する場合と比較して、パフォーマンスが大幅に向上します。私たちはTPC-DSベースの半構造化データを使用して、Variantと文字列表現を比較するためのパフォーマンスベンチマークを実施しました。

                                                                                                                                                    半構造化データに対する高速なパフォーマンス

                                                                                                                                                    JSONを文字列として保存する場合と比較して、Variantは8倍高速な読み取りパフォーマンスを発揮します。シュレッディングにより、Variant の書き込みは 20%~50% 遅くなりますが、読み取りは 30 倍高速になり、そのパフォーマンスと効率の高さを示しています。

                                                                                                                                                    今すぐ Variant をお試しください

                                                                                                                                                    ネイティブのParquet、Delta、Icebergのサポートにより、Variantデータ型は、半構造化データのためのオープンで標準化されたデータ型となります。複雑なETLや脆弱なパース処理が不要になることで、Variantはユーザーがデータを迅速、簡単、かつ確実に分析できるようにします。

                                                                                                                                                    Variant列を持つテーブルの作成は簡単です。

                                                                                                                                                    Variant データをロードするため、Databricks は JSON、XML、CSV からの Variant 取り込み関数をサポートしています:

                                                                                                                                                    VariantのShreddingは、DBR 17.2+(DBSQL 2025.30+)でサポートされており、DeltaおよびIcebergテーブルで利用できます。これにより、コードを変更することなくクエリのパフォーマンスが向上します。

                                                                                                                                                    Variantに関する次回の投稿にご期待ください。実践的な例を交えながら、お客様の事例をご紹介します。

                                                                                                                                                    最高のデータウェアハウスはレイクハウスであるという考えのもと、パフォーマンス、シンプルさ、価値を重視することが Databricks SQL の基盤です。Databricks SQL の詳細については、ウェブサイト、ドキュメント、または製品ツアーをご覧ください。Databricks SQL は、高性能、低コスト、かつサーバーレスなデータウェアハウスです — 今すぐ無料でお試しいただけます。

                                                                                                                                                    最新の投稿を受信トレイで受け取る

                                                                                                                                                    ブログを購読して、最新の投稿を受信トレイにお届けします。

                                                                                                                                                    Sign up

                                                                                                                                                    すべてのブログを見る
                                                                                                                                                    databricks logo
                                                                                                                                                    Databricks を選ぶ理由
                                                                                                                                                    Databricks を選ぶ理由
                                                                                                                                                    • For App Developers
                                                                                                                                                    • エグゼクティブ向け
                                                                                                                                                    • スタートアップ向け
                                                                                                                                                    • レイクハウスアーキテクチャ
                                                                                                                                                    • Databricks AIリサーチ
                                                                                                                                                    導入事例
                                                                                                                                                    • 注目の導入事例
                                                                                                                                                    パートナー
                                                                                                                                                    • パートナー概要
                                                                                                                                                    • パートナープログラム
                                                                                                                                                    • パートナーを探す
                                                                                                                                                    • パートナースポットライト
                                                                                                                                                    • クラウドプロバイダー
                                                                                                                                                    • パートナーソリューション
                                                                                                                                                    Databricks を選ぶ理由
                                                                                                                                                    • For App Developers
                                                                                                                                                    • エグゼクティブ向け
                                                                                                                                                    • スタートアップ向け
                                                                                                                                                    • レイクハウスアーキテクチャ
                                                                                                                                                    • Databricks AIリサーチ
                                                                                                                                                    導入事例
                                                                                                                                                    • 注目の導入事例
                                                                                                                                                    パートナー
                                                                                                                                                    • パートナー概要
                                                                                                                                                    • パートナープログラム
                                                                                                                                                    • パートナーを探す
                                                                                                                                                    • パートナースポットライト
                                                                                                                                                    • クラウドプロバイダー
                                                                                                                                                    • パートナーソリューション
                                                                                                                                                    製品
                                                                                                                                                    レイクハウスプラットフォーム
                                                                                                                                                    • プラットフォーム
                                                                                                                                                    • 共有
                                                                                                                                                    • データガバナンス
                                                                                                                                                    • 人工知能(AI)
                                                                                                                                                    • BI
                                                                                                                                                    • Database
                                                                                                                                                    • データ管理
                                                                                                                                                    • データウェアハウス
                                                                                                                                                    • データエンジニアリング
                                                                                                                                                    • データサイエンス
                                                                                                                                                    • アプリケーション開発
                                                                                                                                                    • セキュリティ
                                                                                                                                                    ご利用料金
                                                                                                                                                    • 料金設定の概要
                                                                                                                                                    • 料金計算ツール
                                                                                                                                                    オープンソース
                                                                                                                                                    統合とデータ
                                                                                                                                                    • マーケットプレイス
                                                                                                                                                    • IDE 統合
                                                                                                                                                    • パートナーコネクト
                                                                                                                                                    レイクハウスプラットフォーム
                                                                                                                                                    • プラットフォーム
                                                                                                                                                    • 共有
                                                                                                                                                    • データガバナンス
                                                                                                                                                    • 人工知能(AI)
                                                                                                                                                    • BI
                                                                                                                                                    • Database
                                                                                                                                                    • データ管理
                                                                                                                                                    • データウェアハウス
                                                                                                                                                    • データエンジニアリング
                                                                                                                                                    • データサイエンス
                                                                                                                                                    • アプリケーション開発
                                                                                                                                                    • セキュリティ
                                                                                                                                                    ご利用料金
                                                                                                                                                    • 料金設定の概要
                                                                                                                                                    • 料金計算ツール
                                                                                                                                                    統合とデータ
                                                                                                                                                    • マーケットプレイス
                                                                                                                                                    • IDE 統合
                                                                                                                                                    • パートナーコネクト
                                                                                                                                                    ソリューション
                                                                                                                                                    業種別
                                                                                                                                                    • 通信
                                                                                                                                                    • 金融サービス
                                                                                                                                                    • 医療・ライフサイエンス
                                                                                                                                                    • 製造
                                                                                                                                                    • メディア・エンタメ
                                                                                                                                                    • 官公庁・公共機関
                                                                                                                                                    • リテール・消費財
                                                                                                                                                    • 全て表示
                                                                                                                                                    クロスインダストリーソリューション
                                                                                                                                                    • AI エージェント
                                                                                                                                                    • AI ガバナンス
                                                                                                                                                    • サイバーセキュリティ
                                                                                                                                                    • マーケティング
                                                                                                                                                    データの移行
                                                                                                                                                    プロフェッショナルサービス
                                                                                                                                                    ソリューションアクセラレータ
                                                                                                                                                    業種別
                                                                                                                                                    • 通信
                                                                                                                                                    • 金融サービス
                                                                                                                                                    • 医療・ライフサイエンス
                                                                                                                                                    • 製造
                                                                                                                                                    • メディア・エンタメ
                                                                                                                                                    • 官公庁・公共機関
                                                                                                                                                    • リテール・消費財
                                                                                                                                                    • 全て表示
                                                                                                                                                    クロスインダストリーソリューション
                                                                                                                                                    • AI エージェント
                                                                                                                                                    • AI ガバナンス
                                                                                                                                                    • サイバーセキュリティ
                                                                                                                                                    • マーケティング
                                                                                                                                                    リソース
                                                                                                                                                    ドキュメント
                                                                                                                                                    カスタマーサポート
                                                                                                                                                    コミュニティ
                                                                                                                                                    トレーニング・認定試験
                                                                                                                                                    • トレーニング
                                                                                                                                                    • 認定
                                                                                                                                                    • 無料版
                                                                                                                                                    • 大学との連携
                                                                                                                                                    • Databricks アカデミー
                                                                                                                                                    イベント
                                                                                                                                                    • DATA+AI サミット
                                                                                                                                                    • Data+AI ワールドツアー
                                                                                                                                                    • AI Days
                                                                                                                                                    • イベントカレンダー
                                                                                                                                                    ブログ・ポッドキャスト
                                                                                                                                                    • Databricks ブログ
                                                                                                                                                    • AI ブログ
                                                                                                                                                    • Data Brew ポッドキャスト
                                                                                                                                                    • Data+AI のチャンピオンシリーズ
                                                                                                                                                    トレーニング・認定試験
                                                                                                                                                    • トレーニング
                                                                                                                                                    • 認定
                                                                                                                                                    • 無料版
                                                                                                                                                    • 大学との連携
                                                                                                                                                    • Databricks アカデミー
                                                                                                                                                    イベント
                                                                                                                                                    • DATA+AI サミット
                                                                                                                                                    • Data+AI ワールドツアー
                                                                                                                                                    • AI Days
                                                                                                                                                    • イベントカレンダー
                                                                                                                                                    ブログ・ポッドキャスト
                                                                                                                                                    • Databricks ブログ
                                                                                                                                                    • AI ブログ
                                                                                                                                                    • Data Brew ポッドキャスト
                                                                                                                                                    • Data+AI のチャンピオンシリーズ
                                                                                                                                                    企業情報
                                                                                                                                                    企業概要
                                                                                                                                                    • Databricks について
                                                                                                                                                    • 経営陣
                                                                                                                                                    • Databricks Ventures
                                                                                                                                                    • ご相談・お問い合わせ
                                                                                                                                                    採用情報
                                                                                                                                                    • 採用情報概要
                                                                                                                                                    • 求人情報
                                                                                                                                                    プレス・ニュース記事
                                                                                                                                                    • ニュースルーム
                                                                                                                                                    • 受賞歴と業界評価
                                                                                                                                                    セキュリティと信頼
                                                                                                                                                    企業概要
                                                                                                                                                    • Databricks について
                                                                                                                                                    • 経営陣
                                                                                                                                                    • Databricks Ventures
                                                                                                                                                    • ご相談・お問い合わせ
                                                                                                                                                    採用情報
                                                                                                                                                    • 採用情報概要
                                                                                                                                                    • 求人情報
                                                                                                                                                    プレス・ニュース記事
                                                                                                                                                    • ニュースルーム
                                                                                                                                                    • 受賞歴と業界評価
                                                                                                                                                    databricks logo

                                                                                                                                                    Databricks Inc.
                                                                                                                                                    160 Spear Street, 15th Floor
                                                                                                                                                    San Francisco, CA 94105
                                                                                                                                                    1-866-330-0121

                                                                                                                                                    採用情報

                                                                                                                                                    © Databricks 2026. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.

                                                                                                                                                    • プライバシー通知
                                                                                                                                                    • |利用規約
                                                                                                                                                    • |現代奴隷法に関する声明
                                                                                                                                                    • |カリフォルニア州のプライバシー権利
                                                                                                                                                    • |プライバシー設定