メインコンテンツへジャンプ
ログイン
      • Databricks を知る
        • エグゼクティブ向け
          • スタートアップ向け
            • レイクハウスアーキテクチャ
              • Mosaic Research
              • 導入事例
                • 注目の導入事例
                • パートナー
                  • クラウドプロバイダ
                    Databricks on AWS、Azure、GCP
                    • コンサルティング・SI
                      Databricks の構築・デプロイ、Databricks への移行のエキスパート
                      • 技術パートナー
                        既存のツールをレイクハウスに接続
                        • C&SI パートナー
                          レイクハウスの構築・デプロイメント、レイクハウスへの移行
                          • データパートナー
                            データコンシューマーのエコシステムにアクセス
                            • パートナーソリューション
                              業界・移行のニーズに応じたカスタムソリューション
                              • Databricks で構築
                                ビジネスの創造・マーケティング・成長
                              • Databricks プラットフォーム
                                • プラットフォームの概要
                                  データ・分析・AI のための統合プラットフォーム
                                  • データ管理
                                    データの信頼性・セキュリティ・パフォーマンス
                                    • 共有
                                      オープン、セキュア、ゼロコピーでのデータ共有
                                      • データウェアハウジング
                                        バッチ、ストリーミングデータのための ETL とオーケストレーション
                                        • ガバナンス
                                          データ・分析・AI のための統合ガバナンス
                                          • データエンジニアリング
                                            バッチ、ストリーミングデータのための ETL とオーケストレーション
                                            • 人工知能(AI)
                                              ML と生成 AI アプリケーションの構築とデプロイメント
                                              • データサイエンス
                                                データサイエンスの大規模な連携
                                                • BI
                                                  実世界データのインテリジェント分析
                                                  • アプリケーション開発
                                                    安全なデータと AI アプリを迅速に構築
                                                    • データベース
                                                      データアプリとAIエージェントのための Postgres
                                                    • 統合とデータ
                                                      • マーケットプレイス
                                                        データ、分析、AI のためのオープンマーケットプレイス
                                                        • IDE 統合
                                                          お気に入りの IDE(統合開発環境)でレイクハウスを構築
                                                          • パートナーコネクト
                                                            Databricks エコシステムの検索と統合
                                                          • ご利用料金
                                                            • Databricks のご利用料金
                                                              料金設定、DBU、その他
                                                              • コスト計算ツール
                                                                クラウド利用でのコンピュートコストの試算
                                                              • オープンソース
                                                                • オープンソーステクノロジー
                                                                  プラットフォームを支えるイノベーションをもっと詳しく
                                                                • 業界向け Databricks
                                                                  • 通信
                                                                    • メディア・エンターテイメント
                                                                      • 金融サービス
                                                                        • 官公庁・公共機関
                                                                          • 医療・ライフサイエンス
                                                                            • リテール・消費財
                                                                              • 製造
                                                                                • 全て見る
                                                                                • クロスインダストリーソリューション
                                                                                  • AI Agents
                                                                                    • サイバーセキュリティ
                                                                                      • マーケティング
                                                                                      • 移行・デプロイメント
                                                                                        • データの移行
                                                                                          • プロフェッショナルサービス
                                                                                          • ソリューションアクセラレータ
                                                                                            • ソリューションアクセラレータ一覧
                                                                                              成果を加速
                                                                                            • トレーニング・認定試験
                                                                                              • トレーニング概要
                                                                                                ニーズに合わせたカリキュラムを探す
                                                                                                • Databricks アカデミー
                                                                                                  Databricks ラーニングプラットフォームにサインインする
                                                                                                  • 認定
                                                                                                    スキル・認定で差別化を図る
                                                                                                    • 無料版
                                                                                                      専門家向けデータとAIツールを無料で学べます
                                                                                                      • 大学との連携
                                                                                                        Databricks を教材として活用
                                                                                                      • イベント
                                                                                                        • DATA+AI サミット
                                                                                                          • Data+AI ワールドツアー
                                                                                                            • AI Days
                                                                                                              • イベントカレンダー
                                                                                                              • ブログ・ポッドキャスト
                                                                                                                • Databricks ブログ
                                                                                                                  最新情報、製品発表、その他の情報
                                                                                                                  • Databricks Mosaic AIリサーチブログ
                                                                                                                    AI世代に関する最新リサーチ
                                                                                                                    • Data Brew ポッドキャスト
                                                                                                                      ご相談・お問い合わせ
                                                                                                                      • ポッドキャスト:Data+AI のチャンピオン
                                                                                                                        イノベーションを支えるデータリーダーのインサイト
                                                                                                                      • お役立ちリソース
                                                                                                                        • カスタマーサポート
                                                                                                                          • ドキュメント
                                                                                                                            • コミュニティ
                                                                                                                            • もっと詳しく
                                                                                                                              • リソースセンター
                                                                                                                                • デモセンター
                                                                                                                                  • アーキテクチャ センター
                                                                                                                                  • 企業概要
                                                                                                                                    • Databricks について
                                                                                                                                      • 経営陣
                                                                                                                                        • Databricks Ventures
                                                                                                                                          • ご相談・お問い合わせ
                                                                                                                                          • 採用情報
                                                                                                                                            • 採用情報概要
                                                                                                                                              • 求人情報
                                                                                                                                              • プレス・ニュース記事
                                                                                                                                                • ニュースルーム
                                                                                                                                                  • 受賞歴と業界評価
                                                                                                                                                  • セキュリティと信頼
                                                                                                                                                    • セキュリティと信頼
                                                                                                                                                • 是非ご検討ください!
                                                                                                                                                • デモを見る
                                                                                                                                                • ログイン
                                                                                                                                                • ご相談・お問い合わせ
                                                                                                                                                • Databricks 無料トライアル
                                                                                                                                                1. ブログ
                                                                                                                                                2. /
                                                                                                                                                  業界
                                                                                                                                                3. /
                                                                                                                                                  記事

                                                                                                                                                ペタバイト規模に最適化されたArctic Wolfのリキッドクラスタリングアーキテクチャ

                                                                                                                                                Arctic Wolf’s Liquid Clustering Architecture Tuned for Petabyte Scale

                                                                                                                                                Published: January 21, 2026

                                                                                                                                                業界Less than a minute

                                                                                                                                                によってジャスティン・ライ、ラジニーシ・アローラ、クリシャン・クマール、シンディ・ジャン による投稿

                                                                                                                                                この投稿を共有する

                                                                                                                                                最新の投稿を通知します

                                                                                                                                                Summary

                                                                                                                                                • Arctic Wolf は毎日 1 兆件以上のセキュリティ イベントを処理し、2,600 億件以上のエンリッチされたオブザベーションを生成して、ペタバイト規模の Delta Lake で維持しています。当社のアーキテクチャは、そのデータにほぼリアルタイムでアクセスできるように設計されています。* 当社は最近、Unity Catalog のマネージドテーブルで予測最適化 (PO) を用いたリキッド クラスタリングを使用するように移行し、パーティション化された外部テーブルを増分的なワークロード認識型クラスタリングで補完することで、クエリ パフォーマンスを向上させました。* リキッドクラスタリングと PO を組み合わせることで、テーブルが調整され、クエリーが最大 8 倍高速化し、データの鮮度が時間単位から分単位に向上します。

                                                                                                                                                毎日、Arctic Wolfは1兆件以上のイベントを処理し、数十億ものエンリッチ化されたレコードからセキュリティ関連の知見を抽出しています。これは60TB以上の圧縮テレメトリに相当し、AI主導の脅威検出と対応を24時間365日、途切れることなく強化しています。リアルタイムの脅威ハンティングを強化するために、当社はこのデータを顧客とセキュリティ オペレーション センターにできるだけ早く提供する必要がありました。目標は、ほとんどのクエリーが 15 秒以内に結果を返すことです。

                                                                                                                                                従来は、パーティショニングとz-orderingでは追いつかなかったため、最新データへのアクセスを提供するために他の高速なデータストアを活用する必要がありました。不審なアクティビティを検出すると、チームはすぐに 3 か月分の履歴コンテキストを横断してピボットし、攻撃パターン、ラテラル ムーブメント、侵害の全容を把握できます。3.8PB以上の圧縮データに対するこのリアルタイムの履歴分析は、現代の脅威ハンティングにおいて非常に重要です。侵害を数日で封じ込めるか数時間で封じ込めるかの違いは、数百万ドルもの損害を防ぐことにつながりかねません。

                                                                                                                                                一刻を争う状況では、スピードと鮮度が重要です。Arctic Wolfは、インジェストコストを増大させたり、複雑さを加えたりすることなく、大規模なデータセットへのアクセスを高速化する必要がありました。課題調査は、高負荷のファイル I/O と古いデータによって遅延していました。データの構成方法を再考することで、当社のアーキテクチャは、少数の顧客がほとんどのイベントを生成するマルチテナントのデータスキューを効率的に管理すると同時に、最初の取り込みから最大数週間後に現れる可能性のある遅延到着データにも対応します。  測定可能な利点としては、ファイル数が400万以上から200万に削減され、パーセンタイル全体でクエリー時間が約50%短縮され、90日間のクエリーが51秒からわずか6.6秒に短縮されたことなどが挙げられます。データの鮮度は数時間から数分に向上し、セキュリティ テレメトリにほぼ即座にアクセスできるようになりました。

                                                                                                                                                リキッドクラスタリングとUnity Catalogのマネージドテーブルがこれをどのように可能にしたか、つまり、一貫したパフォーマンスとほぼリアルタイムの知見を大規模に提供する方法については、こちらをお読みください。

                                                                                                                                                レガシーのボトルネック: Arctic Wolfが再構築した理由

                                                                                                                                                発生日時でパーティション分割され、テナント識別子で z-ordered された当社のレガシーテーブルは、パーティション全体に分割された多数の小さなファイルが原因で、ほぼリアルタイムでクエリーを実行できませんでした。さらに、データをクエリーする前にZ-orderingでOPTIMIZEをランする必要があったため、データは直近24時間以外のものしか利用できません。

                                                                                                                                                それでもなお、データの到着が遅れるためにパフォーマンスの問題が続いていました。これは、システムがデータを送信する前にオフラインになった場合に発生し、その結果、新しいデータが古いパーティションに格納されてパフォーマンスに影響を及ぼします。  

                                                                                                                                                古いデータは状況の把握を困難にします。その遅延が、攻撃者を封じ込めるか、ラテラル ムーブメントを許してしまうかの分かれ目となります。

                                                                                                                                                これらのパフォーマンスの課題を軽減し、必要なデータの鮮度を提供するために、当社はホットデータをデータアクセラレータに複製し、データレイクのデータとクエリーブレンドしてビジネス要件を満たす必要がありました。このシステムはランコストが高く、維持するために多大なエンジニアリング労力を必要としました。

                                                                                                                                                データアクセラレータを使用する際のこれらの課題に対処するため、データを均等に分散させ、遅れて到着するデータをサポートするようにデータレイアウトを再設計しました。これによりクエリーのパフォーマンスが最適化され、現在および新たなエージェント型AIのユースケースに対して、ほぼリアルタイムのアクセスが可能になります。

                                                                                                                                                リキッドクラスタリングによるストリーミングデータ基盤の構築 

                                                                                                                                                新しいアーキテクチャでは、最新のデータをクエリーでき、さまざまな顧客規模で一貫したクエリーパフォーマンスを提供し、クエリーが数秒で返されるようにすることが主な目標です。

                                                                                                                                                メダリオンアーキテクチャ

                                                                                                                                                再設計されたパイプラインはメダリオンアーキテクチャに従っており、まず継続的な Kafka の取り込みによって生のイベントデータがブロンズレイヤーに格納されます。その後、1時間ごとの構造化ストリーミングジョブが、ネストされたJSONペイロードをフラット化し、リキッドクラスタリングを使用してシルバーテーブルに書き込み、主要な分析基盤を形成します。ここで、ブロンズからシルバーへの変換では、スキーマ進化を処理し、派生した時間列を生成し、厳格なレイテンシ SLA が求められる下流の分析ワークロード向けにデータを準備します。

                                                                                                                                                リキッドクラスタリングは、厳格なパーティショニング スキームを、クエリーパターンに合わせて調整されたワークロード認識型の多次元クラスタリング キー(具体的には、テナント識別子と日付の粒度、テーブルサイズ、データ到着の特性による)に置き換えました。データをより均等に分散させ、我々のインスタンスでは平均ファイルサイズを1GB以上に増加させることで、テーブルに対する一般的な時間枠指定クエリーでスキャンされるファイル数を劇的に削減しました。

                                                                                                                                                詳細解説: 書き込み時のクラスター

                                                                                                                                                さらに、当社の構造化ストリーミング ジョブは、書き込み時クラスタリングを活用して、新しいデータが到着する際にファイル レイアウトを維持します。これは局所的なOPTIMIZE操作のように機能し、新しく取り込まれたデータにのみクラスタリングを適用します。そのため、取り込まれたデータはすでに最適化されています。しかし、取り込みバッチが小さすぎる場合、適切にクラスタリングされた小さなファイルが多数生成され、理想的なデータlayoutを実現するためには、グローバルなOPTIMIZE中にそれらをさらにクラスタリングする必要があります。対照的に、取り込み時のバッチサイズがグローバルなOptimizeで必要とされるバッチサイズに近い場合、追加の最適化は多くの場合不要です。

                                                                                                                                                テラバイト単位など、非常に大量のデータを取り込むワークロードについては、効率的なクラスタリングとファイルレイアウトを確保するため、maxBytesPerTrigger を指定した foreachBatch を使用するなど、ソースでのバッチ処理をお勧めします。maxBytesPerTrigger を使用すると、バッチサイズを制御でき、OPTIMIZE 操作による調整を必要とする多数の小さなクラスター化されたアイランドをなくすことができます。OPTIMIZE操作が扱うサイズに近いバッチにすることで、OPTIMIZEでさらに必要となる作業を削減するための最適なバッチを作成できました。

                                                                                                                                                Arctic Wolf のセキュリティ アナリティクスへの影響

                                                                                                                                                Arctic Wolfのリキッドクラスタリングへの移行は、パフォーマンス、データの鮮度、運用効率において、測定可能で大幅な改善をもたらしました。UCマネージドテーブルと予測的最適化により、メンテナンスをスケジュールする必要性も軽減されました。

                                                                                                                                                ファイル数は400万以上から200万に減少し、良好なクラスター品質を維持しながら、クエリー中のファイルI/Oを最小限に抑えました。その結果、クエリーのパフォーマンスは劇的に向上し、セキュリティアナリストはインシデントをより迅速に調査できるようになりました。パーセンタイル全体で約 50% 高速化し、当社の多数の顧客で約 90% 高速化しました。90日間のクエリーは51秒から6.6秒に短縮されました。

                                                                                                                                                書き込み時のクラスタリングを実装することで、データの鮮度を数時間から数分に短縮し、知見を得るまでの時間を約 90% 加速しました。この改善により、Arctic Wolfのデータレイクにおいてほぼリアルタイムの脅威検出が可能になります。

                                                                                                                                                リキッドクラスタリングと Unity Catalog のマネージドテーブルに移行することで、従来のパーティショニングを排除し、技術的負債を削減し、高度なガバナンス機能とパフォーマンス機能を利用できるようになりました。毎日2600億行以上を処理およびクエリできるアーキテクチャにより、これらすべてのソースからの重要なセキュリティデータに対して、より高速で効率的なアクセスを提供します。24時間365日対応の Concierge Security® チームとリアルタイムの脅威検出を組み合わせることで、より迅速で正確な脅威への対応と緩和が可能になります。これらの差別化要因は、当社の顧客がより強力でアジャイルなセキュリティ体制を確立し、自社の環境を保護して継続的なビジネスの成功をサポートする Arctic Wolf の能力への信頼を高めるのに役立ちます。 

                                                                                                                                                 

                                                                                                                                                (このブログ記事はAI翻訳ツールを使用して翻訳されています) 原文記事

                                                                                                                                                最新の投稿を通知します

                                                                                                                                                関連記事

                                                                                                                                                この投稿を共有する

                                                                                                                                                Databricksの投稿を見逃さないようにしましょう

                                                                                                                                                興味のあるカテゴリを購読して、最新の投稿を受信トレイに届けましょう

                                                                                                                                                Sign up

                                                                                                                                                次は何ですか?

                                                                                                                                                Announcing the General Availability of AWS GovCloud with FedRAMP High and Department of Defense IL5 Authorization

                                                                                                                                                セキュリティと信頼

                                                                                                                                                April 30, 2024/1分未満

                                                                                                                                                Databricks が AWS GovCloud 上で FedRAMP High agency ATO を取得、現在パブリックプレビュー中

                                                                                                                                                Securing the Future: How AI Gateways Protect AI Agent Systems in the Era of Generative AI

                                                                                                                                                セキュリティと信頼

                                                                                                                                                November 14, 2024/1分未満

                                                                                                                                                未来を守る:生成型AIの時代におけるAIエージェントシステムを保護するAIゲートウェイの役割

                                                                                                                                                databricks logo
                                                                                                                                                Databricks を選ぶ理由
                                                                                                                                                Databricks を選ぶ理由
                                                                                                                                                • エグゼクティブ向け
                                                                                                                                                • スタートアップ向け
                                                                                                                                                • レイクハウスアーキテクチャ
                                                                                                                                                • Mosaic Research
                                                                                                                                                導入事例
                                                                                                                                                • 注目の導入事例
                                                                                                                                                パートナー
                                                                                                                                                • クラウドプロバイダ
                                                                                                                                                • 技術パートナー
                                                                                                                                                • データパートナー
                                                                                                                                                • Databricks で構築
                                                                                                                                                • コンサルティング・SI
                                                                                                                                                • C&SI パートナー
                                                                                                                                                • パートナーソリューション
                                                                                                                                                Databricks を選ぶ理由
                                                                                                                                                • エグゼクティブ向け
                                                                                                                                                • スタートアップ向け
                                                                                                                                                • レイクハウスアーキテクチャ
                                                                                                                                                • Mosaic Research
                                                                                                                                                導入事例
                                                                                                                                                • 注目の導入事例
                                                                                                                                                パートナー
                                                                                                                                                • クラウドプロバイダ
                                                                                                                                                • 技術パートナー
                                                                                                                                                • データパートナー
                                                                                                                                                • Databricks で構築
                                                                                                                                                • コンサルティング・SI
                                                                                                                                                • C&SI パートナー
                                                                                                                                                • パートナーソリューション
                                                                                                                                                製品
                                                                                                                                                レイクハウスプラットフォーム
                                                                                                                                                • プラットフォーム
                                                                                                                                                • 共有
                                                                                                                                                • データガバナンス
                                                                                                                                                • 人工知能(AI)
                                                                                                                                                • BI
                                                                                                                                                • データベース
                                                                                                                                                • データ管理
                                                                                                                                                • データウェアハウス
                                                                                                                                                • データエンジニアリング
                                                                                                                                                • データサイエンス
                                                                                                                                                • アプリケーション開発
                                                                                                                                                ご利用料金
                                                                                                                                                • 料金設定の概要
                                                                                                                                                • 料金計算ツール
                                                                                                                                                オープンソース
                                                                                                                                                統合とデータ
                                                                                                                                                • マーケットプレイス
                                                                                                                                                • IDE 統合
                                                                                                                                                • パートナーコネクト
                                                                                                                                                レイクハウスプラットフォーム
                                                                                                                                                • プラットフォーム
                                                                                                                                                • 共有
                                                                                                                                                • データガバナンス
                                                                                                                                                • 人工知能(AI)
                                                                                                                                                • BI
                                                                                                                                                • データベース
                                                                                                                                                • データ管理
                                                                                                                                                • データウェアハウス
                                                                                                                                                • データエンジニアリング
                                                                                                                                                • データサイエンス
                                                                                                                                                • アプリケーション開発
                                                                                                                                                ご利用料金
                                                                                                                                                • 料金設定の概要
                                                                                                                                                • 料金計算ツール
                                                                                                                                                統合とデータ
                                                                                                                                                • マーケットプレイス
                                                                                                                                                • IDE 統合
                                                                                                                                                • パートナーコネクト
                                                                                                                                                ソリューション
                                                                                                                                                業種別
                                                                                                                                                • 通信
                                                                                                                                                • 金融サービス
                                                                                                                                                • 医療・ライフサイエンス
                                                                                                                                                • 製造
                                                                                                                                                • メディア・エンタメ
                                                                                                                                                • 官公庁・公共機関
                                                                                                                                                • リテール・消費財
                                                                                                                                                • 全て表示
                                                                                                                                                クロスインダストリーソリューション
                                                                                                                                                • サイバーセキュリティ
                                                                                                                                                • マーケティング
                                                                                                                                                データの移行
                                                                                                                                                プロフェッショナルサービス
                                                                                                                                                ソリューションアクセラレータ
                                                                                                                                                業種別
                                                                                                                                                • 通信
                                                                                                                                                • 金融サービス
                                                                                                                                                • 医療・ライフサイエンス
                                                                                                                                                • 製造
                                                                                                                                                • メディア・エンタメ
                                                                                                                                                • 官公庁・公共機関
                                                                                                                                                • リテール・消費財
                                                                                                                                                • 全て表示
                                                                                                                                                クロスインダストリーソリューション
                                                                                                                                                • サイバーセキュリティ
                                                                                                                                                • マーケティング
                                                                                                                                                リソース
                                                                                                                                                ドキュメント
                                                                                                                                                カスタマーサポート
                                                                                                                                                コミュニティ
                                                                                                                                                トレーニング・認定試験
                                                                                                                                                • トレーニング
                                                                                                                                                • 認定
                                                                                                                                                • 無料版
                                                                                                                                                • 大学との連携
                                                                                                                                                • Databricks アカデミー
                                                                                                                                                イベント
                                                                                                                                                • DATA+AI サミット
                                                                                                                                                • Data+AI ワールドツアー
                                                                                                                                                • AI Days
                                                                                                                                                • イベントカレンダー
                                                                                                                                                ブログ・ポッドキャスト
                                                                                                                                                • Databricks ブログ
                                                                                                                                                • Databricks Mosaic AIリサーチブログ
                                                                                                                                                • Data Brew ポッドキャスト
                                                                                                                                                • Data+AI のチャンピオンシリーズ
                                                                                                                                                トレーニング・認定試験
                                                                                                                                                • トレーニング
                                                                                                                                                • 認定
                                                                                                                                                • 無料版
                                                                                                                                                • 大学との連携
                                                                                                                                                • Databricks アカデミー
                                                                                                                                                イベント
                                                                                                                                                • DATA+AI サミット
                                                                                                                                                • Data+AI ワールドツアー
                                                                                                                                                • AI Days
                                                                                                                                                • イベントカレンダー
                                                                                                                                                ブログ・ポッドキャスト
                                                                                                                                                • Databricks ブログ
                                                                                                                                                • Databricks Mosaic AIリサーチブログ
                                                                                                                                                • Data Brew ポッドキャスト
                                                                                                                                                • Data+AI のチャンピオンシリーズ
                                                                                                                                                企業情報
                                                                                                                                                企業概要
                                                                                                                                                • Databricks について
                                                                                                                                                • 経営陣
                                                                                                                                                • Databricks Ventures
                                                                                                                                                • ご相談・お問い合わせ
                                                                                                                                                採用情報
                                                                                                                                                • 採用情報概要
                                                                                                                                                • 求人情報
                                                                                                                                                プレス・ニュース記事
                                                                                                                                                • ニュースルーム
                                                                                                                                                • 受賞歴と業界評価
                                                                                                                                                セキュリティと信頼
                                                                                                                                                企業概要
                                                                                                                                                • Databricks について
                                                                                                                                                • 経営陣
                                                                                                                                                • Databricks Ventures
                                                                                                                                                • ご相談・お問い合わせ
                                                                                                                                                採用情報
                                                                                                                                                • 採用情報概要
                                                                                                                                                • 求人情報
                                                                                                                                                プレス・ニュース記事
                                                                                                                                                • ニュースルーム
                                                                                                                                                • 受賞歴と業界評価
                                                                                                                                                databricks logo

                                                                                                                                                Databricks Inc.
                                                                                                                                                160 Spear Street, 15th Floor
                                                                                                                                                San Francisco, CA 94105
                                                                                                                                                1-866-330-0121

                                                                                                                                                採用情報

                                                                                                                                                © Databricks 2026. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.

                                                                                                                                                • プライバシー通知
                                                                                                                                                • |利用規約
                                                                                                                                                • |現代奴隷法に関する声明
                                                                                                                                                • |カリフォルニア州のプライバシー権利
                                                                                                                                                • |プライバシー設定