メインコンテンツへジャンプ
ログイン
      • Databricks を知る
        • エグゼクティブ向け
          • スタートアップ向け
            • レイクハウスアーキテクチャ
              • Mosaic Research
              • 導入事例
                • 注目の導入事例
                  • 導入事例一覧へ
                  • パートナー
                    • クラウドプロバイダ
                      Databricks on AWS、Azure、GCP
                      • コンサルティング・SI
                        Databricks の構築・デプロイ、Databricks への移行のエキスパート
                        • 技術パートナー
                          既存のツールをレイクハウスに接続
                          • C&SI パートナー
                            レイクハウスの構築・デプロイメント、レイクハウスへの移行
                            • データパートナー
                              データコンシューマーのエコシステムにアクセス
                              • パートナーソリューション
                                業界・移行のニーズに応じたカスタムソリューション
                                • Databricks で構築
                                  ビジネスの創造・マーケティング・成長
                                • Databricks プラットフォーム
                                  • プラットフォームの概要
                                    データ・分析・AI のための統合プラットフォーム
                                    • データ管理
                                      データの信頼性・セキュリティ・パフォーマンス
                                      • 共有
                                        オープン、セキュア、ゼロコピーでのデータ共有
                                        • データウェアハウジング
                                          バッチ、ストリーミングデータのための ETL とオーケストレーション
                                          • ガバナンス
                                            データ・分析・AI のための統合ガバナンス
                                            • リアルタイム分析
                                              リアルタイム分析、AI、アプリケーションをシンプルに
                                              • 人工知能(AI)
                                                ML と生成 AI アプリケーションの構築とデプロイメント
                                                • データエンジニアリング
                                                  バッチ、ストリーミングデータのための ETL とオーケストレーション
                                                  • BI
                                                    実世界データのインテリジェント分析
                                                    • データサイエンス
                                                      データサイエンスの大規模な連携
                                                    • 統合とデータ
                                                      • マーケットプレイス
                                                        データ、分析、AI のためのオープンマーケットプレイス
                                                        • IDE 統合
                                                          お気に入りの IDE(統合開発環境)でレイクハウスを構築
                                                          • パートナーコネクト
                                                            Databricks エコシステムの検索と統合
                                                          • ご利用料金
                                                            • Databricks のご利用料金
                                                              料金設定、DBU、その他
                                                              • コスト計算ツール
                                                                クラウド利用でのコンピュートコストの試算
                                                              • オープンソース
                                                                • オープンソーステクノロジー
                                                                  プラットフォームを支えるイノベーションをもっと詳しく
                                                                • 業界向け Databricks
                                                                  • 通信
                                                                    • メディア・エンターテイメント
                                                                      • 金融サービス
                                                                        • 官公庁・公共機関
                                                                          • 医療・ライフサイエンス
                                                                            • リテール・消費財
                                                                              • 製造
                                                                                • 全て見る
                                                                                • クロスインダストリーソリューション
                                                                                  • サイバーセキュリティ
                                                                                    • マーケティング
                                                                                    • 移行・デプロイメント
                                                                                      • データの移行
                                                                                        • プロフェッショナルサービス
                                                                                        • ソリューションアクセラレータ
                                                                                          • ソリューションアクセラレータ一覧
                                                                                            成果を加速
                                                                                          • トレーニング・認定試験
                                                                                            • 学習の概要
                                                                                              トレーニング、認定、イベントなどのハブ
                                                                                              • トレーニング概要
                                                                                                ニーズに合わせたカリキュラムを探す
                                                                                                • Databricks アカデミー
                                                                                                  Databricks ラーニングプラットフォームにサインインする
                                                                                                  • 認定
                                                                                                    スキル・認定で差別化を図る
                                                                                                    • 大学との連携
                                                                                                      Databricks を教材として活用
                                                                                                    • イベント
                                                                                                      • DATA+AI サミット
                                                                                                        • Data+AI ワールドツアー
                                                                                                          • Data Intelligence Days
                                                                                                            • イベントカレンダー
                                                                                                            • ブログ・ポッドキャスト
                                                                                                              • Databricks ブログ
                                                                                                                最新情報、製品発表、その他の情報
                                                                                                                • Databricks Mosaic AIリサーチブログ
                                                                                                                  AI世代に関する最新リサーチ
                                                                                                                  • Data Brew ポッドキャスト
                                                                                                                    ご相談・お問い合わせ
                                                                                                                    • ポッドキャスト:Data+AI のチャンピオン
                                                                                                                      イノベーションを支えるデータリーダーのインサイト
                                                                                                                    • お役立ちリソース
                                                                                                                      • カスタマーサポート
                                                                                                                        • ドキュメント
                                                                                                                          • コミュニティ
                                                                                                                          • もっと詳しく
                                                                                                                            • リソースセンター
                                                                                                                              • デモセンター
                                                                                                                              • 企業概要
                                                                                                                                • Databricks について
                                                                                                                                  • 経営陣
                                                                                                                                    • Databricks Ventures
                                                                                                                                      • ご相談・お問い合わせ
                                                                                                                                      • 採用情報
                                                                                                                                        • 採用情報概要
                                                                                                                                          • 求人情報
                                                                                                                                          • プレス・ニュース記事
                                                                                                                                            • ニュースルーム
                                                                                                                                              • 受賞歴と業界評価
                                                                                                                                              • セキュリティと信頼
                                                                                                                                                • セキュリティと信頼
                                                                                                                                            • 是非ご検討ください!
                                                                                                                                            • デモを見る
                                                                                                                                            • ログイン
                                                                                                                                            • Databricks 無料トライアル
                                                                                                                                            1. ブログ
                                                                                                                                            2. /
                                                                                                                                              プラットフォーム> 製品> お知らせ
                                                                                                                                            3. /
                                                                                                                                              記事

                                                                                                                                            Unity Catalog Lakeguard:業界初、マルチユーザーのApache Sparkクラスター向けのデータガバナンス

                                                                                                                                            Scala、Python、SQLのワークロードを、共有されたコスト効率の高いマルチユーザーコンピュートで実行する

                                                                                                                                            Unity Catalog Lakeguard - Data Governance for multi-user Apache Spark Clusters

                                                                                                                                            Published: April 24, 2024

                                                                                                                                            プラットフォーム> 製品> お知らせ1分未満

                                                                                                                                            ステファニア・レオーネ、マーティン・グルンド、ヘルマン・ファン・ヘーベル、Reynold Xin(レイノルド・シン)、Matei Zaharia による投稿

                                                                                                                                            この投稿を共有する

                                                                                                                                            最新の投稿を通知します

                                                                                                                                            Unity Catalog Lakeguardを発表できることを嬉しく思います。これにより、Databricksデータインテリジェンスプラットフォームのコスト効率の高いマルチユーザーコンピューティング上で完全なデータガバナンスを備えたSQL、Python、ScalaでApache Spark™ ワークロードを実行できるようになります。 従来、ガバナンスを強化するにはシングルユーザークラスターを使用する必要があり、コストと運用のオーバーヘッドを負担する必要がありました。Lakeguardを使用すると、ユーザーコードは他のユーザーのコードや共有コンピュート上のSparkエンジンから完全に分離された状態で実行されるため、実行時にデータガバナンスを強制する ことができます。 これにより、クラスターをチーム全体で安全に共有し、計算コストを削減し、運用の手間を最小限に抑えることができます。

                                                                                                                                            Lakeguardは、Unity Catalogの導入以来、不可欠な存在となっています。DBR 13.1ではPython UDF、DBR 13.3ではScalaサポート、そして最終的にはDBR 14.3でScala UDFを使用して、共有クラスター上で任意のコードを実行する機能を徐々に拡張してきました。Databricks SQLウェアハウス内のPython UDFもLakegaurdによって保護されています! これにより、Databricksのお客様は、SQL、Python、Scalaのワークロードを、完全なデータガバナンスを備えたマルチユーザーコンピューティング上でUDFを含めて実行することができます。

                                                                                                                                            このブログの投稿では、Unity Catalog Lakeguardの概要と、LakeguardがデータガバナンスでApache Spark™ をどのように補完するかについて詳しく説明します。

                                                                                                                                            LakeguardがApache Spark™のデータガバナンスを強化

                                                                                                                                            Apache Sparkは、世界で最も人気のある分散データ処理フレームワークです。 企業のデータ重視に伴いSparkの利用が増加するにつれ、データガバナンスの必要性も高まっています。 例えば、一般的なユースケースは、財務と人事などの異なる部門間でデータの可視性を制限したり、ビューやテーブルの列や行レベルのフィルタなどのきめ細かいアクセス制御を使用してPIIデータを保護することです。 Databricksのお客様にとって、Unity Catalogは、あらゆるクラウド上のすべてのテーブル、ビュー、機械学習モデルに対する包括的なガバナンスとリネージを提供します。

                                                                                                                                            Unity Catalogでデータガバナンスを定義したら、実行時にガバナンスルールを適用する必要があります。最大の技術的課題は、Sparkがユーザーコードを分離するメカニズムを提供していないことです。異なるユーザーが同じ実行環境であるJava仮想マシン(JVM)を共有するため、ユーザー間でデータが漏洩する可能性があります。 クラウドでホストされるSparkサービスは、ユーザーごとに専用のクラスターを作成することでこの問題を回避しています。これにより、インフラコストの増加と、管理者がより多くのクラスターを定義して管理する必要があるため、管理オーバーヘッドの増加という 2 つの大きな問題が生じます。 さらに、Sparkは、きめ細かなアクセス制御を念頭に置いて設計されていません。ビューをクエリする際、Sparkはファイルを「オーバーフェッチ」します。つまり、ビューで使用される基礎となるテーブルのすべてのファイルをフェッチします。その結果、ユーザはアクセス権を付与されていないデータを読み取る可能性があります。

                                                                                                                                            Databricksでは、Lakeguardを内部で使用する共有クラスターでこの問題を解決しました。 Lakeguardはコンピュートレベルで透過的にデータガバナンスを実施し、各ユーザのコードが他のユーザのコードや基礎となるSpark エンジンから完全に分離された状態で実行されることを保証します。Lakeguardはまた、Databricks SQLウェアハウス内のPython UDFを分離するためにも使用されます。これにより、Databricksは、SQL 、Python 、Scala のワークロードに対して、ビューや列レベル・行レベルのフィルタを使用したきめ細かなアクセス制御の実施を含む、完全なデータガバナンスでセキュアなコンピュート共有をサポートする業界初で唯一のプラットフォームです。

                                                                                                                                            Lakeguard: 最先端のサンドボックスによるユーザーコードの分離

                                                                                                                                            コンピューティングレベルでデータガバナンスを強制するために、ユーザーがJVMを共有するセキュリティモデルから、データガバナンスが常に強制されるように、各ユーザーのコードが相互および基盤となるSparkエンジンから完全に分離されて実行されるモデルにコンピューティングアーキテクチャを進化させました。 すべてのユーザーコードを (1) Sparkドライバーと (2) Spark エグゼキューターから分離することで、これを実現しました。下の画像は、従来のSpark アーキテクチャ(左)では、ユーザーのクライアントアプリケーションが、基礎となるマシンへの特権アクセスを持つJVMを共有していたことを表します。共有クラスター(右)では、すべてのユーザーコードがセキュアコンテナを使用して完全に分離されている様子を示しています。このアーキテクチャにより、Databricksは複数のワークロードを同じクラスター上で安全に実行し、共同作業、コスト効率、および安全なソリューションを提供します。

                                                                                                                                            Unity Catalog Lakeguard: マルチユーザー向けデータガバナンスApache Spark cluster

                                                                                                                                            Sparkクライアント:Spark Connectとサンドボックス化されたクライアントアプリケーションによるユーザーコードの分離

                                                                                                                                            SparkクライアントアプリケーションをSparkドライバーから分離するために、私たちはまずこの2つを切り離し、次に個々のクライアントアプリケーションを互いに、そして基盤となるマシンから分離する必要がありました:

                                                                                                                                            1. Spark Connect:クライアント側でユーザーコードの分離を実現するために、 Apache Spark 3.4でオープンソース化されたSpark Connectを使用しています。 Spark Connectは、クライアントアプリケーションをドライバーから切り離すために導入されました。これにより、両者は同じJVMやクラスパスを共有することがなくなり、独立して開発・実行できるようになりました。この切り離されたアーキテクチャを使用することで、行レベル/列レベルのフィルタを持つビューやテーブルに対するクエリを処理するために使用される「オーバーフェッチ」データは、クライアントアプリケーションからアクセスできなくなるため、きめ細かなアクセス制御を実施できます。
                                                                                                                                            2. クライアントアプリケーションのサンドボックス化:次のステップとして、個々のクライアントアプリケーション、つまりユーザーコードがお互いのデータや基礎となるマシンにアクセスできないようにしました。これは、コンテナに基づく最先端のサンドボックス技術を使用して、クライアントアプリケーション用の軽量なサンドボックス実行環境を構築することで実現しました。現在、各クライアントアプリケーションは独自のコンテナ内で完全に分離された状態で実行されます。

                                                                                                                                            Sparkエグゼキューター:UDFのサンドボックス化されたエクゼキューター分離

                                                                                                                                            Sparkドライバと同様に、 Sparkエグゼキューターはユーザ定義関数(UDF)の分離を強制しません。例えば、UDFは、マシンへの特権アクセスにより、ファイルシステムに任意のファイルを書き込む可能性があります。クライアントアプリケーションと同様に、PythonおよびScala UDFを安全に実行するために、Sparkエグゼキューター上で実行環境をサンドボックス化しました。また、システムの他の部分から出力のネットワークトラフィックを分離しています。最後に、ユーザーが自分のライブラリをUDFで使用できるように、クライアント環境をUDFサンドボックスに安全に複製します。その結果、共有クラスター上のUDFは完全に分離された状態で実行され、LakeguardはDatabricks SQLウェアハウス内のPython UDFにも使用さ れます。

                                                                                                                                            Unity Catalogと共有クラスターで時間とコストを節約

                                                                                                                                            今すぐ共有クラスターをお試しいただき、チームとのコラボレーションとコスト削減を実現してください。 LakeguardはUnity Catalogの不可欠なコンポーネントであり、Unity Catalogで共有クラスター、Delta Live Tables  (DLT) 、Databricks SQLをご利用のすべてのお客様で有効になっています。

                                                                                                                                            最新の投稿を通知します

                                                                                                                                            関連記事

                                                                                                                                            この投稿を共有する

                                                                                                                                            Databricksの投稿を見逃さないようにしましょう

                                                                                                                                            興味のあるカテゴリを購読して、最新の投稿を受信トレイに届けましょう

                                                                                                                                            Sign up

                                                                                                                                            次は何ですか?

                                                                                                                                            Cross Platform View Sharing

                                                                                                                                            プラットフォーム

                                                                                                                                            December 1, 2024/1分未満

                                                                                                                                            クロスプラットフォームにおけるビューの共有がパブリックプレビューに なりました🚀

                                                                                                                                            Introducing Serverless Time Series Forecasting in Mosaic AI Model Training

                                                                                                                                            AI

                                                                                                                                            December 5, 2024/1分未満

                                                                                                                                            時系列データの予測力を解き放て!

                                                                                                                                            databricks logo
                                                                                                                                            Databricks を選ぶ理由
                                                                                                                                            Databricks を選ぶ理由
                                                                                                                                            • エグゼクティブ向け
                                                                                                                                            • スタートアップ向け
                                                                                                                                            • レイクハウスアーキテクチャ
                                                                                                                                            • Mosaic Research
                                                                                                                                            導入事例
                                                                                                                                            • 全て見る
                                                                                                                                            • 注目の導入事例
                                                                                                                                            パートナー
                                                                                                                                            • クラウドプロバイダ
                                                                                                                                            • 技術パートナー
                                                                                                                                            • データパートナー
                                                                                                                                            • Databricks で構築
                                                                                                                                            • コンサルティング・SI
                                                                                                                                            • C&SI パートナー
                                                                                                                                            • パートナーソリューション
                                                                                                                                            Databricks を選ぶ理由
                                                                                                                                            • エグゼクティブ向け
                                                                                                                                            • スタートアップ向け
                                                                                                                                            • レイクハウスアーキテクチャ
                                                                                                                                            • Mosaic Research
                                                                                                                                            導入事例
                                                                                                                                            • 全て見る
                                                                                                                                            • 注目の導入事例
                                                                                                                                            パートナー
                                                                                                                                            • クラウドプロバイダ
                                                                                                                                            • 技術パートナー
                                                                                                                                            • データパートナー
                                                                                                                                            • Databricks で構築
                                                                                                                                            • コンサルティング・SI
                                                                                                                                            • C&SI パートナー
                                                                                                                                            • パートナーソリューション
                                                                                                                                            製品
                                                                                                                                            レイクハウスプラットフォーム
                                                                                                                                            • プラットフォーム
                                                                                                                                            • 共有
                                                                                                                                            • データガバナンス
                                                                                                                                            • 人工知能(AI)
                                                                                                                                            • DBRX
                                                                                                                                            • データ管理
                                                                                                                                            • データウェアハウス
                                                                                                                                            • データストリーミング
                                                                                                                                            • データエンジニアリング
                                                                                                                                            • データサイエンス
                                                                                                                                            ご利用料金
                                                                                                                                            • 料金設定の概要
                                                                                                                                            • 料金計算ツール
                                                                                                                                            オープンソース
                                                                                                                                            統合とデータ
                                                                                                                                            • マーケットプレイス
                                                                                                                                            • IDE 統合
                                                                                                                                            • パートナーコネクト
                                                                                                                                            レイクハウスプラットフォーム
                                                                                                                                            • プラットフォーム
                                                                                                                                            • 共有
                                                                                                                                            • データガバナンス
                                                                                                                                            • 人工知能(AI)
                                                                                                                                            • DBRX
                                                                                                                                            • データ管理
                                                                                                                                            • データウェアハウス
                                                                                                                                            • データストリーミング
                                                                                                                                            • データエンジニアリング
                                                                                                                                            • データサイエンス
                                                                                                                                            ご利用料金
                                                                                                                                            • 料金設定の概要
                                                                                                                                            • 料金計算ツール
                                                                                                                                            統合とデータ
                                                                                                                                            • マーケットプレイス
                                                                                                                                            • IDE 統合
                                                                                                                                            • パートナーコネクト
                                                                                                                                            ソリューション
                                                                                                                                            業種別
                                                                                                                                            • 通信
                                                                                                                                            • 金融サービス
                                                                                                                                            • 医療・ライフサイエンス
                                                                                                                                            • 製造
                                                                                                                                            • メディア・エンタメ
                                                                                                                                            • 官公庁・公共機関
                                                                                                                                            • リテール・消費財
                                                                                                                                            • 全て表示
                                                                                                                                            クロスインダストリーソリューション
                                                                                                                                            • サイバーセキュリティ
                                                                                                                                            • マーケティング
                                                                                                                                            データの移行
                                                                                                                                            プロフェッショナルサービス
                                                                                                                                            ソリューションアクセラレータ
                                                                                                                                            業種別
                                                                                                                                            • 通信
                                                                                                                                            • 金融サービス
                                                                                                                                            • 医療・ライフサイエンス
                                                                                                                                            • 製造
                                                                                                                                            • メディア・エンタメ
                                                                                                                                            • 官公庁・公共機関
                                                                                                                                            • リテール・消費財
                                                                                                                                            • 全て表示
                                                                                                                                            クロスインダストリーソリューション
                                                                                                                                            • サイバーセキュリティ
                                                                                                                                            • マーケティング
                                                                                                                                            リソース
                                                                                                                                            ドキュメント
                                                                                                                                            カスタマーサポート
                                                                                                                                            コミュニティ
                                                                                                                                            トレーニング・認定試験
                                                                                                                                            • トレーニング概要
                                                                                                                                            • トレーニング
                                                                                                                                            • 認定
                                                                                                                                            • 大学との連携
                                                                                                                                            • Databricks アカデミー
                                                                                                                                            イベント
                                                                                                                                            • DATA+AI サミット
                                                                                                                                            • Data+AI ワールドツアー
                                                                                                                                            • Data Intelligence Days
                                                                                                                                            • イベントカレンダー
                                                                                                                                            ブログ・ポッドキャスト
                                                                                                                                            • Databricks ブログ
                                                                                                                                            • Databricks Mosaic AIリサーチブログ
                                                                                                                                            • Data Brew ポッドキャスト
                                                                                                                                            • Data+AI のチャンピオンシリーズ
                                                                                                                                            トレーニング・認定試験
                                                                                                                                            • トレーニング概要
                                                                                                                                            • トレーニング
                                                                                                                                            • 認定
                                                                                                                                            • 大学との連携
                                                                                                                                            • Databricks アカデミー
                                                                                                                                            イベント
                                                                                                                                            • DATA+AI サミット
                                                                                                                                            • Data+AI ワールドツアー
                                                                                                                                            • Data Intelligence Days
                                                                                                                                            • イベントカレンダー
                                                                                                                                            ブログ・ポッドキャスト
                                                                                                                                            • Databricks ブログ
                                                                                                                                            • Databricks Mosaic AIリサーチブログ
                                                                                                                                            • Data Brew ポッドキャスト
                                                                                                                                            • Data+AI のチャンピオンシリーズ
                                                                                                                                            企業情報
                                                                                                                                            企業概要
                                                                                                                                            • Databricks について
                                                                                                                                            • 経営陣
                                                                                                                                            • Databricks Ventures
                                                                                                                                            • ご相談・お問い合わせ
                                                                                                                                            採用情報
                                                                                                                                            • 採用情報概要
                                                                                                                                            • 求人情報
                                                                                                                                            プレス・ニュース記事
                                                                                                                                            • ニュースルーム
                                                                                                                                            • 受賞歴と業界評価
                                                                                                                                            セキュリティと信頼
                                                                                                                                            企業概要
                                                                                                                                            • Databricks について
                                                                                                                                            • 経営陣
                                                                                                                                            • Databricks Ventures
                                                                                                                                            • ご相談・お問い合わせ
                                                                                                                                            採用情報
                                                                                                                                            • 採用情報概要
                                                                                                                                            • 求人情報
                                                                                                                                            プレス・ニュース記事
                                                                                                                                            • ニュースルーム
                                                                                                                                            • 受賞歴と業界評価
                                                                                                                                            databricks logo

                                                                                                                                            Databricks Inc.
                                                                                                                                            160 Spear Street, 15th Floor
                                                                                                                                            San Francisco, CA 94105
                                                                                                                                            1-866-330-0121

                                                                                                                                            採用情報

                                                                                                                                            © Databricks 2025. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.

                                                                                                                                            • プライバシー通知
                                                                                                                                            • |利用規約
                                                                                                                                            • |現代奴隷法に関する声明
                                                                                                                                            • |カリフォルニア州のプライバシー権利
                                                                                                                                            • |プライバシー設定