Databricks Unity Catalog は、Databricks データインテリジェンスプラットフォームに組み込まれた、データと AI のための業界唯一の統一されたオープンなガバナンスソリューションです。Unity Catalog を使用することで、企業はあらゆる形式の構造化データや非構造化データ、機械学習モデル、ノートブック、ダッシュボード、ファイルを、クラウドやプラットフォームを問わずにシームレスに管理できます。データサイエンティスト、アナリスト、エンジニアは、プラットフォーム間で信頼できるデータと AI 資産を安全に発見、アクセス、コラボレーションし、AI を活用して生産性を高め、レイクハウス環境の潜在能力を最大限に引き出すことができます。この統一されたオープンなガバナンスアプローチは、相互運用性を促進し、データと AI のイニシアチブを加速すると同時に、規制コンプライアンスを簡素化します。
「Databricks Unity Catalog は、現在、PepsiCo Data Foundation の重要な一部となっており、世界中で 6 ペタバイトを超えるデータを統合する一元管理グローバルシステムです。1,500 人以上のアクティブユーザーのオンボーディングプロセスを合理化し、世界中の 30 を超えるデジタル製品チームのための統一されたデータディスカバリを可能にし、ビジネスインテリジェンスや人工知能アプリケーションをサポートしています。」
PepsiCo データ&分析部門 シニアディレクター Bhaskar Palit 氏
データと AI の可視性を統合
機械学習モデル、ノートブック、ダッシュボード、ファイルを含む、多様な形式の構造化データおよび非構造化データを、あらゆるクラウドプラットフォームで容易に検出し、分類します。MySQL、PostgreSQL、Amazon Redshift、Snowflake、Azure SQL、Azure Synapse、Google BigQuery などの外部データベースやデータウェアハウス、および HMS や AWS Glue などのカタログのデータを、1 つの場所でシームレスに管理、ガバナンス、クエリできます。データ探索のための単一アクセスポイントにより、データおよび AI イニシアチブを加速します。インテリジェントな検索、発見、自動的に生成されるデータインサイトと文書化により、生産性を向上させます。
データと AI の単一許可モデル
データと AI 資産に対するアクセスポリシーを定義し、これらのポリシーをあらゆるクラウドまたはデータプラットフォーム上で一貫して適用および監査するための統合インターフェースにより、アクセス管理を簡素化します。オープンなインターフェースを使用して、他のコンピューティングプラットフォームからデータに安全にアクセスできます。行や列のきめ細かな制御でセキュリティを強化し、シー ムレスに拡張できるローコード属性ベースのアクセスポリシーで効率的にアクセスを管理します。
AI を活用した監視と観測可能性
AI のパワーを活用し、モニタリングの自動化、エラーの診断、データと ML モデルの品質維持を実現します。個人を特定できる情報(PII)データを自動的に検出し、モデルのドリフトを追跡し、データおよびAIパイプライン内の問題を効果的に解決して、正確性と完全性を維持するプロアクティブなアラートのメリットを享受できます。自動化された列レベルのデータリネージにより、デバッグ、根本原因分析、影響評価を効率化します。請求、監査、リネージなどのための組み込みシステムテーブルを活用した運用インテリジェンスにより、データおよび AI に対する包括的な観察可能性を得ることができます。
オープンアクセシビリティ
オープン API と標準インターフェースを使用して、どのコンピュートエンジンからでもデータや AI 資産に安全に アクセスできます。オープンソースの Delta Sharing で、クラウド、リージョン、プラットフォーム間でデータと AI 資産を共有します。独自のフォーマットや複雑な ETL プロセス、コストのかかるデータの複製に依存することなく、新たな収益源を開拓し、ビジネス価値を推進するために、場所を問わず誰とでもセキュアにコラボレーションできます。