Azure Databricks

Databricks のデータ・AI サービスと、Microsoft Azure との緊密な統合が、シンプルでオープンなレイクハウスでのあらゆるデータの保存と、分析・AI のワークロードの集約を可能にします。

Azure Databricks step-by-step training

Azure Databricks is optimized for Azure and tightly integrated with Azure Data Lake Storage, Azure Data Factory, Azure Synapse Analytics, Power BI and other Azure services to store all your data on a simple, open lakehouse and unify all your analytics and AI workloads.

背景

シンプル

データ・分析・AI を一元化
あらゆるデータのユースケースを単一の共通プラットフォームで

オープン

データエコシステムを統合
オープンソース、オープンスタンダード、オープンフォーマット

コラボレーション

データチームをひとつに
データと AI のワークフロー全体でのコラボレーションを促進

Azure Databricks が選ばれる理由

Apache Spark™

高度に最適化された Spark を備え、最大 50 倍速の性能と自動スケーリングを可能にするコンピューティングクラスタの展開。

詳しく見る→

1日あたりサーバー時間 = 数百万の規模に対応

Azure Databricks は、1 日当たりのサーバー時間が数百万時間、Azure リージョン数 34 以上の運用規模を有する数千社のお客様に利用されています。

詳しく見る→

使いやすさ

Azure ポータルからのワンクリックスタート、Azure セキュリティとデータサービスとのネイティブ統合、データエンジニアリングとデータサイエンスの連携により、生産性を最大 25% 向上させます。

詳しく見る→

業界別ユースケース




金融サービス

Swiss Re(スイス・リー)
データエンジニアリング、データサイエンス、分析の各データ部門を横断したデータ分析の一元化を実現
HSBC
Azure Databricks を活用してデジタル決済プラットフォームを構築
ABN アムロ
コラボレーション、AI による知見、高度な自動機械学習のケイパビリティを可能にし、分析ワークフローを改善詳しく見る →

小売・消費財

Albertsons(アルバートソンズ)
Delivered a flexible omnichannel platform to support growth and innovation.
Runtastic
Built their analytical engine around Azure Databricks to help users around the world keep fit and active.
John Keells Holdings
Enables employees to securely access a shared self-service platform to collaborate across teams.
Learn more →

医療・ライフサイエンス

Providence ヘルスケア
Built a data streaming solution using Azure Databricks and Azure Event Hubs.
Rush University Medical Center
Uses the Azure cloud to deliver better healthcare outcomes.
CVS Health
Leverages Data + AI to personalize the pharmacy experience and enable better outcomes.
Learn more →

Azure Databricks のイベント

Azure Databricks のイベント

Databricks と Microsoft は、パートナー企業の協力のもと、お客様に Azure Databricks をより深く理解していただくためのイベントを開催します。イベントでは、急成長を見せているデータ・AI サービスの Azure 展開についての詳しい情報をご紹介します。ぜひご参加ください。詳細は下記のリンクをご覧ください。

詳しく見る→

Azure での展開のための最適化

Azure Databricks は、専用コネクタを使用して Azure データストアおよびサービスとシームレスに統合し、データアクセスの高速化と管理の簡素化を可能にします。これにより、セキュリティの制御環境の管理、Azure 上のあらゆるデータの処理が容易になります。

ロゴ

Azure Databricks

背景

主要な統合機能

Azure Databricks にサインインするには、Azure Active Directory(Azure AD)を使用したシングルサインオンが最適です。Azure Databricks は、Azure AD を利用する自動ユーザープロビジョニングをサポートしており、新規ユーザーの作成、適切なアクセス権限の付与、ユーザーの削除に伴うアクセスのプロビジョニング解除が可能です。

Azure Databricks の ADLS へのネイティブコネクタは、データレイクへの複数のアクセス方法をサポートしています。Azure Active Directory の認証情報パススルーにより、Azure Databricks へのアクセスと同一の Azure AD 認証が使用できるため、データアクセスのセキュリティ管理がシンプルになります。また、データアクセスは、事前に設定した ADLS のロールとアクセス制御リストによって管理されます。

Azure Data Factory(ADF)を使用して Azure Databricks のジョブをシームレスに実行し、90 以上のビルトインデータソースコネクタを活用して、全てのデータソースを単一のデータレイクに取り込みます。ADF は、ビルトインおワークフロー制御、データ変換、パイプラインのスケジューリング、データ統合など多くの機能を提供し、信頼性の高いデータパイプラインの作成を支援します。

レイクハウス戦略に求められる主要な機能の 1 つは、データレイクのデータを BI ツールで直接、効率的かつセキュアに活用できることです。データレイクからデータウェアハウスにデータをコピーする従来のフローが不要になるため、余分なレイテンシ、コンピューティング、ストレージコストを回避できます。また、Power BI の Azure Databricks コネクタによって、データレイクに保存されているデータの、セキュアかつインタラクティブな視覚化が可能になります。

Azure Databricks は Azure DevOps と連携し、継続的インテグレーションと継続的デリバリー(CI/CD)の実施を支援します。また、Azure DevOps を Git プロバイダとして構成することで、バージョン管理機能を利用できます。

Azure Databricks の展開は、デフォルトでは、仮想ネットワーク(VNet)を含む Azure 上のフルマネージドサービスとなります。Azure Databricks は、ネットワークセキュリティルールの完全な制御を可能にする独自の仮想ネットワーク内での展開(VNet インジェクションとも呼ばれる)もサポートしています。

リアルタイムデータインジェストサービスの Azure Event Hubs を Azure Databricks に接続し、メッセージを受信した時点で処理することで、ライブストリーミングデータを分析できます。Event Hubs と Azure Databricksre の統合により、あらゆる IoT デバイスや Web サイトのクリックストリームのログからの毎秒数百万件のイベントのストリーミングおよびリアルタイム処理が可能になります。

Azure Key Vault との統合により、キーやパスワードなどの機密情報を管理します。デフォルトでは、全ての Azure Databricks のノートブックとその結果は保存時に別の暗号化キーで暗号化されます。暗号化キーを自分で管理する Bring Your Own Key (BYOK) 機能も利用できます。










Azure Databricks にサインインするには、Azure Active Directory(Azure AD)を使用したシングルサインオンが最適です。Azure Databricks は、Azure AD を利用する自動ユーザープロビジョニングをサポートしており、新規ユーザーの作成、適切なアクセス権限の付与、ユーザーの削除に伴うアクセスのプロビジョニング解除が可能です。

Azure Databricks の ADLS へのネイティブコネクタは、データレイクへの複数のアクセス方法をサポートしています。Azure Active Directory の認証情報パススルーにより、Azure Databricks へのアクセスと同一の Azure AD 認証が使用できるため、データアクセスのセキュリティ管理がシンプルになります。また、データアクセスは、事前に設定した ADLS のロールとアクセス制御リストによって管理されます。

Azure Data Factory(ADF)を使用して Azure Databricks のジョブをシームレスに実行し、90 以上のビルトインデータソースコネクタを活用して、全てのデータソースを単一のデータレイクに取り込みます。ADF は、ビルトインおワークフロー制御、データ変換、パイプラインのスケジューリング、データ統合など多くの機能を提供し、信頼性の高いデータパイプラインの作成を支援します。

Azure Databricks は、Azure の各種サービスとの統合により、Microsoft の Web/モバイルアプリケーションにおける分析、BI、データサイエンスの展開を可能にします。また、Azure Databricks と Azure Synapse 間の高性能コネクタが、ストリーミングデータを含むサービス間のデータ転送を高速化します。

レイクハウス戦略に求められる主要な機能の 1 つは、データレイクのデータを BI ツールで直接、効率的かつセキュアに活用できることです。データレイクからデータウェアハウスにデータをコピーする従来のフローが不要になるため、余分なレイテンシ、コンピューティング、ストレージコストを回避できます。また、Power BI の Azure Databricks コネクタによって、データレイクに保存されているデータの、セキュアかつインタラクティブな視覚化が可能になります。

Azure Databricks は Azure DevOps と連携し、継続的インテグレーションと継続的デリバリー(CI/CD)の実施を支援します。また、Azure DevOps を Git プロバイダとして構成することで、バージョン管理機能を利用できます。

Azure Databricks の展開は、デフォルトでは、仮想ネットワーク(VNet)を含む Azure 上のフルマネージドサービスとなります。Azure Databricks は、ネットワークセキュリティルールの完全な制御を可能にする独自の仮想ネットワーク内での展開(VNet インジェクションとも呼ばれる)もサポートしています。

リアルタイムデータインジェストサービスの Azure Event Hubs を Azure Databricks に接続し、メッセージを受信した時点で処理することで、ライブストリーミングデータを分析できます。Event Hubs と Azure Databricksre の統合により、あらゆる IoT デバイスや Web サイトのクリックストリームのログからの毎秒数百万件のイベントのストリーミングおよびリアルタイム処理が可能になります。

Azure Key Vault との統合により、キーやパスワードなどの機密情報を管理します。デフォルトでは、全ての Azure Databricks のノートブックとその結果は保存時に別の暗号化キーで暗号化されます。暗号化キーを自分で管理する Bring Your Own Key (BYOK) 機能も利用できます。

無料お試し・その他のご相談を承っております

使ってみるデモをスケジュールする