ガートナー MQ データサイエンスおよび機械学習プラットフォーム部門のリーダー

先日リリースされた 2020 年ガートナー「マジック・クアドラント」データサイエンス・機械学習プラットフォーム部門において、Databricks はリーダーとして評価されました。

ガートナー MQ データサイエンスおよび機械学習プラットフォーム部門のリーダー
ガートナーは、ベンダー17社を対象に、「ビジョンの完全性と実行能力」についての比較評価を行いました。Databricksが高評価を得られたのは、次のような特長によるものと私たちは考えています。

  • ワークロードの集約とスケーラビリティ:Databricksは、データと機械学習のワークロードを集約し、業界・規模を問わず、あらゆるお客様の用途に対応する柔軟な拡張性を提供しています。
  • ビジョンの遂行力とパートナー・販売戦略:Databricksは、強力な市場モメンタムを背景に、ビジョンを遂行する能力とパートナー戦略、販売戦略を通じてさまざまな業界に向けてビジネスを拡大しています。
  • オープンソースとイノベーション:Databricksは、お客様の成功と、オープンソースコミュニティにおけるイノベーションに注力しています。

データとAIの統合と、大規模運用への対応

Databricksの大きな強みである統合データ分析プラットフォームは、データ処理と機械学習の大規模なワークロードを一箇所に集約して実行します。また、Databricksの導入は、ETLから探求データサイエンス、本稼働機械学習まで、シームレスなエンドツーエンドの統合によるTCOの大幅な削減と、価値創出までの時間(Time to Value)の短縮を可能にします。これらの点において、Databricksはお客様から高評価をいただいています。

Databricksを利用することで、データチームは、Delta Lakeを使用した高信頼性のデータパイプラインを構築できます。Delta Lakeは、既存のデータレイクの信頼性と性能を向上させます。また、データサイエンティストは、MLflowを使用して、データの調査やモデルの構築を一箇所に集約して実行できます。ノートブックにおける共同作業、追跡、実験やモデルの管理をライフサイクル全体で行い、一般的な機械学習フレームワークを含む、最適化されたビルトインの機械学習環境の利点を享受できます。Databricksでは、実験から本稼働に至るまで、自動管理された拡張性の高いクラスタを容易に設定して活用することができます。また、これまでにない高速性と拡張性で、あらゆる分析プロセスに対応します。

集約型プラットフォーム上でワークフローの全ステップを実行することで、セキュアな作業・共同作業、知識の管理が容易になり、セータチームの生産性が大幅に向上します。

「Databricksは、驚くほどパワフルな、エンドツーエンドのソリューションです。Databricksを導入したことで、多様な経験・知識を持つチームメンバーが、膨大なデータに迅速にアクセスし、活用できるようになりました。そのことが、データに基づいたビジネス上の実用的な意思決定を可能にしています。」
―コンデナスト社 AIインフラストラクチャ主席エンジニア ポール・フライゼル(Paul Fryzel)氏

多数の ISV および技術パートナーによる大規模なエコシステム

Databricksは、急速に成長する堅固なエコシステムを醸成しています。エコシステムは数百におよぶISVおよび技術パートナーで構成されており、Databricksをデータサイエンスおよびデータエンジニアリングの中心的な処理系プラットフォームとして活用するためのコネクタを構築し、提供しています。

Databricksは、Microsoftとの戦略的連携を通じて、AzureにおけるファーストパーティーサービスであるAzure Databricksを構築しています。これにより、Azureのセキュリティが担保されたシームレスな運用と、Azure Data Lake Storage、Azure Data Factory、Azure SQLデータウェアハウス、Azure Machine Learningなど、Azure Data Servicesの多くの主要機能とのネイティブな統合が可能となっています。

一方、DatabricksはAWSとも戦略的パートナーの関係にあり、AWS S3、AWS Glue、AWS Redshift、AWS SageMaker、およびIdentity and Access Management (IAM) との深い統合を提供しています。

さらに、データソースコネクタによって、データの場所を問わない容易なアクセスが可能になっています。Databricksのテーブルにおけるユーザー分析およびデータの可視化が、Databricksと直結するBIツール(Power BI、Tableau、Looker、Alteryx、Qlik、Modeなど)によってアクセス可能になっています。また、データパイプライン、ETL(Extract/Transform/Load、抽出・変換・格納)ジョブ、データの準備、アプリの統合などの開発においても、Azure Data Factory、Informatica、Talendその他のツールとの連携が可能です。Databricksは、前述のAzure Machine LearningおよびAWS SageMakerとの統合に加え、RStudio、Dataiku、DatRobotをはじめとする一般的なデータサイエンス/機械学習ツールとの統合機能も備えています。

「お客様の成功」と「オープンソース」に尽力しています

Databricksは、世界中のお客様に優れたサービスを提供すべく、業界や地理的な条件を超えてグローバルに成長しています。Databricksは、充実したサービスポートフォリオと、優秀なカスタマーサクセスエンジニアによって、お客様それぞれに最適な形での支援、コンサルティング、トレーニングを提供し、私たちのプラットフォームを最大限に活用していただくための包括的なアプローチを展開しています。さらに、Databricksのグローバルサポートチームは、現在3つの大陸と6つの異なるタイムゾーンに分散しており、お客様からのお問い合わせに迅速に対応しています。

データサイエンスはオープンソースが活用されている分野です。Apache Spark、Delta Lake、MLflowのオリジナル開発メンバーが創業したDatabricksは、コミュニティへの強いコミットメントを維持し、オープンソースプロジェクトにおける革新と貢献を継続しています。一例として、私たちはこれまでに、100,000名以上の開発者に対してApache SparkTMの教育と認証を実施した実績が挙げられます。

サンフランシスコで開催されたSpark + AI Summit 2018において発表したMLflow(完全な機械学習ライフサイクルのためのオープンソースのプラットフォーム)は、コミュニティにおいて多大な支持を得ています。MLflowは、PyPIにおける毎月のダウンロード数900,000以上、貢献ユーザー160名以上を有し、今や機械学習ライフサイクルの管理における標準となっています。

Delta Lakeは、2019年4月にオープンソース化するという発表を行って以来、多くのエンタープライズによって広範な導入が進んでいます。Databriksは、オープンソースコミュニティによるデータレイクの信頼性、品質、性能の向上を推進するため、Linux Foundationにプロジェクトを寄贈しました。Delta Lakeは、2017年の発表以来、4,000以上の組織で利用されており、ひと月当たりのデータ処理量は2エクサバイトを超えます。

まとめ

統合データ分析プラットフォームが、データ駆動型のイノベーションによる望ましいビジネス成果の達成を支援します。データサイエンス、機械学習、分析のための集約型プラットフォームが、さまざまなチームやプロセス、技術をひとつの大きな力に変えるのです。これにより、データおよび機械学習パイプライン全体における効果的なデータ系列とガバナンスが可能になります。

ご相談およびデモのご依頼を承っております。

『Gartner Magic Quadrant for Data Science and Machine Learning』(Peter Krensky、Pieter den Hamer、Erick Brethenoux、Jim Hare、Carlie Idoine、Alexander Linden、Svetlana Sicular、Farhan Choudhary共著、2020年2月11日)

Databricks 無料トライアル 使ってみる

ご登録

機械学習ライフサイクルを標準化する方法をお読みください。
ダウンロードする