Databricks SQL(DB SQL)は、Databricks レイクハウスプラットフォームを基盤とするサーバーレスデータウェアハウスです。SQL と BI のあらゆるアプリケーションを最大 12 倍の価格性能、一元化されたガバナンス、オープンなフォーマットと API、任意のツールで大規模に実行できます。ロックインはありません。
最適な価格性能
サーバーレスな環境が、コストの削減と最適な価格性能を可能にします。クラウドインフラの管理、構成、拡張は必要ありません。
ガバナンスの一元化
オープン標準に則ってあらゆるデータを単一のコピーに集約し、データチームが標準 SQL を介して共有できるよう、ガバナンスを一元化します。
充実したエコシステム
SQL と、Fivetran、dbt、Power BI、Tableau などのツールを Databricks と連携させ、あらゆるデータの取り込み、変換、ク エリをインプレースで実行できます。
サイロ化の解消
全てのアナリストが最新のデータに迅速にアクセスし、ダウンストリームのリアルタイム分析を実行できるようになり、ML や BI などにおけるデータ活用が促進されます。
仕組み

エコシステムとのシームレスな統合
使いやすさ
実環境でのパフォーマンス
ガバナンスの一元化
オープンで信頼性の高いデータレイクが基盤

あらゆるデータの容易な取り込み、変換、オーケストレーション
データの場所を問わずデータを扱うことができます。ターンキー機能により、アナリストや分析エンジニアは Fivetranを使用して、クラウドストレージや Salesforce、Google Analytics、Marketo といったエンタープライズアプリケーションなどから、ワンクリックで容易にデータを取り込むことができます。取り込んだデータは、レイクハウスに組み込まれた ETL 機能により依存関係を管理し、インプレースでデータを変換するか、Databricks SQL の dbt など任意のツールを使用して、クラス最高の性能を実現できます。
「Databricks と Fivetran の組み合わせにより、堅牢で最新のデータパイプラインを短時間で構築できました。Fivetran は私たちが必要とする最適なコネクタと統合機能を備えています。」
Kreg Tool インサイト&アナリティクスディレクター Justin Wille 氏

任意のツールでモダンアナリティクスと BI を実行
Tableau、Power BI、Looker などの主要な BI ツールとのシームレスな連携により、アナリストは、任意のツールを使って完全かつ最新のデータから新たなビジネスの知見を発見できるようになります。アナリストは、Databricks SQL に内蔵された SQL エディタ、視覚化、ダッシュボード機能を利用して、共同でクエリの実行、検索、発見した知見の共有ができます。
「データをすぐに利用できるため、Power BI ダッシュボードやレポートに最新かつ完全なデータを利用しているという自信を持てます。」
ButcherBox シニアマネージャー兼ビジネスアナリティクス Jake Stone 氏

サーバーレスコンピューティングがリソース管理を排除
Databricks SQL のサーバーレスコンピューティングは、レイクハウスでのクラウドインフラの管理、構成、拡張を不要にするため、データチームは本来の業務に専念できるようになります。Databricks SQL ウェアハウスにより、ストレージから切り離された拡張性のある SQLのコンピュートを迅速に設定できます。高並列性のユースケースに対しては、自動的にスケールし、無制限の並列性を可能にします。
「Databricks SQL サーバーレスにより、Databricks SQL のパワーを利用しながら、インフラをより効率的に利用できます。」
Scribd プラットフォームエンジニアリング部門ディレクター R. Tyler Croy 氏

クラス最高の性能を可能にする設計
Databricks SQL には、あらゆるツール、クエリタイプ、リアルワールドのアプリケーションに対して最高のパフォーマンスを提供すべく、数千もの最適化機能が実装されています。これには、SQL ウェアハウスとともに、他のクラウド型データウェアハウスと比較して最大 12 倍の価格性能を実現した次世代ベクトル型クエリエンジンの Photon も含まれます。
「Databricks のレイクハウスプラットフォームにより、視聴者行動の分析結果を得るまでの時間が数週間から数分に短縮されました。」
CBC ラジオカナダ BI 部門シニアディレクター Stephane Caron 氏

標準 SQL であらゆるデータを一元保存・管理
オープンフォーマットの Delta Lake を使用してあらゆるデータの単一コピーを作成するため、データロックインを回避できます。分散したシステム間のデータの移動やコピーは不要で、レイクハウス上でインプレース分析や ETL/ELT を実行します。さらに、Databricks Unity Catalog では、データリネージ、クラウド間で標準 SQL を使用して、あらゆるデータを容易に発見、保護、管理できます。
「Databricks は私たちのビジネスの中核を担っています。レイクハウスアーキテクチャにより、実用的なデータへのアクセス、格納、共有を一元的に行うことができます。」
Punchh ビッグデータ担当ディレクター Jagan Mangalampalli 氏

レイクハウスプラットフォームが強化する共通データ基盤
Databricks レイクハウスプラットフォームは、モダンアナリティクスをはじめとする最新のニーズに対応する、完全なエンドツーエンドのデータウェアハウスソリューションです。クラウド型データウェアハウスと比較して僅かなコストで世界クラスの性能を実現します。未加工データから実践的なデータへの変換を高速化し、バッチとストリーミングを統合します。さらに、レイクハウスは、記述的分析だけでなく予測分析を容易にし、新たな知見の抽出を支援します。さらに、レイクハウスを使用することで、データチームは記述的分析だけではなく予測分析が容易にできるようになり、新たな知見を得ることができます。
「Databricks の導入により、データおよび分析チームは、単一のプラットフォームで、ABN アムロ全体のデータへアクセスし、共有できるようになりました。機械学習をベースとしたソリューションで自動化と気づきを推進しています。」
ABN アムロ銀行 アナリティクス・エンジニアリング部門責任者 ステファン・グロート氏
データブリックスソリューションへの移行
Hadoopやエンタープライズデータウェアハウスなどのレガシーシステムに関連するデータサイロ、遅いパフォーマンス、高いコストにうんざりしていませんか?Databricks Lakehouseへの移行:データ、分析、AIのすべてのユースケースに対応するモダンなプラットフォームです。
統合
エコシステムとのシームレスな統合により、データチームに高い柔軟性がもたらされます。従来型データウェアハウスにデータを移動させることなく、Fivetran でビジネスクリティカルなデータを取り込み、dbt を使用してインプレースで変換し、Power BI、Tableau、Looker で知見を抽出できます。
データインジェストと ETL
データガバナンス
BI とダッシュボード
+ Apache SparkTM 互換クライアント