Databricks プラットフォームで機械学習を展開
オープンなレイクハウスアーキテクチャを基盤とする Databricks のプラットフォームは、機械学習のためのデータの準備や処理を効率化し、チーム間のコラボレーションを支援し、実験から本番までの機械学習ライフサイクルの合理化を可能にします。
機械学習データをシンプルに
Because Databricks ML is built on an open lakehouse foundation with Delta Lake, you can empower your machine learning teams to access, explore and prepare any type of data, from batch or streaming pipelines, at any scale. Turn features into production pipelines in a self-service manner without depending on data engineering support.
実験追跡とガバナンスの自動化
マネージド MLflow により、実験を自動的に追跡し、トレーニング実行ごとのパラメータ、メトリクス、データとコードのバージョン、モデルの成果物を記録できます。実行履歴をすぐに確認でき、結果を比較したり、必要に応じて過去の結果を再現したりすることも可能です。本番環境に最適なモデルのバージョンを特定した後は、モデルレジストリに登録し、展開ライフサイクル全体のハンドオフを簡素化できます。
モデルのライフサイクル全体を動的に管理
トレーニングされたモデルを登録すると、モデルレジストリを使用してモデルのライフサイクルを共同管理できます。モデルのバージョン管理や移動は、実験、ステージング、本番環境、アーカイブなどさまざまな段階で可能です。ライフサイクル管理は、ロールベースのアクセス制御に従って、承認やガバナンスのワークフローと統合されています。また、コメントやメールの通知機能により、データチームのコラボレーション環境が充実します。
ML モデルの大規模展開を低レイテンシで
サーバーの管理やスケールの制限を気にすることなく、ワンクリックでモデルをデプロイできます。Databricks を使用することで、エンタープライズレベルの高可用性で、モデルを REST API エンドポイントとして任意の場所にデプロイできます。

製品コンポーネント
データブリックスソリューションへの移行
Hadoopやエンタープライズデータウェアハウスなどのレガシーシステムに関連するデータサイロ、遅いパフォーマンス、高いコストにうんざりしていませんか?Databricks Lakehouseへの移行:データ、分析、AIのすべてのユースケースに対応するモダンなプラットフォームです。