メインコンテンツへジャンプ

Machine Learning with Databricks - Japanese

「Databricks を使った機械学習」へようこそ!

このコースは、Databricks での機械学習workflowsを習得するための第一歩です。専門の講師陣の指導のもと、データ準備、モデル開発、デプロイ、運用について深く学びます。Databricks に特化したデータ探索、モデルトレーニング、デプロイ戦略に必要なスキルを習得しましょう。コース修了時には、Databricks Platform上で機械学習のライフサイクル全体を円滑に進めるための知識と自信が身につき、堅牢な機械学習ソリューションを効率的に構築・デプロイできるようになります。

 

機械学習のためのデータ準備

本コースでは、Databricks を使用した機械学習向けデータ準備の基礎に焦点を当てます。受講者は、従来の機械学習アプリケーション向けにデータを探索、クリーニング、整理するための必須スキルを習得します。主なトピックには、データ可視化、特徴量エンジニアリング、および最適な特徴量保存戦略が含まれます。実践的な演習を通じて、参加者はDatabricks内で機械学習用のデータセットを効率的に準備する実践的な経験を積むことができます。本コースは、アソシエイトレベルのデータサイエンティストや機械学習の実務者、およびデータ準備のスキルを向上させ、機械学習モデルの導入を成功させるための強固な基盤を築きたいと考えている方を対象としています。

 

機械学習モデルの開発

この包括的なコースでは、Databricks上で従来の機械学習モデルを開発するための実践的なガイドを提供し、一般的なMLライブラリを用いたハンズオン演習やworkflowsに重点を置いています。受講者は、Databricksの強力な機能を活用しながら、回帰分析やクラスタリングを含む主要な機械学習手法について学びます。本コースでは、モデル追跡のためのMLflowの統合、特徴量管理のためのDatabricks Feature Store、ハイパーパラメータ調整のためのOptunaについて解説します。さらに、Databricks AutoMLを使用してモデルトレーニングを高速化する方法についても学びます。コース終了時には、Databricks環境において機械学習モデルを効率的に開発、最適化、デプロイするための実践的なスキルを習得できます。

 

機械学習モデルのデプロイ

本コースでは、3つの主要な機械学習デプロイ戦略を紹介し、Databricks における各戦略の実装方法を解説します。モデルデプロイの基礎を学んだ後、バッチ推論について詳しく掘り下げ、バッチ推論シナリオでのモデル活用に関する実践的なデモンストレーションや実習に加え、パフォーマンス最適化のための考慮事項についても解説します。コースの後半ではパイプラインデプロイを包括的に扱い、最後のセクションではリアルタイムデプロイに焦点を当てます。受講者は、実践的なデモンストレーションや実習を通じて、Model Serving を使用したモデルのデプロイや、リアルタイム推論のためのサービングendpointの活用について学びます。

 

機械学習運用(MLOps)

本コースでは、MLOpsとモデルライフサイクル管理に焦点を当て、機械学習モデルの運用について包括的に解説します。前半では、MLOpsの主要な構成要素とベストプラクティスを扱い、機械学習モデルを効果的に運用するための強固な基礎を築きます。後半では、モデルライフサイクルの基礎を深く掘り下げ、効率的なモデル管理のために「Model Registry」と「Unity Catalog」を連携させて、ライフサイクルを円滑に管理する方法を実演します。コース終了時には、受講者はMLOpsの原則に関する実践的な知見と包括的な理解を深め、機械学習モデル運用という複雑な領域を円滑にナビゲートするために必要なスキルを身につけることができます。


Languages Available: English | 日本語 | Português BR | 한국어

Skill Level
Associate
Duration
16h
Prerequisites

このコンテンツを受講する前に、少なくとも以下の内容に精通している必要があります:

• 「機械学習のためのDatabricks入門(オンボーディング)」コースを修了しているか、Databricks環境での作業に関する同等の基礎知識を有していること。

• データの前処理および分析のためのPythonプログラミングの中級レベルのスキル。

• 機械学習の基礎に関する基本的な理解。

• Databricks platform workflowsに精通していること。

• データ形式およびLakehouseの概念に関する基本的な知識。

• 探索的データ分析および基礎統計学に関する基礎的な理解。

• Databricks Data Intelligence Platformおよび基本的なワークスペース操作(クラスターの作成、ノートブックでのコード実行、基本的なノートブック操作、Gitからのリポジトリインポート)に精通していること。

• Python による中級レベルのプログラミング経験(データ操作ライブラリ(pandas、numpy)および API(databricks-sdk、REST endpoints)の操作を含む)

• 実験の追跡、モデルのロギング、モデルレジストリの操作、およびモデルのバージョン管理に関する MLflow の基礎知識

• モデルのトレーニング、評価、バッチ推論、リアルタイムデプロイメントの概念を含む、機械学習の基礎に関する理解

• データガバナンスおよびモデルレジストリ管理のための Unity Catalog の中級レベルの経験

• フィーチャーテーブル、フィーチャールックアップ、オフラインとオンラインのfeature storesの比較など、フィーチャーエンジニアリングの概念に関する基本的な知識

• Delta Lakeの運用(テーブルの作成、更新、ファイルの最適化、リキッドクラスタリング)およびデータストレージの最適化手法に関する理解

• 分散データ処理およびユーザー定義関数(UDF)に関するApache SparkおよびPySparkの基礎知識

• 機械学習の基本概念およびMLflowトラッキングに関する知識

• Databricks Workspaceおよびノートブックに精通していること

• Pythonの中級レベルの知識

Outline

機械学習のためのデータ準備

• データの管理と探索

• データ準備と特徴量エンジニアリング

• Feature Store

 

機械学習モデルの開発

• モデル開発のワークフロー

• ハイパーパラメータのチューニング

• AutoML

 

機械学習モデルのデプロイ

• モデルデプロイの基礎

• バッチデプロイ

• パイプラインデプロイ

• リアルタイムデプロイとオンラインストア

 

機械学習運用(MLOps)

• 最新のMLOps

• MLOpsソリューションの設計

• MLOpsソリューションの実装とモニタリング

Upcoming Public Classes

Date
Time
Your Local Time
Language
Price
Jun 02 - 03
09 AM - 05 PM (Asia/Tokyo)
-
Japanese
$1500.00
Jun 23 - 24
09 AM - 05 PM (Asia/Tokyo)
-
Japanese
$1500.00
Jul 28 - 29
09 AM - 05 PM (Asia/Tokyo)
-
Japanese
$1500.00

Public Class Registration

If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.

Private Class Request

If your company is interested in private training, please submit a request.

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Runtime

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

今すぐ登録

Instructors

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

今すぐ登録

Learning

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Scale

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Data Engineer

Automated Deployment with Databricks Asset Bundles - Japanese

このコースでは、DevOpsの原則とDatabricks projectへの応用について包括的に解説します。まず、DevOps、DataOps、継続的インテグレーション(CI)、継続的デプロイメント(CD)、テストといった中核概念の概要から始め、これらの原則をデータエンジニアリングパイプラインに適用する方法を探求します。

コースでは次に、CI/CDプロセス内での継続的デプロイに焦点を当て、プロジェクトデプロイのためのDatabricks REST API、SDK、CLIなどのツールを検証します。Databricks Asset Bundles(DAB)について学び、それらがCI/CDプロセスにどのように組み込まれるかを理解します。DABの主要コンポーネント、フォルダ構造、Databricks内の様々なターゲット環境へのデプロイを効率化する仕組みについて深く掘り下げます。さらに、Databricks CLIを使用して、異なる構成を持つ複数環境向けにDatabricks Asset Bundlesの変数追加、修正、検証、デプロイ、実行を行う方法も学びます。

最後に、本コースではVisual Studio Codeをインタラクティブ開発環境(IDE)として紹介し、Databricks Asset Bundlesのローカル環境でのビルド、テスト、デプロイを可能にすることで開発プロセスを最適化します。コースの締めくくりとして、GitHub Actionsを用いたデプロイパイプラインの自動化を紹介し、Databricks Asset Bundlesを用いたCI/CDワークフローの強化を図ります。

本コース修了時には、Databricks Asset Bundles を使用して Databricks projectのデプロイを自動化し、DevOps プラクティスを通じて効率性を向上させるスキルを身につけることができます。

Languages Available: English | 日本語 | Português BR | 한국어

Paid
4h
Lab
instructor-led
Professional

Questions?

If you have any questions, please refer to our Frequently Asked Questions page.