Machine Learning with Databricks - Japanese

「Databricks を使った機械学習」へようこそ！

このコースは、Databricks での機械学習workflowsを習得するための第一歩です。専門の講師陣の指導のもと、データ準備、モデル開発、デプロイ、運用について深く学びます。Databricks に特化したデータ探索、モデルトレーニング、デプロイ戦略に必要なスキルを習得しましょう。コース修了時には、Databricks Platform上で機械学習のライフサイクル全体を円滑に進めるための知識と自信が身につき、堅牢な機械学習ソリューションを効率的に構築・デプロイできるようになります。

機械学習のためのデータ準備

本コースでは、Databricks を使用した機械学習向けデータ準備の基礎に焦点を当てます。受講者は、従来の機械学習アプリケーション向けにデータを探索、クリーニング、整理するための必須スキルを習得します。主なトピックには、データ可視化、特徴量エンジニアリング、および最適な特徴量保存戦略が含まれます。実践的な演習を通じて、参加者はDatabricks内で機械学習用のデータセットを効率的に準備する実践的な経験を積むことができます。本コースは、アソシエイトレベルのデータサイエンティストや機械学習の実務者、およびデータ準備のスキルを向上させ、機械学習モデルの導入を成功させるための強固な基盤を築きたいと考えている方を対象としています。

機械学習モデルの開発

この包括的なコースでは、Databricks で従来の機械学習モデルを開発するための実践的なガイドを提供し、一般的な ML ライブラリを使用した実践的なデモンストレーションとワークフローに重点を置いています。参加者は、Databricks の強力な機能を活用しながら、回帰やクラスタリングなどの主要な機械学習手法を学習します。このコースでは、モデル追跡のためのMLflow統合、機能管理のためのDatabricks Feature Store、ハイパーパラメーター調整のためのOptunaについて説明します。さらに、参加者は、自然言語、MCP 接続、指示、スキルを使用して機械学習ライフサイクル全体をガイドする Databricks の AI 搭載コーディングアシスタントである Genie Code を使用して、モデル開発を加速する方法を学びます。このコースを修了すると、学習者は Databricks 環境で機械学習モデルを効率的に開発、最適化、デプロイするための実践的なスキルを身に付けることができます。

機械学習モデルのデプロイ

本コースでは、3つの主要な機械学習デプロイ戦略を紹介し、Databricks における各戦略の実装方法を解説します。モデルデプロイの基礎を学んだ後、バッチ推論について詳しく掘り下げ、バッチ推論シナリオでのモデル活用に関する実践的なデモンストレーションや実習に加え、パフォーマンス最適化のための考慮事項についても解説します。コースの後半ではパイプラインデプロイを包括的に扱い、最後のセクションではリアルタイムデプロイに焦点を当てます。受講者は、実践的なデモンストレーションや実習を通じて、Model Serving を使用したモデルのデプロイや、リアルタイム推論のためのサービングendpointの活用について学びます。

機械学習運用（MLOps）

本コースでは、MLOpsとモデルライフサイクル管理に焦点を当て、機械学習モデルの運用について包括的に解説します。前半では、MLOpsの主要な構成要素とベストプラクティスを扱い、機械学習モデルを効果的に運用するための強固な基礎を築きます。後半では、モデルライフサイクルの基礎を深く掘り下げ、効率的なモデル管理のために「Model Registry」と「Unity Catalog」を連携させて、ライフサイクルを円滑に管理する方法を実演します。コース終了時には、受講者はMLOpsの原則に関する実践的な知見と包括的な理解を深め、機械学習モデル運用という複雑な領域を円滑にナビゲートするために必要なスキルを身につけることができます。

Languages Available: English | 日本語 | Português BR | 한국어

Skill Level

Associate

Duration

16h

Prerequisites

このコンテンツを受講する前に、少なくとも以下の内容に精通している必要があります：

• 「機械学習のためのDatabricks入門（オンボーディング）」コースを修了しているか、Databricks環境での作業に関する同等の基礎知識を有していること。

• データの前処理および分析のためのPythonプログラミングの中級レベルのスキル。

• 機械学習の基礎に関する基本的な理解。

• Databricks platform workflowsに精通していること。

• データ形式およびLakehouseの概念に関する基本的な知識。

• 探索的データ分析および基礎統計学に関する基礎的な理解。

• Databricks Data Intelligence Platformおよび基本的なワークスペース操作（クラスターの作成、ノートブックでのコード実行、基本的なノートブック操作、Gitからのリポジトリインポート）に精通していること。

• Python による中級レベルのプログラミング経験（データ操作ライブラリ（pandas、numpy）および API（databricks-sdk、REST endpoints）の操作を含む）

• 実験の追跡、モデルのロギング、モデルレジストリの操作、およびモデルのバージョン管理に関する MLflow の基礎知識

• モデルのトレーニング、評価、バッチ推論、リアルタイムデプロイメントの概念を含む、機械学習の基礎に関する理解

• データガバナンスおよびモデルレジストリ管理のための Unity Catalog の中級レベルの経験

• フィーチャーテーブル、フィーチャールックアップ、オフラインとオンラインのfeature storesの比較など、フィーチャーエンジニアリングの概念に関する基本的な知識

• Delta Lakeの運用（テーブルの作成、更新、ファイルの最適化、リキッドクラスタリング）およびデータストレージの最適化手法に関する理解

• 分散データ処理およびユーザー定義関数（UDF）に関するApache SparkおよびPySparkの基礎知識

• 機械学習の基本概念およびMLflowトラッキングに関する知識

• Databricks Workspaceおよびノートブックに精通していること

• Pythonの中級レベルの知識

• 分散データ処理およびユーザー定義関数（UDF）のためのApache SparkおよびPySparkに関する基礎知識

Outline

機械学習のためのデータ準備

• データの管理と探索

• データ準備と特徴量エンジニアリング

• Feature Store

機械学習モデルの開発

• モデル開発ワークフロー

• ハイパーパラメーターのチューニング

• エージェンティック機械学習

機械学習モデルのデプロイ

• モデルデプロイの基礎

• バッチデプロイ

• パイプラインデプロイ

• リアルタイムデプロイとオンラインストア

機械学習運用（MLOps）

• 最新のMLOps

• MLOpsソリューションの設計

• MLOpsソリューションの実装とモニタリング

Upcoming Public Classes

Date	Time	Your Local Time	Language	Price
Date	Time	Your Local Time	Language	Price	Oct 27 - 28	09 AM - 05 PM (Asia/Tokyo)	-	Japanese	$1500.00

Public Class Registration

If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.

Customer registration Partner registration

Private Class Request

If your company is interested in private training, please submit a request.

Request Private Training

See all our registration options

Upcoming Public Classes

Date	Time	Your Local Time	Language	Price
Date	Time	Your Local Time	Language	Price	Oct 27 - 28	09 AM - 05 PM (Asia/Tokyo)	-	Japanese	$1500.00

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

今すぐ登録

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

今すぐ登録

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Architecting Data Warehouses for Large-Scale Deployments - Japanese

本コースでは、大規模なデータウェアハウス環境のパフォーマンス最適化、コスト管理、およびセキュリティについて解説します。

本コースは、複数の事業部門にまたがり数百人から数千人のユーザーにサービスを提供するDatabricks環境の管理を担当するデータウェアハウス実務者を対象としています。本コースを受講することで、高いパフォーマンスとコスト効率を維持しつつ、セキュリティ基準への準拠を確保しながら、データウェアハウス運用を効率的に拡張するために必要なスキルを習得できます。

注記：Databricks Academyでは、Databricks環境内での教室セッションをノートブック形式に移行し、講義用スライドデッキの使用を終了します。講義ノートブックはVocareumラボ環境でアクセス可能です。

Languages Available: English | Português BR | 한국어 | Español | française

Building Reliable Conversational Agents with Genie - Japanese

このコースでは、Databricks の Genie Space の設計、構築および保守の方法を学びます。Genie Space は、ビジネスユーザーがガバナンスされたデータについて質問し、コードを書かずに SQL に基づく回答を受け取れる自然言語インターフェースです。

Genie が Databricks の AI/BI 製品ファミリーにどのように位置づけられるか、そして自然言語をどのように信頼できる SQL クエリに変換するかを学びます。このコースでは、正確で一貫性があり、信頼できる結果を提供する Genie Space を作成するために何が必要かに焦点を当てます。

ソースデータの理解とベンチマークの定義から、ナレッジストアのキュレーションツール一式を使った Genie Space の構成と改良まで、完全なエンドツーエンドのワークフローをたどります。これらのツールには、メタデータ、シノニム、プロンプトマッチング、SQL ロジック、サンプルクエリ、テキストの手順が含まれます。

また、Databricks One を通じてビジネスユーザーと Genie Space を共有する方法、Unity Catalog のガバナンスがどのように自動的に適用されるかを理解し、モニタリングとユーザーのフィードバックを使って品質を継続的に改善する方法も学びます。

コースを終える頃には、ガバナンスされたセルフサービスの会話型分析を大規模に提供する、本番運用の準備が整った Genie Space を作成および管理できるようになります。

Languages Available: English | 한국어

Building ETL Pipelines with SQL - Japanese

このコースでは、Databricks Data Intelligence Platform で純粋な SQL を使用して、本番運用に対応した ETL パイプラインを構築する方法を学びます。受講者は、増分インジェストのための Auto Loader を使用したストリーミングテーブル、Silver-to-Gold 変換のための増分更新を伴うマテリアライズドビュー、宣言型 SCD タイプ 1 およびタイプ 2 ディメンション管理のための AUTO CDC (FLOW AUTO CDC)、および本番オーケストレーションのための SQL ファイルタスクを使用した Lakeflow ジョブについて学習します。このコースでは、メダリオンアーキテクチャ(ブロンズ → シルバー → ゴールド)を通じて、現実的な小売データセットに従います。