Developing Applications with Apache Spark™ - Japanese

このハンズオンコースでは、Apache Spark を使用したスケーラブルなデータ処理を習得します。 Spark の DataFrame API を使用して、効率的な ETL パイプラインを構築し、高度な分析を実行し、分散データ変換を最適化する方法を学びます。グループ化、集計、結合、集合演算、ウィンドウ関数について調べます。配列、マップ、構造体などの複雑なデータ型を操作しながら、パフォーマンス最適化のベストプラクティスを適用します。

Languages Available: English | 日本語 | 한국어

Skill Level

Associate

Duration

Prerequisites

- プログラミングの基礎知識

- Pythonに精通していること

- SQLクエリ(SELECT、JOIN、GROUP BY)の基本的な理解

- データ処理の概念に関する知識

- 「Apache Spark 入門コース」または以前の Databricks の経験が必要

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Customer registration Partner registration

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

今すぐ登録

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

今すぐ登録

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Data Analyst

AI/BI for Data Analysts - Japanese

このコースでは、データアナリストが Databricks で AI/BI Dashboards を設計、作成、公開、運用する方法を学びます。AI/BI Dashboards は、ガバナンスの効いた Unity Catalog のデータを、インタラクティブな可視化、フィルター、Genie 連携と組み合わせることで、ビジネスユーザーがコードを書かずに回答を探索できるようにします。

このコースは、1 つのエンドツーエンドの構築を通じて進めます。まず Unity Catalog のソーステーブルから始め、最終的に公開・監視された複数ページのダッシュボードを完成させます。その過程で、ダッシュボードが Databricks の AI/BI 製品ファミリー全体の中でどのように位置づけられるか、また Genie、データセット、可視化、フィルターがワークフローのどこに当てはまるかを学びます。

扱う内容は次のとおりです。

• AI/BI Dashboards の基礎と、それが Genie および Databricks プラットフォームの他の要素とどのように関係するか。

• Unity Catalog でのソースデータの探索と、SQL を使用した再利用可能なダッシュボードデータセットの設計。

• 可視化（KPI、トレンド、内訳）の作成と、見やすい複数ページのダッシュボードのレイアウト。

• Genie Code を使用して、自然言語のプロンプトから SQL、チャート、フィルターを作成すること。

• フィルターを追加して、ダッシュボードをインタラクティブにし、閲覧者の疑問に応えられるようにすること。

• 適切な人がダッシュボードを表示・編集できるよう、公開、共有、アクセス権の管理を行うこと。

• スケジュールされた更新、キャッシュ、使用状況の監視を伴って、ダッシュボードを本番環境で運用すること。

コースを修了するころには、ビジネス上の課題を起点として、それを支えるデータセットを設計し、洗練されたダッシュボードを作成し、適切なアクセス権と、正確性を保つための更新戦略とともに対象ユーザーへ提供できるようになります。

注：SCORM形式の講義ファイルをご利用の際は、コンテンツをすべて終了した後、必ずSCORMウィンドウを閉じてください。「next lesson」ボタンをクリックしないでください。クリックすると、SCORMモジュールが完了として認識されなくなる可能性があります。

Free

Associate

Databricks Get Started Days (Data Engineering + SQL Analytics and BI) - Japanese

Get Started with Databricks for Data Engineering

このコースでは、Databricks Data Intelligence Platform で基本的なデータエンジニアリングのワークフローを実行するために必要な基礎スキルを学びます。ワークスペースを操作し、Unity Catalog を使用しながら、データエンジニアが Databricks で日常的に活用する基本的な構成要素を習得します。

このコースは実践的な構成になっています。まずワークスペースの基本を理解し、その後、各トピックについてデモとラボのノートブックをペアで進めていきます。デモではインストラクターまたはガイド付きノートブックとともに概念を確認し、ラボでは学んだ内容を自分自身で実践します。

Get Started with SQL Analytics and BI on Databricks

このコースでは、Databricks Data Intelligence Platform を使用してシンプルなデータ分析ワークフローを実行し、データウェアハウスの取り組みをサポートするための基本的なスキルを学習します。ワークスペースのツアーが提供され、カタログ、スキーマ、テーブル、コンピューティングクラスター、ノートブック、ダッシュボードなどのDatabricksのデータオブジェクトを操作する方法が示されます。次に、基本的なデータ分析workflowに従って、Databricks SQLを使用してデータを操作したり、Delta Lakeバージョンログを利用してタイムトラベルしたり、プラットフォーム内でダッシュボードを作成したり、自然言語プロンプトを使用してデータ探索用のジニースペースを作成したりといったタスクを実行します。また、Databricks SQL、Delta Live Tables、Unity Catalogを使用して、Databricksがデータウェアハウスのニーズをどのようにサポートするかについても学習します。 Databricks Labsサブスクリプションを購入すると、コースの最後には、学習した内容をライブDatabricks Workspace環境で実践する総合的なラボ演習も実施されます。

Databricks Free Editionアカウントを作成すれば、実践的な環境でデモを実際に試すことができます。

Free

instructor-led

Onboarding

Machine Learning Model Development - Japanese

この包括的なコースでは、Databricks で従来の機械学習モデルを開発するための実践的なガイドを提供し、一般的な ML ライブラリを使用した実践的なデモンストレーションとワークフローに重点を置いています。参加者は、Databricks の強力な機能を活用しながら、回帰やクラスタリングなどの主要な機械学習手法を学習します。このコースでは、モデル追跡のためのMLflow統合、機能管理のためのDatabricks Feature Store、ハイパーパラメーター調整のためのOptunaについて説明します。さらに、参加者は、自然言語、MCP 接続、指示、スキルを使用して機械学習ライフサイクル全体をガイドする Databricks の AI 搭載コーディングアシスタントである Genie Code を使用して、モデル開発を加速する方法を学びます。このコースを修了すると、学習者は Databricks 環境で機械学習モデルを効率的に開発、最適化、デプロイするための実践的なスキルを身に付けることができます。

Free

Associate