Developing Applications with Apache Spark™ - Korean

이 실습 과정에서 Apache Spark로 확장 가능한 데이터 처리를 마스터하세요. Spark의 DataFrame API를 사용하여 효율적인 ETL 파이프라인을 구축하고, 고급 분석을 수행하며, 분산 데이터 변환을 최적화하는 방법을 알아보세요. 그룹화, 집계, 조인, 집합 연산 및 창 함수를 살펴봅니다. 배열, 맵, 구조체와 같은 복잡한 데이터 유형으로 작업하면서 성능 최적화를 위한 모범 사례를 적용하세요.

Languages Available: English | 日本語 | 한국어

Skill Level

Associate

Duration

Prerequisites

- 기본 프로그래밍 지식

- Python 기본 이해

- SQL 쿼리(SELECT, JOIN, GROUP BY)

에 대한 기본 이해 - 데이터 처리 개념

에 대한 지식 - "Apache Spark 입문 과정" 또는 이전 Databricks 경험 필요

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Customer registration Partner registration

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

지금 등록하세요

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

지금 등록하세요

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Data Analyst

Get Started with Databricks for Data Warehousing - Korean

이 과정은 Databricks의 최신 데이터 웨어하우징 접근 방식에 대한 포괄적인 개요를 제공하며, 데이터 레이크하우스 아키텍처가 기존 데이터 웨어하우스의 장점과 클라우드의 유연성 및 확장성을 어떻게 결합하는지 강조합니다. Databricks Data Intelligence Platform에서 데이터 변환 및 분석을 향상시키는 AI 기반 기능에 대해 배우게 됩니다. 데이터 웨어하우징 실무자를 위해 설계된 이 과정은 Databricks에서 고성능 AI 기반 데이터 웨어하우스를 구축하고 관리하는 데 필요한 기본 정보를 제공합니다.

Languages Available: English | 日本語 | Português BR| 한국어

Free

instructor-led

Onboarding

Platform Administrator

Get Started with Databricks Platform Administration - Korean

이 과정에서는 Databricks Data Intelligence Platform의 기본적인 플랫폼 관리 방법을 학습하게 됩니다. Databricks 환경 내에서 효과적인 데이터 거버넌스를 위한 핵심 구성 요소인 Unity Catalog에 대한 포괄적인 개요를 제공합니다. 다섯 개의 모듈로 구성된 이 과정은 Databricks 인프라와 data intelligence platform에 대한 상세한 소개로 시작하며, Databricks Workspace에 대한 심층적인 안내를 포함합니다. Unity Catalog 내 데이터 거버넌스 원칙을 탐구하며 핵심 개념, 아키텍처 및 역할을 다룹니다. 또한 Unity Catalog 메타스토어와 클러스터 및 SQL 웨어하우스를 포함한 compute 리소스 관리에 중점을 둡니다. 마지막으로 권한, 세분화된 접근 제어, 데이터 객체 거버넌스 방법을 학습하여 데이터 접근 제어를 숙달하게 됩니다. 과정을 마치면 효과적인 데이터 거버넌스 구현, 컴퓨팅 자원 최적화, 강력한 데이터 보안 전략 적용을 위한 유니티 카탈로그 관리 필수 기술을 습득하게 됩니다. Databricks Labs 구독 구매 시, 실제 Databricks Workspace 환경에서 배운 내용을 실습할 수 있는 포괄적인 랩 연습으로 과정을 마무리합니다.

Languages Available: English | 日本語 | Português BR | 한국어

SQL Analytics on Databricks - Korean

이 과정에서는 Databricks SQL에 특히 초점을 맞춰 Databricks를 사용하여 데이터 분석을 효과적으로 수행하는 방법을 학습합니다. Databricks 데이터 애널리스트로서 귀하의 책임에는 관련 데이터를 찾고, 잠재적인 응용 프로그램을 위해 데이터를 분석하고, 귀중한 비즈니스 통찰력을 제공하는 형식으로 데이터를 변환하는 것이 포함됩니다.

또한 Databricks Data Intelligence Platform에서 Notebooks, SQL Editor, Databricks SQL과 같은 도구를 사용하여 데이터 객체를 관리하는 역할과 이를 조작하는 방법을 이해하게 됩니다.

또한, 데이터 자산과 전반적인 플랫폼을 관리하는 데 있어 Unity Catalog의 중요성에 대해서도 알아봅니다. 마지막으로, 이 과정에서는 Databricks가 어떻게 성능 최적화를 용이하게 하는지에 대한 개요를 제공하고, Databricks에서 SQL 분석을 실행할 때 내부적으로 발생하는 프로세스를 이해하기 위해 Query Insights에 액세스하는 방법을 알려드립니다.

Languages Available: English | 日本語 | Português BR | 한국어

Free

Associate