Monitoring and Optimizing Apache Spark Workloads on Databricks - Korean

이 과정에서는 안전한 데이터 거버넌스, 액세스 제어 및 계보 추적을 위한 Unity Catalog에 중점을 두고 확장 가능한 데이터 워크플로를 위한 레이크하우스 아키텍처 및 메달리온 설계를 살펴봅니다. 커리큘럼에는 Delta Lake를 사용하여 신뢰할 수 있는 ACID 호환 파이프라인 구축이 포함됩니다. 파티셔닝, 캐싱, 쿼리 튜닝과 같은 Spark 최적화 기술을 살펴보고 실제 문제를 해결하기 위한 효율적인 데이터 엔지니어링 및 분석을 위한 성능 모니터링, 문제 해결 및 모범 사례를 배웁니다.

Languages Available: English | 日本語 | 한국어

Skill Level

Associate

Duration

Prerequisites

- 기본 프로그래밍 지식

- Python

에 대한 기본 지식 - SQL 쿼리(SELECT, JOIN, GROUP BY)에 대한 기본 이해

- 데이터 처리 개념

에 대한 기본 지식 - 사전 Spark 또는 Databricks 경험이 필요 없습니다.

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Customer registration Partner registration

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

지금 등록하세요

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

지금 등록하세요

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Get Started with Lakebase - Korean

이 입문 과정에서는 Databricks Data Intelligence Platform에 내장된 완전 관리형 PostgreSQL 서비스인 Databricks Lakebase를 소개하며, 이 서비스가 운영(OLTP) 및 분석(OLAP) 워크로드를 더욱 긴밀하게 통합하는 방식을 다룹니다.

이 과정은 OLTP와 OLAP 시스템을 비교하는 개념 강의를 시작으로, 두 시스템의 서로 다른 성능 특성, 스토리지 모델 및 일반적인 사용 사례를 설명합니다. 또한 데이터 이동, 지연 시간, 아키텍처의 복잡성 등 트랜잭션 데이터베이스와 분석 플랫폼을 별도로 유지 관리할 때 조직이 직면하는 과제들을 살펴볼 것입니다.

이어서 Databricks Lakebase가 Databricks Lakehouse와 직접 통합되는 PostgreSQL 호환 운영 데이터베이스를 제공함으로써, 운영 애플리케이션과 분석이 통합된 플랫폼 내에서 함께 작동하도록 지원하여 이러한 과제를 해결하는 방법을 배우게 됩니다.

실습을 통해 다음을 수행하게 됩니다:

오토스케일링 compute을 사용하여 Lakebase 프로젝트 생성 및 탐색

• 브랜칭, 모니터링, 구성 설정을 포함한 Lakebase UI 탐색

• Lakebase SQL 편집기를 사용하여 테이블 생성 및 쿼리 실행

• Lakehouse Federation 및 외부 카탈로그를 사용하여 Databricks에서 Lakebase 데이터 쿼리

• Delta 테이블을 Lakebase로 동기화하여 리버스 ETL 수행

• Python에서 Lakebase에 연결하여 기본 CRUD 작업 수행

이 과정은 입문 과정이므로, Lakebase를 활용하기 위한 핵심 개념과 기본 워크플로우를 이해하는 데 중점을 둡니다. Lakebase를 기반으로 완전한 프로덕션 애플리케이션을 구축하는 내용은 이 과정의 범위를 벗어납니다.

참고: SCORM 강의 파일을 이용할 때는 콘텐츠를 모두 학습한 후 SCORM 창을 닫으시기 바랍니다. ‘다음 강의’ 버튼을 클릭하지 마십시오. 클릭할 경우 SCORM 모듈이 완료로 표시되지 않을 수 있습니다.

Paid & Subscription

Onboarding

Apache Spark Developer

Developing Applications with Apache Spark™ - Korean

이 실습 과정에서 Apache Spark로 확장 가능한 데이터 처리를 마스터하세요. Spark의 DataFrame API를 사용하여 효율적인 ETL 파이프라인을 구축하고, 고급 분석을 수행하며, 분산 데이터 변환을 최적화하는 방법을 알아보세요. 그룹화, 집계, 조인, 집합 연산 및 창 함수를 살펴봅니다. 배열, 맵, 구조체와 같은 복잡한 데이터 유형으로 작업하면서 성능 최적화를 위한 모범 사례를 적용하세요.

Languages Available: English | 日本語 | 한국어

Paid & Subscription

Lab

Associate

Data Warehousing Practitioner

Data Warehousing with Databricks - Korean

이 과정은 Databricks의 데이터 웨어하우징 기능을 살펴보고자 하는 데이터 전문가를 위해 설계되었습니다. Databricks에 대한 사전 지식이 전혀 없다는 전제 하에, 이 과정은 Databricks를 최신 클라우드 기반 데이터 웨어하우징 솔루션으로 활용하는 방법을 소개합니다. 학습자는 업계 표준 TCP-DI 데이터 세트를 참조하여 Databricks Data Intelligence Platform을 사용하여 데이터를 효율적으로 수집, 변환, 관리 및 분석하는 방법을 알아봅니다. 학습자는 자연어 쿼리를 통해 데이터 탐색을 간소화하는 혁신적인 Databricks 기능인 Genie도 살펴보게 됩니다. 이 과정을 마치면 참가자는 Databricks를 사용하여 데이터 웨어하우스를 구현하고 최적화하는 기본 기술을 갖추게 됩니다.

Languages Available: English | 日本語 | Português BR | 한국어

Paid & Subscription

Lab

Associate