Databricks Performance Optimization - Korean

이 과정에서는 Spark와 Delta Lake를 활용해 워크로드와 물리적 레이아웃을 최적화하는 방법을 배우고, Spark UI를 분석하여 성능을 평가하고 애플리케이션을 디버깅하는 방법을 익히게 됩니다. 스트리밍, 유동적 클러스터링, 데이터 스키핑, 캐싱, 포토네이션 등 다양한 주제를 다룰 예정입니다.

메모: 이 과정은 'Databrick을 사용한 고급 데이터 엔지니어링' 과정 시리즈의 일부입니다.

Languages Available: English | 日本語 | Português BR | 한국어

Skill Level

Professional

Duration

Prerequisites

이 콘텐츠는 다음과 같은 기술/지식/능력을 갖춘 참가자를 위해 개발되었습니다 :

• Databricks를 사용하여 기본적인 코드 개발 태스크 수행 능력 (클러스터 생성, 노트북에서 코드 실행, 기본 노트북 작업 사용, git에서 저장소 가져오기 등)

• 다양한 파일 형식의 데이터 소스에서 데이터를 추출하고, 일반적인 변환을 적용하여 데이터를 정리하며, 고급 내장 함수를 사용하여 복잡한 데이터를 재구성 및 조작하는 등 PySpark에 대한 중급 프로그래밍 경험

• 테이블 생성, 완전 및 증분 업데이트 수행, 파일 압축, 이전 버전 복원 등 Delta Lake에 대한 중급 프로그래밍 경험

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Customer registration Partner registration

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

지금 등록하세요

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

지금 등록하세요

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Data Engineer

Deploy Workloads with Lakeflow Jobs - Korean

Lakeflow 작업를 사용하여 워크로드 배포 과정에서는 Databricks 에코시스템 내에서 통합 오케스트레이션 플랫폼으로 Lakeflow 작업를 사용하여 데이터, 분석 및 AI 워크플로를 오케스트레이션하고 자동화하는 방법을 설명합니다.

- DAG(Directed Acyclic Graphs)를 사용하여 데이터 워크로드를 설계 및 구현하고, 다양한 스케줄링 옵션을 구성하고, 조건부 태스크 실행, 실행-조건부 종속성 및 각 루프와 같은 고급 워크플로 기능을 구현하는 방법을 배웁니다.

- 이 과정에서는 적절한 컴퓨트 선택, 모듈식 오케스트레이션, 오류 처리 기술 및 내결함성 설계 - Databricks Data Intelligence Platform에 기본적으로 통합됨을 통해 강력한 프로덕션 준비 파이프라인을 만들기 위한 모범 사례를 다룹니다.

Languages Available: English | 日本語 | Português BR | 한국어

Data Ingestion with Lakeflow Connect - Korean

이 과정은 데이터 전문가가 Databricks Intelligence Platform을 활용하여 ETL 파이프라인을 생산화할 수 있도록 준비시킵니다. 학생들은 Spark SQL 및 Python과 함께 Delta Live Tables를 사용하여 다양한 데이터 소스의 새로운 데이터를 Lakehouse로 점진적으로 처리하는 파이프라인을 정의하고 예약합니다. 수강생들은 또한 Databricks Workflows를 사용하여 태스크를 오케스트레이션하고 Databricks Repos를 통해 코드를 프로모션합니다.

참고: 이 과정은 'Databricks을 사용한 데이터 엔지니어링' 과정 시리즈의 일부입니다.

Languages Available: English | 日本語 | Português BR | 한국어