Databricks Performance Optimization - Korean

이 과정에서는 Spark와 Delta Lake를 활용해 워크로드와 물리적 레이아웃을 최적화하는 방법을 배우고, Spark UI를 분석하여 성능을 평가하고 애플리케이션을 디버깅하는 방법을 익히게 됩니다. 스트리밍, 유동적 클러스터링, 데이터 스키핑, 캐싱, 포토네이션 등 다양한 주제를 다룰 예정입니다.

메모: 이 과정은 'Databrick을 사용한 고급 데이터 엔지니어링' 과정 시리즈의 일부입니다.

Languages Available: English | 日本語 | Português BR | 한국어

Skill Level

Professional

Duration

Prerequisites

이 콘텐츠는 다음과 같은 기술/지식/능력을 갖춘 참가자를 위해 개발되었습니다 :

• Databricks를 사용하여 기본적인 코드 개발 태스크 수행 능력 (클러스터 생성, 노트북에서 코드 실행, 기본 노트북 작업 사용, git에서 저장소 가져오기 등)

• 다양한 파일 형식의 데이터 소스에서 데이터를 추출하고, 일반적인 변환을 적용하여 데이터를 정리하며, 고급 내장 함수를 사용하여 복잡한 데이터를 재구성 및 조작하는 등 PySpark에 대한 중급 프로그래밍 경험

• 테이블 생성, 완전 및 증분 업데이트 수행, 파일 압축, 이전 버전 복원 등 Delta Lake에 대한 중급 프로그래밍 경험

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Customer registration Partner registration

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

지금 등록하세요

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

지금 등록하세요

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Data Analyst

Get Started with Databricks for Data Warehousing - Korean

이 과정은 Databricks의 최신 데이터 웨어하우징 접근 방식에 대한 포괄적인 개요를 제공하며, 데이터 레이크하우스 아키텍처가 기존 데이터 웨어하우스의 장점과 클라우드의 유연성 및 확장성을 어떻게 결합하는지 강조합니다. Databricks Data Intelligence Platform에서 데이터 변환 및 분석을 향상시키는 AI 기반 기능에 대해 배우게 됩니다. 데이터 웨어하우징 실무자를 위해 설계된 이 과정은 Databricks에서 고성능 AI 기반 데이터 웨어하우스를 구축하고 관리하는 데 필요한 기본 정보를 제공합니다.

Languages Available: English | 日本語 | Português BR| 한국어

Free

instructor-led

Onboarding

Platform Administrator

Get Started with Databricks Platform Administration - Korean

이 과정에서는 Databricks Data Intelligence Platform의 기본적인 플랫폼 관리 방법을 학습하게 됩니다. Databricks 환경 내에서 효과적인 데이터 거버넌스를 위한 핵심 구성 요소인 Unity Catalog에 대한 포괄적인 개요를 제공합니다. 다섯 개의 모듈로 구성된 이 과정은 Databricks 인프라와 data intelligence platform에 대한 상세한 소개로 시작하며, Databricks Workspace에 대한 심층적인 안내를 포함합니다. Unity Catalog 내 데이터 거버넌스 원칙을 탐구하며 핵심 개념, 아키텍처 및 역할을 다룹니다. 또한 Unity Catalog 메타스토어와 클러스터 및 SQL 웨어하우스를 포함한 compute 리소스 관리에 중점을 둡니다. 마지막으로 권한, 세분화된 접근 제어, 데이터 객체 거버넌스 방법을 학습하여 데이터 접근 제어를 숙달하게 됩니다. 과정을 마치면 효과적인 데이터 거버넌스 구현, 컴퓨팅 자원 최적화, 강력한 데이터 보안 전략 적용을 위한 유니티 카탈로그 관리 필수 기술을 습득하게 됩니다. Databricks Labs 구독 구매 시, 실제 Databricks Workspace 환경에서 배운 내용을 실습할 수 있는 포괄적인 랩 연습으로 과정을 마무리합니다.

Languages Available: English | 日本語 | Português BR | 한국어

SQL Analytics on Databricks - Korean

이 과정에서는 Databricks SQL에 특히 초점을 맞춰 Databricks를 사용하여 데이터 분석을 효과적으로 수행하는 방법을 학습합니다. Databricks 데이터 애널리스트로서 귀하의 책임에는 관련 데이터를 찾고, 잠재적인 응용 프로그램을 위해 데이터를 분석하고, 귀중한 비즈니스 통찰력을 제공하는 형식으로 데이터를 변환하는 것이 포함됩니다.

또한 Databricks Data Intelligence Platform에서 Notebooks, SQL Editor, Databricks SQL과 같은 도구를 사용하여 데이터 객체를 관리하는 역할과 이를 조작하는 방법을 이해하게 됩니다.

또한, 데이터 자산과 전반적인 플랫폼을 관리하는 데 있어 Unity Catalog의 중요성에 대해서도 알아봅니다. 마지막으로, 이 과정에서는 Databricks가 어떻게 성능 최적화를 용이하게 하는지에 대한 개요를 제공하고, Databricks에서 SQL 분석을 실행할 때 내부적으로 발생하는 프로세스를 이해하기 위해 Query Insights에 액세스하는 방법을 알려드립니다.

Languages Available: English | 日本語 | Português BR | 한국어

Free

Associate