Databricks Performance Optimization - Korean
이 과정에서는 Spark와 Delta Lake를 활용해 워크로드와 물리적 레이아웃을 최적화하는 방법을 배우고, Spark UI를 분석하여 성능을 평가하고 애플리케이션을 디버깅하는 방법을 익히게 됩니다. 스트리밍, 유동적 클러스터링, 데이터 스키핑, 캐싱, 포토네이션 등 다양한 주제를 다룰 예정입니다.
메모: 이 과정은 'Databrick을 사용한 고급 데이터 엔지니어링' 과정 시리즈의 일부입니다.
Languages Available: English | 日本語 | Português BR | 한국어
이 콘텐츠는 다음과 같은 기술/지식/능력을 갖춘 참가자를 위해 개발되었습니다 :
• Databricks를 사용하여 기본적인 코드 개발 태스크 수행 능력 (클러스터 생성, 노트북에서 코드 실행, 기본 노트북 작업 사용, git에서 저장소 가져오기 등)
• 다양한 파일 형식의 데이터 소스에서 데이터를 추출하고, 일반적인 변환을 적용하여 데이터를 정리하며, 고급 내장 함수를 사용하여 복잡한 데이터를 재구성 및 조작하는 등 PySpark에 대한 중급 프로그래밍 경험
• 테이블 생성, 완전 및 증분 업데이트 수행, 파일 압축, 이전 버전 복원 등 Delta Lake에 대한 중급 프로그래밍 경험
Self-Paced
Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos
Registration options
Databricks has a delivery method for wherever you are on your learning journey
Self-Paced
Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos
지금 등록하세요Instructor-Led
Public and private courses taught by expert instructors across half-day to two-day courses
지금 등록하세요Blended Learning
Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase
Purchase nowSkills@Scale
Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

