주요 컨텐츠로 이동

Developing Applications with Apache Spark™ - Korean

이 실습 과정에서 Apache Spark로 확장 가능한 데이터 처리를 마스터하세요. Spark의 DataFrame API를 사용하여 효율적인 ETL 파이프라인을 구축하고, 고급 분석을 수행하며, 분산 데이터 변환을 최적화하는 방법을 알아보세요. 그룹화, 집계, 조인, 집합 연산 및 창 함수를 살펴봅니다. 배열, 맵, 구조체와 같은 복잡한 데이터 유형으로 작업하면서 성능 최적화를 위한 모범 사례를 적용하세요.


Languages Available: English | 日本語 | 한국어

Skill Level
Associate
Duration
4h
Prerequisites

- 기본 프로그래밍 지식

 - Python 기본 이해

 - SQL 쿼리(SELECT, JOIN, GROUP BY)

에 대한 기본 이해 - 데이터 처리 개념

에 대한 지식 - "Apache Spark 입문 과정" 또는 이전 Databricks 경험 필요

Public Class Registration

If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.

Private Class Request

If your company is interested in private training, please submit a request.

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Runtime

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

지금 등록하세요

Instructors

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

지금 등록하세요

Learning

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Scale

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Data Analyst

Data Analysis with Databricks - Korean

이 교육 과정에서는 Databricks SQL에 대한 포괄적인 소개를 제공합니다. 학습자는 데이터를 수집하고, 쿼리를 작성하고, 시각화 및 대시보드를 만들고, 알림을 구성합니다. 이 과정을 통해 Databricks 공인 데이터 분석가 자격증 시험을 준비할 수 있습니다.이 과정은 4시간짜리 두 개의 모듈로 구성됩니다.

 

SQL Analytics on Databricks

이 과정에서는 Databricks SQL에 특히 초점을 맞춰 Databricks를 사용하여 데이터 분석을 효과적으로 수행하는 방법을 학습합니다. Databricks 데이터 애널리스트로서 귀하의 책임에는 관련 데이터를 찾고, 잠재적인 응용 프로그램을 위해 데이터를 분석하고, 귀중한 비즈니스 통찰력을 제공하는 형식으로 데이터를 변환하는 것이 포함됩니다. 

또한 Databricks Data Intelligence Platform에서 Notebooks, SQL Editor, Databricks SQL과 같은 도구를 사용하여 데이터 객체를 관리하는 역할과 이를 조작하는 방법을 이해하게 됩니다. 

또한, 데이터 자산과 전반적인 플랫폼을 관리하는 데 있어 Unity Catalog의 중요성에 대해서도 알아봅니다. 마지막으로, 이 과정에서는 Databricks가 어떻게 성능 최적화를 용이하게 하는지에 대한 개요를 제공하고, Databricks에서 SQL 분석을 실행할 때 내부적으로 발생하는 프로세스를 이해하기 위해 Query Insights에 액세스하는 방법을 알려드립니다.

AI/BI for Data Analysts

이 코스에서는 데이터 분석가가 Databricks에서 AI/BI Dashboards를 설계, 구축, 게시 및 운영하는 방법을 배웁니다. AI/BI Dashboards는 거버넌스가 적용된 Unity Catalog 데이터를 대화형 시각화, 필터, Genie 통합과 결합하여, 비즈니스 사용자가 코드를 작성하지 않고도 답을 탐색할 수 있게 합니다.

이 코스는 하나의 엔드 투 엔드 구축을 따라 진행됩니다. Unity Catalog의 소스 테이블에서 시작하여, 게시되고 모니터링되는 여러 페이지 대시보드로 마무리합니다. 그 과정에서 대시보드가 더 넓은 Databricks AI/BI 제품군에서 어떻게 자리매김하는지, 그리고 Genie, 데이터 세트, 시각화, 필터가 각각 워크플로의 어디에 들어맞는지 배웁니다.

다루는 내용은 다음과 같습니다.

• AI/BI Dashboards의 기초와, 그것이 Genie 및 Databricks 플랫폼의 나머지 요소와 어떻게 관련되는지.

• Unity Catalog에서 소스 데이터를 탐색하고 SQL로 재사용 가능한 대시보드 데이터 세트를 설계하기.

• 시각화(KPI, 추세, 세부 분석) 작성 및 깔끔한 여러 페이지 대시보드 구성.

• Genie Code를 사용하여 자연어 프롬프트로부터 SQL, 차트, 필터의 초안을 작성하기.

• 필터를 추가하여 대시보드를 대화형으로 만들고 보는 사람의 질문에 응답하도록 하기.

• 적절한 사람이 대시보드를 보고 편집할 수 있도록 게시, 공유, 권한 관리하기.

• 예약된 새로 고침, 캐싱, 사용량 모니터링과 함께 대시보드를 프로덕션에서 운영하기.

참고: Databricks Academy는 Databricks 환경 내의 대면 강의 형식을 노트북 기반 방식으로 전환함에 따라, 강의용 슬라이드 사용이 중단됩니다. Vocareum 랩 환경에서 강의용 노트북에 액세스할 수 있습니다.

Languages Available: English | 日本語 | Português BR | 한국어

Paid
8h
Lab
instructor-led
Associate

Questions?

If you have any questions, please refer to our Frequently Asked Questions page.