Get Started with Databricks for Data Engineering - Korean

이 코스에서는 Databricks Data Intelligence Platform에서 기본적인 데이터 엔지니어링 워크플로를 수행하는 데 필요한 기초 기술을 소개합니다. 워크스페이스를 살펴보고, Unity Catalog를 사용하며, 데이터 엔지니어가 Databricks에서 일상적으로 활용하는 핵심 구성 요소를 학습합니다.

이 코스는 실습 중심으로 진행됩니다. 먼저 워크스페이스에 익숙해진 다음, 각 주제별로 데모와 랩 노트북을 짝지어 진행합니다. 데모에서는 강사 또는 가이드 노트북과 함께 개념을 살펴보고, 랩에서는 방금 학습한 내용을 직접 적용합니다.

다루는 내용은 다음과 같습니다.

• Databricks Data Intelligence Platform의 개요와 Databricks Workspace, Unity Catalog, 노트북이 어떻게 함께 작동하는지.

• Delta Lake 테이블의 생성 및 관리.

• INSERT, UPDATE, DELETE를 사용한 데이터 변경.

• Delta 테이블의 버전 기록 및 타임 트래블 살펴보기.

• Lakeflow Connect 옵션(CTAS, 업로드 UI, COPY INTO)을 사용한 데이터 수집.

• 브론즈, 실버, 골드 계층을 통해 데이터를 변환하는 메달리온 아키텍처 파이프라인 구축.

• Lakeflow Jobs를 사용한 파이프라인 자동화.

• (보너스) Spark Declarative Pipelines를 사용한 선언형 파이프라인 구축.

Languages Available: English | 日本語 | Português BR | 한국어

Skill Level

Onboarding

Duration

Prerequisites

이 과정에서는 다음과 같은 기술/지식/능력을 가진 참가자들을 위해 내용이 개발되었습니다:
• 클라우드 데이터 플랫폼에 대한 기본적인 이해. 데이터베이스, 테이블, 쿼리가 무엇인지 개념적으로 이해하고 있어야 합니다.

• SQL에 대한 실무 지식. WHERE, GROUP BY, 집계 함수를 포함한 SELECT 문을 읽고 작성할 수 있으며 INSERT, UPDATE, DELETE를 이해하고 있어야 합니다.

• 데이터 수집, 변환, 파이프라인과 같은 데이터 엔지니어링 개념에 대한 전반적인 이해가 있으면 도움이 되지만 필수는 아닙니다. 기초 내용은 이 코스에서 다룹니다.

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

Customer registration Partner registration

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

지금 등록하세요

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

지금 등록하세요

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Data Analyst

AI/BI for Data Analysts - Korean

이 코스에서는 데이터 분석가가 Databricks에서 AI/BI Dashboards를 설계, 구축, 게시 및 운영하는 방법을 배웁니다. AI/BI Dashboards는 거버넌스가 적용된 Unity Catalog 데이터를 대화형 시각화, 필터, Genie 통합과 결합하여, 비즈니스 사용자가 코드를 작성하지 않고도 답을 탐색할 수 있게 합니다.

이 코스는 하나의 엔드 투 엔드 구축을 따라 진행됩니다. Unity Catalog의 소스 테이블에서 시작하여, 게시되고 모니터링되는 여러 페이지 대시보드로 마무리합니다. 그 과정에서 대시보드가 더 넓은 Databricks AI/BI 제품군에서 어떻게 자리매김하는지, 그리고 Genie, 데이터 세트, 시각화, 필터가 각각 워크플로의 어디에 들어맞는지 배웁니다.

다루는 내용은 다음과 같습니다.

• AI/BI Dashboards의 기초와, 그것이 Genie 및 Databricks 플랫폼의 나머지 요소와 어떻게 관련되는지.

• Unity Catalog에서 소스 데이터를 탐색하고 SQL로 재사용 가능한 대시보드 데이터 세트를 설계하기.

• 시각화(KPI, 추세, 세부 분석) 작성 및 깔끔한 여러 페이지 대시보드 구성.

• Genie Code를 사용하여 자연어 프롬프트로부터 SQL, 차트, 필터의 초안을 작성하기.

• 필터를 추가하여 대시보드를 대화형으로 만들고 보는 사람의 질문에 응답하도록 하기.

• 적절한 사람이 대시보드를 보고 편집할 수 있도록 게시, 공유, 권한 관리하기.

• 예약된 새로 고침, 캐싱, 사용량 모니터링과 함께 대시보드를 프로덕션에서 운영하기.

코스를 마칠 무렵에는 비즈니스 질문에서 출발하여, 이를 뒷받침하는 데이터 세트를 설계하고, 완성도 높은 대시보드를 구축하며, 올바른 권한과 정확성을 유지하는 새로 고침 전략과 함께 대상에게 제공할 수 있게 됩니다.

참고: SCORM 강의 파일을 이용할 때는 콘텐츠를 모두 학습한 후 SCORM 창을 닫으시기 바랍니다. ‘다음 강의’ 버튼을 클릭하지 마십시오. 클릭할 경우 SCORM 모듈이 완료로 표시되지 않을 수 있습니다.

Paid & Subscription

Lab

Associate

Machine Learning Practitioner

Machine Learning Model Development - Korean

이 종합 강의는 Databricks에서 전통적인 머신러닝 모델을 개발하는 실용적인 가이드를 제공하며, 인기 있는 ML 라이브러리를 활용한 실습 시연과 워크플로우를 강조합니다. 참가자들은 회귀와 클러스터링 등 주요 ML 기법을 탐구하며 Databricks의 강력한 기능을 활용할 것입니다. 이 과정은 모델 추적을 위한 MLflow 통합, 특성 관리를 위한 Databricks Feature Store, 하이퍼파라미터 튜닝을 위한 Optuna를 다룹니다. 또한, 참가자들은 자연어, MCP 연결, 지침 및 기술을 활용해 전체 ML 수명 주기를 안내하는 Databricks의 AI 기반 코딩 어시스턴트인 Genie Code를 통해 모델 개발을 가속화하는 방법을 배우게 됩니다. 과정이 끝날 때에는 학습자들은 Databricks 환경에서 머신러닝 모델을 효율적으로 개발, 최적화, 배포할 수 있는 실용적인 기술과 실무 능력을 갖추게 됩니다.

Paid & Subscription

Lab

Associate

Building ETL Pipelines with SQL - Korean

이 과정은 Databricks Data Intelligence Platform에서 순수 SQL을 사용해 운영 준비가 된 ETL 파이프라인을 구축하는 방법을 가르칩니다. 학생들은 점진적 적재를 위한 Auto Loader가 포함된 스트리밍 테이블, 실버에서 골드로 변환을 위한 점진적 리프레시가 있는 Materialized Views, 선언적 SCD 타입 1 및 타입 2 차원 관리를 위한 AUTO CDC(FLOW AUTO CDC), 그리고 운영 오케스트레이션을 위한 SQL 파일 작업이 포함된 Lakeflow Jobs를 배웁니다. 이 과정은 메달리온 아키텍처(브론즈 → 실버 → 골드)를 통해 현실적인 소매 데이터셋을 따라갑니다.

Paid & Subscription

Lab

Associate