Databricks Data Privacy - Korean

이 콘텐츠는 Databricks 내에서 데이터 프라이버시를 관리하는 포괄적인 가이드를 제공합니다. 델타 레이크 아키텍처, 지역별 데이터 격리, GDPR/CCPA 준수, 변경 데이터 피드(CDF) 사용법 등 핵심 주제를 다룹니다. 실습 데모와 핸즈온 랩을 통해 참가자는 민감한 데이터를 보호하고 규정 준수를 보장하기 위한 Unity catalog 기능을 활용하는 방법을 배우며, 데이터 무결성을 효과적으로 보호할 수 있는 역량을 강화합니다.

Languages Available: English | 日本語 | Português BR | 한국어

Skill Level

Professional

Duration

Prerequisites

이 과정에서는 다음과 같은 기술/지식/능력을 가진 참가자들을 위해 내용이 개발되었습니다:

• Databricks 데이터 엔지니어링 및 데이터 사이언스 작업 공간을 사용하여 기본 코드 개발 태스크 수행 능력 (클러스터 생성, 노트북에서 코드 실행, 기본 노트북 작업 사용, git에서 저장소 가져오기 등)

• PySpark를 활용한 중급 프로그래밍 경험

• 다양한 파일 형식 및 데이터 소스에서 데이터 추출

• 데이터 정제를 위한 여러 일반적인 변환 적용

• 고급 내장 함수를 활용한 복잡한 데이터 재구성 및 조작

• Delta Lake를 활용한 중급 프로그래밍 경험(테이블 생성, 완전 및 증분 업데이트 수행, 파일 압축, 이전 버전 복원 등)

• Lakeflow Pipelines Editor를 사용한 데이터 파이프라인 구성 및 스케줄링 초급 경험

• PySpark를 사용한 Lakeflow Spark Declarative Pipelines 정의 초급 경험

• Auto Loader 및 PySpark 구문을 사용한 데이터 수집 및 처리

• APPLY CHANGES INTO 구문을 사용한 변경 데이터 캡처(CDCU) 피드 처리

• 파이프라인 이벤트 로그 및 결과 검토를 통한 DLT 구문 문제 해결

Outline

과정 소개

데이터 저장 안전하게

규정 준수

데이터 프라이버시

Unity Catalog

키 개념 및 구성요소

데이터 감사하기

데이터 격리

Unity Catalog에서 데이터 보안

PII 데이터 보안

가명화 및 익명화

요약 및 최고의 실천

PII 데이터 보안

스트리밍 데이터 그리고 CDF

변경된 데이터 캡처

데이터 삭제의 Databricks

CDF에서 레코드 처리 및 변경 사항 전파

CDF Lab을 통한 변경 사항 전파

Public Class Registration

If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.

Customer registration Partner registration

Private Class Request

If your company is interested in private training, please submit a request.

Request Private Training

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

지금 등록하세요

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

지금 등록하세요

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Architecting Data Warehouses for Large-Scale Deployments - Korean

이 과정에서는 대규모 data warehousing 배포를 위한 성능 최적화, 비용 관리 및 보안을 다룹니다.

이 과정은 여러 사업부에 걸쳐 수백 또는 수천 명의 사용자에게 서비스를 제공하는 Databricks 환경을 관리하는 data warehousing 실무자를 위해 설계되었습니다. 높은 성능, 비용 효율성, 보안 표준 준수를 유지하면서 data warehousing 운영을 효율적으로 확장하는 데 필요한 기술을 습득하게 됩니다.

참고: Databricks Academy는 Databricks 환경 내의 대면 강의 형식을 노트북 기반 방식으로 전환함에 따라, 강의용 슬라이드 사용이 중단됩니다. Vocareum 랩 환경에서 강의용 노트북에 액세스할 수 있습니다.

Building ETL Pipelines with SQL - Korean

이 과정은 Databricks Data Intelligence Platform에서 순수 SQL을 사용해 운영 준비가 된 ETL 파이프라인을 구축하는 방법을 가르칩니다. 학생들은 점진적 적재를 위한 Auto Loader가 포함된 스트리밍 테이블, 실버에서 골드로 변환을 위한 점진적 리프레시가 있는 Materialized Views, 선언적 SCD 타입 1 및 타입 2 차원 관리를 위한 AUTO CDC(FLOW AUTO CDC), 그리고 운영 오케스트레이션을 위한 SQL 파일 작업이 포함된 Lakeflow Jobs를 배웁니다. 이 과정은 메달리온 아키텍처(브론즈 → 실버 → 골드)를 통해 현실적인 소매 데이터셋을 따라갑니다.

Machine Learning Practitioner

Agent Evaluation on Databricks - Korean

이 과정은 MLflow의 평가 프레임워크를 활용해 AI 에이전트를 체계적으로 평가하는 방법을 가르치며, 전통적인 소프트웨어 테스트가 해결할 수 없는 비결정론적 AI 시스템의 독특한 도전 과제를 다룹니다. 학생들은 올바름과 안전성 같은 공통 기준에 대한 기본 내장 평가자, 사업 구체화 요구사항을 위한 가이드라인 평가자, 그리고 특화된 필요에 맞는 맞춤형 평가자 등 다양한 평가 방식을 구현하는 법을 배웁니다. 이 과정은 엄선된 데이터셋을 이용한 오프라인 평가와 온라인 생산 모니터링을 모두 포함하며, MLflow의 추적 기능을 활용해 에이전트 실행 패턴을 이해하고 다양한 이해관계자 유형으로부터 인간 피드백을 수집하는 실무 경험을 제공합니다. 실습 시연과 실험을 통해 학생들은 AI 에이전트 개발 수명 주기 전반에 걸쳐 지속적인 품질 개선을 이끄는 평가 워크플로우를 만드는 기술을 개발합니다.

Languages Available: English | 日本語 | Português BR | 한국어