주요 컨텐츠로 이동

Generative AI Engineering with Databricks - Korean

이 과정은 최신 인기 프레임워크와 Databricks 기능을 활용하여 생성형 AI 애플리케이션을 구축하고자 하는 데이터 과학자, 머신러닝 엔지니어 및 기타 데이터 실무자를 대상으로 합니다.


참고: Databricks Academy는 Databricks 환경 내 강의 세션을 노트북 기반 형식으로 전환하며, 첫 두 모듈 강의에서 슬라이드 데크 사용을 중단합니다. 강의 노트북은 Vocareum 랩 환경에서 확인할 수 있습니다.


아래에서는 본 과정에 포함된 4개의 4시간 모듈을 각각 설명합니다.


Databricks 기반 검색 에이전트 구축

이 과정은 Databricks Data Intelligence Platform에서 검색 에이전트를 구축하기 위한 실습 중심 교육을 제공합니다. 참가자는 비정형 문서를 구조화된 데이터로 파싱하고, 검색 워크플로우를 위해 콘텐츠를 변환 및 분할하며, 문서 검색을 위한 벡터 검색 솔루션을 구축하고, MLflow 및 Agent Bricks를 사용하여 운영 환경에 바로 적용 가능한 에이전트를 개발하는 방법을 학습합니다. 본 과정은 문서 처리부터 임베딩 생성, 벡터 인덱싱, 거버넌스 기능을 갖춘 에이전트 배포에 이르는 완전한 에이전트 라이프사이클을 다룹니다.


Databricks에서 단일 에이전트 애플리케이션 구축

이 과정은 Databricks Data Intelligence Platform에서 단일 에이전트 애플리케이션을 구축하기 위한 실습 교육을 제공합니다. 수강생은 Unity catalog 기능을 도구로 활용하는 AI 에이전트 생성, MLflow를 통한 포괄적인 추적 및 모니터링 구현, LangChain과 같은 기존 프레임워크와 Agent Bricks와 같은 최신 솔루션을 모두 사용한 에이전트 배포 방법을 학습합니다. 본 과정은 AI Playground에서의 초기 도구 생성 및 테스트부터 거버넌스, 평가, 지속적인 개선 기능을 갖춘 프로덕션 배포에 이르기까지 에이전트의 전체 라이프사이클을 다룹니다.


생성형 AI 애플리케이션 평가 및 거버넌스

이 과정에서는 생성형 AI 시스템을 평가하고 관리하는 방법을 소개합니다. 첫째, 평가 및 거버넌스/보안 시스템 구축의 의미와 동기를 살펴보겠습니다. 둘째, 평가 및 거버넌스 시스템을 Databricks Data Intelligence Platform에 연결합니다. 셋째, 특정 구성 요소 및 응용 프로그램 유형에 대한 다양한 평가 기법에 대해 알려드립니다. 마지막으로 이 과정은 성능 및 비용과 관련하여 전체 AI 시스템을 평가하는 분석으로 마무리됩니다.


생성형 AI 애플리케이션 배포 및 모니터링

이 과정에서는 생성형 AI 애플리케이션을 배포, 운영 및 모니터링하는 방법에 대한 자세한 내용을 다룹니다. 이 과정에서는 Model Serving과 같은 도구를 사용하여 생성형 AI 애플리케이션을 배포하는 기술을 습득할 수 있습니다. 또한 모범 사례와 권장 아키텍처에 따라 생성형 AI 애플리케이션을 운영하는 방법도 다룹니다. 마지막으로, Lakehouse Monitoring을 사용하여 생성형 AI 애플리케이션과 그 구성 요소를 모니터링하는 방법에 대해 설명합니다.


Languages Available: English | 日本語 | Português BR | 한국어

Skill Level
Associate
Duration
16h
Prerequisites
• 객체 지향 프로그래밍(OOP), 예외 처리, 데코레이터, 타입 힌트, 적절한 문서화를 포함한 생산 환경 수준의 Python 코드 작성 능력.

• 고급 SQL SELECT 쿼리 작성, 데이터 유형 및 NULL 값 처리, 재사용 가능하고 잘 문서화된 SQL 함수 생성 경험.

• Databricks workspace 및 노트북 탐색, compute 관리, Catalog Explorer 사용, Databricks 관리형 서비스 이해에 능숙함.

• 대규모 언어 모델(LLM) 동작, 기본 프롬프트 엔지니어링, RAG 개념, 에이전트 추론, REST API 및 JSON 페이로드 작업에 대한 이해.

• MLflow, 에이전트 프레임워크(예: LangChain) 및 AI 에이전트 기초와 같은 권장 Databricks 교육에 대한 기본적인 친숙도.

• 자연어 처리 개념에 대한 이해

• 프롬프트 엔지니어링/프롬프트 엔지니어링 모범 사례에 대한 이해

• Databricks Data Intelligence Platform에 대한 이해

• RAG에 대한 이해(데이터 준비, RAG 아키텍처 구축, 임베딩, 벡터, 벡터 데이터베이스 등의 개념)

• 다단계 추론 LLM 체인과 에이전트를 활용한 LLM 애플리케이션 구축 경험

• 평가 및 거버넌스를 위한 Databricks Data Intelligence Platform 도구 활용 경험

• 카탈로그 및 스키마를 포함한 Unity Catalog 개념 이해

• MLflow 기본 지식

Outline

Databricks에서 검색 에이전트 구축

• 문서 파싱 및 청킹

• 검색을 위한 벡터 검색

• 검색 에이전트 구축 및 로깅

• Agent Bricks


Databricks에서 단일 에이전트 애플리케이션 구축

• 에이전트의 기초

• 단일 에이전트 구축

• 재현 가능한 에이전트

• Agent Bricks를 활용한 생산 환경 준비 완료 에이전트

생성형 AI 애플리케이션 평가 및 거버넌스

• 생성형 AI 애플리케이션 평가의 중요성

• 생성형 AI 애플리케이션 보안 및 거버넌스

• 생성형 AI 평가 기법

• 엔드투엔드 애플리케이션 평가


생성형 AI 애플리케이션 배포 및 모니터링

• 모델 배포 기초

• 배치 배포

• 실시간 배포

• AI 시스템 모니터링

• LLMOps 개념

Upcoming Public Classes

Date
Time
Language
Price
Mar 23 - 24
09 AM - 05 PM (Asia/Seoul)
Korean
$1500.00
Apr 20 - 21
09 AM - 05 PM (Asia/Seoul)
Korean
$1500.00

Public Class Registration

If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.

Private Class Request

If your company is interested in private training, please submit a request.

See all our registration options

Registration options

Databricks has a delivery method for wherever you are on your learning journey

Runtime

Self-Paced

Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos

지금 등록하세요

Instructors

Instructor-Led

Public and private courses taught by expert instructors across half-day to two-day courses

지금 등록하세요

Learning

Blended Learning

Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase

Purchase now

Scale

Skills@Scale

Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

Upcoming Public Classes

Apache Spark Developer

Apache Spark™ Programming with Databricks - Korean

이 과정은 Databricks를 사용하여 Apache Spark 프로그래밍을 배우기 위한 적절한 시작점 역할을 합니다.

아래에서는 이 과정에 포함된 4개의 4시간짜리 모듈을 각각 설명합니다.

Introduction to Apache Spark

이 과정은 분산 아키텍처와 대규모 데이터 처리를 위한 실제 응용 프로그램에 중점을 두고 Apache Spark™에 대한 필수 지식을 제공합니다. 참가자는 프로그래밍 프레임워크를 탐색하고 Spark DataFrame API를 배우며 Python 기반 Spark 워크플로를 사용하여 데이터를 읽고, 쓰고, 변환하는 기술을 개발하십시오. 

Developing Applications with Apache Spark

이 실습 과정에서 Apache Spark로 확장 가능한 데이터 처리를 마스터하세요. Spark의 DataFrame API를 사용하여 효율적인 ETL 파이프라인을 구축하고, 고급 분석을 수행하며, 분산 데이터 변환을 최적화하는 방법을 알아보세요. 그룹화, 집계, 조인, 집합 연산 및 창 함수를 살펴봅니다. 배열, 맵, 구조체와 같은 복잡한 데이터 유형으로 작업하면서 성능 최적화를 위한 모범 사례를 적용하세요.

Stream Processing and Analysis with Apache Spark

이 과정에서 Apache Spark를 사용하여 스트림 처리 및 분석의 기본 사항을 알아보세요.™ 스트림 처리 기본 사항에 대한 확실한 이해를 얻고 Spark Structured Streaming API를 사용하여 애플리케이션을 개발합니다. 스트림 집계 및 창 분석과 같은 고급 기술을 탐색하여 실시간 데이터를 효율적으로 처리하세요. 이 과정에서는 동적 데이터 환경을 위한 확장 가능하고 장애에 강한 스트리밍 애플리케이션을 만드는 기술을 습득합니다.

Monitoring and Optimizing Apache Spark Workloads on Databricks

이 과정에서는 안전한 데이터 거버넌스, 액세스 제어 및 계보 추적을 위한 Unity Catalog에 중점을 두고 확장 가능한 데이터 워크플로를 위한 레이크하우스 아키텍처 및 메달리온 설계를 살펴봅니다. 커리큘럼에는 Delta Lake를 사용하여 신뢰할 수 있는 ACID 호환 파이프라인 구축이 포함됩니다. 파티셔닝, 캐싱, 쿼리 튜닝과 같은 Spark 최적화 기술을 살펴보고 실제 문제를 해결하기 위한 효율적인 데이터 엔지니어링 및 분석을 위한 성능 모니터링, 문제 해결 및 모범 사례를 배웁니다.

Languages Available: English | 日本語 | 한국어

Paid
16h
Lab
instructor-led
Associate

Questions?

If you have any questions, please refer to our Frequently Asked Questions page.