주요 컨텐츠로 이동

Data and AI Summit 2023에서 발표된 레이크하우스 AI

생성형 AI 아키텍처 패턴

모든 아키텍처 패턴을 고려한 프로덕션 품질의 생성형 AI 구축

lakehouse-monitoring-header-image.png

생성형 AI 솔루션 구축 시작

대규모 언어 모델(LLM) 솔루션을 구축할 때는 4가지 아키텍처 패턴을 고려해야 합니다.

Databricks는 4가지 생성형 AI 아키텍처 패턴 중에서 가장 저렴한 비용으로 고품질 솔루션을 구축하도록 지원하는 유일한 공급업체입니다.

gen ai

프롬프트 엔지니어링

프롬프트 엔지니어링은 기본 모델을 변경하지 않고 더 나은 답변을 이끌어내기 위해 프롬프트를 맞춤 설정하는 방식입니다. Databricks에서는 프롬프트 엔지니어링이 쉬운데, 마켓플레이스(Llama 2 및 MPT와 같이 많이 사용되는 오픈 소스 모델 포함)에서 사용 가능한 모델을 찾고, 모델 서빙의 엔드포인트 뒤에서 모델을 제공하고, 플레이그라운드 또는 MLflow의 사용하기 쉬운 UI에서 프롬프트를 평가하면 됩니다.

검색 증강 생성(Retrieval Augmented Generation, RAG)

RAG는 질문이나 작업과 관련된 데이터/문서를 찾아 이를 LLM의 컨텍스트로 제공하여 관련성 높은 답변을 제공합니다. 


Databricks는 데이터 준비, 검색 모델, 언어 모델(SaaS 또는 오픈 소스), 순위 지정 및 사후 처리 파이프라인, 프롬프트 엔지니어링, 학습 모델 등 RAG 프로세스의 모든 측면을 결합하고 최적화하는 데 도움이 되는 RAG 도구 모음을 제공합니다.

미세 조정

미세 조정은 자체 데이터와 함께 조직의 IP를 사용하여 추가 학습을 수행하여 기존의 범용 LLM 모델을 조정합니다. Databricks 미세 조정을 사용하면 MPT-30B, Llama 2, BGE와 같이 Databricks에서 선별한 모델을 포함하여 원하는 LLM 모델로 시작하고 새로운 데이터세트를 기반으로 추가 학습을 수행할 수 있습니다. 

사전 학습

사전 학습은 모델의 기반 지식이 특정 도메인에 맞게 조정되도록 처음부터 새로운 LLM 모델을 구축하는 방식입니다. 조직의 IP와 데이터를 바탕으로 학습하면 고유하게 차별화된 맞춤형 모델이 생성됩니다. Databricks Mosaic AI 사전 학습은 최대 10배 더 낮은 학습 비용으로 며칠 만에 수십억 매개변수 LLM을 구축할 수 있는 최적화된 학습 솔루션입니다.

최상의 패턴 선택

이들 아키텍처 패턴은 상호 배타적이지 않습니다. 반대로, 서로 다른 생성형 AI 배포에서 각각의 장점을 활용하기 위해 서로 결합할 수 있거나 결합해야 합니다. Databricks는 4가지 생성형 AI 아키텍처 패턴을 모두 지원하는 유일한 공급업체로, 가장 많은 옵션을 제공하고 비즈니스 요구 사항에 맞춰 발전시킬 수 있습니다.

시작할 준비가 되셨나요?