자기 지도 학습을 통해 방대한 텍스트 코퍼스에서 훈련되고 수십억 개의 parameter를 보유하며, NLP 작업을 위해 사람과 유사한 텍스트를 생성할 수 있는 신경망
작성자: Databricks 직원
언어 모델은 생성형 AI(GenAI) 의 한 유형으로, 자연어 처리(NLP)를 사용하여 인간의 언어를 이해하고 생성합니다. 대규모 언어 모델(LLM)이 이 중 가장 강력합니다. LLM은 고급 기계 학습 (ML) 알고리즘을 사용하여 방대한 데이터세트로 학습하여 인간 언어의 패턴과 구조를 배우고 서면 프롬프트에 대한 텍스트 응답을 생성합니다. LLM의 예시로는 BERT, Claude, Gemini, Llama, 그 리고 생성형 사전 훈련 Transformer(GPT) 계열의 LLM이 있습니다.
LLM은 다양한 언어 관련 작업에서 성능과 능력 면에서 이전 모델들을 크게 뛰어넘었습니다. 복잡하고 미묘한 콘텐츠를 생성하고 작업을 자동화하여 인간과 같은 결과를 내는 능력은 다양한 분야의 발전을 주도하고 있습니다. LLM은 지원 자동화, 인사이트 도출, 맞춤형 콘텐츠 생성 등 다양한 환경과 비즈니스 용도 전반에 걸쳐 영향력을 발휘하기 위해 비즈니스계에 널리 통합되고 있습니다.
핵심 LLM AI 및 언어 기능은 다음과 같습니다.

대부분의 LLM은 트랜스포머 아키텍처를 사용하여 구축됩니다. 입력 텍스트를 토큰(하위 단어 단위)으로 분할하 고, 해당 토큰을 숫자 벡터로 임베딩하고, 어텐션 메커니즘을 사용하여 입력 전반의 관계를 파악하는 방식으로 작동합니다. 그런 다음 시퀀스에서 다음 토큰을 예측하여 일관된 출력을 생성합니다.
LLM 모델을 사전 훈련하는 것은 기존 모델의 사전 지식이나 가중치를 사용하지 않고 텍스트나 코드와 같은 대규모 데이터 모음으로 모델을 훈련하는 과정을 의미합니다. 전체 사전 학습의 출력은 다운스트림 작업에 직접 사용하거나 추가로 미세 조정할 수 있는 기본 모델입니다.
사전 훈련은 모델의 기초 지식이 사용자의 특정 도메인에 맞춰지도록 합니다. 그 결과 조직의 고유한 데이터로 차별화된 맞춤형 모델이 생성됩니다. 하지만 사전 훈련은 일반적으로 가장 규모가 크고 비용이 많이 드는 훈련 유형이며 대부분의 조직에서는 일반적이지 않습니다.
미세 조정은 사전 학습된 LLM을 개별 도메인이나 작업에 특화된 비교적 작은 데이터세트에 적용하는 프로세스입니다. 미세 조정 과정에서는 전체 모델에 비해 상대적으로 적은 수의 가중치를 조정하여 짧은 시간 동안 학습을 계속합니다.
가장 일반적인 미세 조정 방식 두 가지는 다음과 같습니다.
감독 대상 명령 미세 조정: 이 접근 방식에는 일반적으로 수천 개의 학습 예시를 사용하여 수행되는 입력-출력 훈련 예시 데이터세트로 사전 학습된 LLM의 지속적인 학습이 포함됩니다.
지속적 사전 학습: 이 미세 조정 방법은 입력 및 출력 예시에 의존하지 않고, 대신 도메인에 특화된 비정형 텍스트를 사용하여 동일한 사 전 학습 프로세스(예: 다음 토큰 예측 및 마스크 언어 모델링)를 계속 진행합니다.
미세 조정은 조직이 기반 LLM을 자체 데이터로 학습시켜 회사의 도메인과 워크로드에 대한 정확도를 높이고 맞춤화할 수 있게 해주므로 중요합니다. 이렇게 하면 학습에 사용되는 데이터를 직접 제어할 수 있어 AI를 책임감 있게 사용할 수 있습니다.
LLM은 확률을 기반으로 대량의 데이터를 프로그램에 입력하여 훈련시키는 AI의 한 형태인 딥러닝을 기반으로 구축됩니다. LLM은 방대한 데이터세트에 노출되어 명시적인 프로그래밍 없이 언어 패턴과 관계를 인식하도록 스스로 학습할 수 있으며, 자가 학습 메커니즘으로 지속적으로 정확도를 개선합니다.
LLM의 기반은 인간 두뇌의 구조에서 영감을 받은 인공 신경망입니다. 이러한 네트워크는 상호 연결된 노드가 계층으로 배열되어 있으며, 입력 계층, 출력 계층 및 그 사이에 있는 하나 이상의 계층으로 구성됩니다. 각 노드는 학습된 패턴을 기반으로 정보를 처리하여 다음 레이어로 전송합니다.
LLM은 트랜스포머 모델이라는 유형의 신경망을 사용합니다. 이러한 획기적인 모델은 단어를 순차적으로 처리하는 이전 모델과는 대조적으로 전체 문장을 한 번에 볼 수 있습니다. 이를 통해 언어를 더 빠르고 효율적으로 이해할 수 있습니다. 트랜스포머 모델은 셀프 어텐션이라는 수학적 기법을 사용하며, 이는 문장 내 여러 단어에 다양한 중요도를 할당하여 모델이 의미의 미묘한 차이를 파악하고 맥락을 이해할 수 있게 합니다. 위치 인코딩은 모델이 문장 내 단어 순서의 중요성 을 이해하도록 돕는데, 이는 언어를 이해하는 데 필수적입니다. 트랜스포머 모델은 LLM이 방대한 양의 데이터를 처리하고, 맥락에 맞는 정보를 학습하며, 일관성 있는 콘텐츠를 생성할 수 있도록 합니다.

모든 LLM의 기반인 트랜스포머에 대해 자세히 알아보기
LLM은 사용 사례와 다양한 산업 전반에 걸쳐 비즈니스에 영향을 미칠 수 있습니다. 사용 사례의 예는 다음과 같습니다.
JetBlue는 기업 데이터로 보완된 오픈 소스 생성형 AI 모델을 사용하는 Databricks 기반 챗봇인 "BlueBot"을 배포했습니다. 이 챗봇은 JetBlue의 모든 팀에서 역할별로 관리되는 데이터에 액세스하는 데 사용할 수 있습니다. 예를 들어 재무팀은 SAP 및 규제 관련 보고 자료의 데이터를 볼 수 있지만, 운영팀은 유지 관리 정보만 볼 수 있습니다.
Chevron Phillips는 Databricks의 Dolly와 같은 오픈 소스 모델로 구동되는 생성형 AI 솔루션을 활용 하여 문서 프로세스 자동화를 간소화합니다. 이러한 도구는 PDF 및 설명서의 비정형 데이터를 구조화된 인사이트로 변환하여 운영 및 시장 인텔리전스를 위해 더 빠르고 정확한 데이터 추출을 지원합니다. 거버넌스 정책은 추적성을 유지하면서 생산성 및 리스크 관리를 보장합니다.
Thrivent Financial은 생성형 AI를 활용하고 있으며 Databricks를 통해 검색 속도를 높이고, 더 명확하고 접근성 높은 인사이트를 제공하며, 엔지니어링 생산성을 향상시키고 있습니다. 역할 기반 거버넌스가 적용된 단일 플랫폼에서 데이터를 통합함으로써 회사는 팀이 혁신하고, 탐색하며, 더 효율적으로 작업할 수 있는 안전한 공간을 만들고 있습니다.
최근 LLM이 조명을 받게 만든 기술적 발전을 소개하겠습니다.
조직의 데이터로 LLM 애플리케이션을 맞춤 설정할 때 4가지 아키텍처 패턴을 고려해야 합니다. 이러한 기술은 아래에 요약되어 있으며, 상호 배타적이지 않습니다. 반대로, 각각의 장점을 활용하기 위해 서로 결합할 수 있거나 결합해야 합니다.
선택한 기술에 관계없이 잘 구조화되고 모듈화된 방식으로 솔루션을 구축하면 조직은 반복과 조정 작업을 수행할 수 있는 준비가 됩니다. 이 접근 방식과 더 많은 내용에 대해 생성형 AI 대백과에서 알아보세요.

| 방법 | 정의 | 기본 사용 사례 | 데이터 요구 사항 | 장점 | 고려 사항 |
|---|---|---|---|---|---|
| LLM 동작을 안내하는 특수 프롬프트 제작 | 빠르고 즉각적인 모델 안내 | 없음 | 빠르고 비용 효율적이며 학습이 필요하지 않음 | 미세 조정보다 낮은 제어 수준 | |
| LLM과 외부 지식 검색 결합 | 동적 데이터세트 및 외부 지식 | 외부 지식 베이스 또는 데이터베이스(예: 벡터 데이터베이스) | 동적으로 업데이트되는 컨텍스트, 정확도 향상 | 프롬프트 길이 및 추론 계산 증가 | |
| 특정 데이터세트 또는 도메인에 맞춰 사전 학습된 LLM 조정 | 도메인 또는 작업 전문화 | 수천 개의 도메인 특정 또는 명령 예시 | 세분화된 제어, 높은 수준의 전문화 | 이 레이블이 지정된 데이터, 컴퓨팅 비용 필요 | |
| LLM을 처음부터 학습시키기 | 고유한 작업 또는 도메인 특정 말뭉치 | 대규모 데이터세트(수십억에서 수조 개의 토큰) | 특정 요구 사항에 맞게 조정된 최대 제어 수준 | 리소스 집약적 |
프롬프트 엔지니어링은 LLM에 제공된 텍스트 프롬프트를 조정하여 보다 정확하고 관련성 높은 응답을 이끌어내는 방식입니다. 프롬프트 엔지니어링은 모델마다 다르므로 모든 LLM 모델이 동일한 품질 결과를 생성하는 것은 아닙니다. 다음은 다양한 모델에 적용되는 몇 가지 일반적인 팁입니다.
검색 증강 생성(RAG)은 사용자 지정 데이터를 활용하여 LLM 애플리케이션의 효능을 높일 수 있는 아키텍처 접근 방식입니다. 이 작업은 질문이나 작업과 관련된 데이터/문서를 검색하고 이를 LLM의 컨텍스트로 제공하여 수행할 수 있습니다. RAG는 최신 정보를 유지 관리하거나 도메인별 지식에 액세스해야 하는 지원 챗봇 및 Q&A 시스템에서 성공을 거두었습니다.
여기에서 RAG에 대해 자세히 알아보세요.
LLM 분야는 선택할 수 있는 다양한 옵션으로 가득합니다. 일반적으로 LLM은 독점 서비스와 오픈 소스 모델이라는 두 가지 범주로 분류할 수 있습니다.
사유 LLM 모델은 민간 기업에서 개발하고 소유하며 일반적으로 액세스하려면 라이선스가 필요합니다. 아마도 가장 잘 알려진 독점 LLM 은 2022년에 많은 화제를 모으며 출시된 ChatGPT의 기반이 되는 GPT-4o일 것입니다. ChatGPT는 사용자가 프롬프트를 제공하고 일반적으로 빠르고 관련성 높은 응답을 받을 수 있는 친숙한 검색 인터페이스를 제공합니다. 개발자는 ChatGPT API에 액세스하여 이 LLM을 자신의 애플리케이션, 제품 또는 서비스에 통합할 수 있습니다. 그 외 독점 모델로는 Google의 Gemini와 Anthropic의 Claude가 있습니다.
또 다른 옵션은 LLM을 자체 호스팅하는 것으로, 오픈 소스이며 상업적으로 사용 가능한 모델이 일반적입니다. 오픈 소스 커뮤니티는 독점 모델의 성능을 빠르게 따라잡았습니다. 인기 있는 오픈 소스 LLM 모델로는 Meta의 Llama 4와 Mixtral 8x22B 등이 있습니다.
타사 공급업체의 폐쇄형 AI를 사용하거나 자체 오픈 소스(또는 미세 조정된) LLM 모델을 자체 호스팅하는 접근 방식에서 고려해야 할 주요 사항과 차이점은 미래 보장성을 고려하고, 비용을 관리하며, 데이터를 경쟁 우위로 활용하는 것입니다. 독점 모델은 더 이상 사용되지 않고 제거되어 기존 파이프라인과 벡터 인덱스를 손상시킬 수 있으며, 오픈 소스 모델은 영구적으로 액세스할 수 있습니다. 오픈 소스 및 미세 조정된 모델은 더 많은 옵션을 제공하고 애플리케이션에 맞게 조정할 수 있으므로 성능과 비용 간의 절충점을 더 잘 찾을 수 있습니다. 향후 자체 모델을 미세 조정할 계획을 세우면 공개적으로 사용할 수 있는 것보다 더 나은 모델을 구축하기 위한 경쟁 우위로 조직의 데이터를 활용할 수 있습니다. 마지막으로, 독점 모델은 이러한 '블랙박스' LLM이 학습 프로세스 및 가중치에 대해 더 낮은 수준의 감독을 허용하므로 거버넌스 문제를 야기할 수 있습니다.
자체 오픈 소스 LLM 모델을 호스팅하려면 독점 LLM을 사용하는 것보다 더 많은 작업이 필요합니다. Databricks의 MLflow를 사용하면 Python 경험이 있는 사용자가 트랜스포머 모델을 가져와 Python 개체로 더 쉽게 사용할 수 있습니다.
LLM 평가는 어렵지만 계속 발전하고 있는 영역으로, 주된 이유는 LLM이 다양한 작업에서 균등하지 않은 기능을 보여 주는 경우가 많기 때문입니다. LLM은 하나의 벤치마크에서는 탁월할 수 있지만, 프롬프트나 문제가 약간만 변형되어도 성능에 큰 영향을 미칠 수 있습니다.
LLM 성과를 평가하는 데 사용되는 몇 가지 주요 도구 및 벤치마크는 다음과 같습니다.

RAG 애플리케이션의 LLM 평가를 위한 모범 사례도 참조하세요.
LLMOps(Large Language Model Ops)는 프로덕션 환경에서 대규모 언어 모델의 운영 관리에 사용되는 사례, 기술 및 도구를 포괄합니다.
LLMOps는 LLM의 효율적인 배포, 모니터링 및 유지보수를 가능하게 합니다. 기존 머신 러닝 운영(MLOps)과 마찬가지로 LLMOps에는 데이터 사이언티스트, DevOps 엔지니어 및 IT 전문가의 협업이 필요합니다. 여기에서 LLMOps에 대해 자세히 알아보세요.
다음과 같이 다양한 리소스를 참고할 수 있습니다.
블로그를 구독하고 최신 게시물을 이메일로 받아보세요.