생성형 AI(Generative AI)

생성형 AI란?
생성형 AI(줄여서 GenAI)란 스스로 새로운 콘텐츠를 생성할 수 있는 모든 유형의 인공 지능을 뜻합니다. 생성형 AI 콘텐츠에는 텍스트, 이미지, 비디오, 음악, 번역, 요약 및 코드가 포함됩니다. 또한 주관식 질문에 답하고, 거의 임의적인 지침을 실행하고, 채팅에 참여하는 등의 특정 작업을 완료할 수도 있습니다.
ChatGPT, DALL-E 등의 서비스를 통해 일반 대중에서 GenAI의 의미가 소개되면서 기술의 인기도 크게 높아졌습니다.
생성형 AI의 작동 원리
GenAI 모델은 딥러닝을 사용하여 기존 데이터세트 내의 패턴을 식별하고 분석합니다. 이 모델은 인간의 두뇌 행동과 마찬가지로 트랜스포머 및 기타 딥러닝 아키텍처를 사용하여 데이터세트를 처리하고 '학습'합니다. 이러한 AI 모델은 새롭고 독창적인 콘텐츠를 만들기 위해 엄청난 양의 데이터를 트레이닝니다.
텍스트, 이미지, 일련의 음표 등을 입력하여 AI 모델을 트레이닝시킨 후 해당 AI 모델에 "프롬프트"를 제공할 수 있습니다. 그러면 알고리즘이 이를 바탕으로 새로운 콘텐츠를 생성합니다. 예를 들어 이미지를 사용하여 텍스트 캡션을 만들거나 텍스트 설명에서 이미지를 생성하는 등 다양한 미디어에서 작업할 수도 있습니다.
생성형 AI 모델의 일반적인 유형은 텍스트를 통해 트레이닝된 대규모 언어 모델(LLM)입니다. 이 모델은 순차적으로 사용되는 단어를 인식하는 방법을 학습합니다. 그런 다음 어떤 단어가 다음 순서로 나올 가능성이 가장 높은지 예측하여 문장을 구성할 수 있으므로 자연스럽게 들리는 결과물을 얻을 수 있습니다.

생성형 AI 종류
현재 사용되고 있는 생성형 AI 모델에는 여러 유형이 있습니다. 방법과 사용 사례는 다르지만 모두 다양한 알고리즘을 결합하여 콘텐츠를 처리하고 생성합니다.
GAN(Generative Adversarial Network, 생성형 적대적 신경망)
GAN 모델에는 동시에 트레이닝되는 두 개의 신경망, 즉 생성기(Generator)와 판별기(Discriminator)가 포함되어 있는데, 이 두 신경망은 게임 형태의 시나리오에서 서로 경쟁합니다.
생성기는 프롬프트를 기반으로 한 이미지와 같은 새로운 출력을 생성합니다. 그리고 판별기는 이 새로운 콘텐츠의 진위를 평가하고 생성기에 피드백을 제공하여 출력을 개선하는 데 도움을 줍니다. 생성기는 항상 판별기가 생성된 콘텐츠를 '진짜'로 분류하도록 속이고, 판별기는 항상 진위를 더 잘 구별하려고 노력합니다.
GAN 모델의 잘 알려진 예로 Midjourney(텍스트 이미지 변환 GenAI 도구)가 있습니다. 그러나 GAN은 이미지 생성에만 국한되지 않고 텍스트와 비디오 콘텐츠도 생성합니다.
GAN 생성기와 판별기는 계속 경쟁하면서 고품질의 결과를 빠르게 생성합니다. 그러나 과적합(overfitting), 모드 붕괴(mode collapse), 기울기 소실(diminished gradient)과 같은 문제를 방지하려면 두 신경망의 균형을 유지하는 것이 중요합니다.
변분 오토인코더(VAE)
오토인코더 모델도 두 가지 신경망을 사용하여 데이터를 해석하고 생성합니다. 이 모델에서는 이 두 신경망을 인코더와 디코더라고 하며 인코더 신경망은 주요 특성을 포착하는 단순 형식 또는 잠재 형식으로 데이터를 압축하도록 트레이닝되었습니다. 반면, 디코더 모델은 잠재 데이터로부터 콘텐츠를 재구성하도록 트레이닝됩니다.
VAE는 연속적 잠재 공간을 사용하여 트레이닝 데이터 포인트 간의 로컬 변형을 구현합니다. VAE 모델은 약간 수정된 압축 정보를 디코딩하여 유사하지만 궁극적으로는 독창적인 콘텐츠를 출력합니다.
이 모델은 주로 이미지 생성 및 이상 탐지에 사용되지만 텍스트와 오디오를 생성하기도 합니다. VAE는 이미지와 같은 결과물을 빠르게 생성하지만 다른 모델에 비해 세부 정보가 부족할 수 있습니다.
자기회귀
자기회귀 생성형 AI 모델은 이전에 생성된 요소의 컨텍스트를 고려하여 새로운 샘플을 생성합니다. 또한 각 데이터 포인트의 조건부 확률 분포를 모델링하고 시퀀스의 다음 요소를 예측하여 새 데이터를 생성합니다.
이 모델은 한 번에 한 요소씩 순차적으로 데이터를 생성하므로 복잡한 시퀀스를 생성할 수 있습니다. 자기회귀 AI는 일반적으로 텍스트 생성(예: ChatGPT), 언어 모델링, 음악 작곡에 사용됩니다.
확산 모델
노이즈 제거 확산 확률 모델(De-noising Diffusion Probabilistic Model, DDPM)이라고도 하는 확산 모델은 정방향 확산과 역방향 확산을 포함하는 2단계 프로세스로 트레이닝됩니다.
정방향 확산 중에는 트레이닝 데이터에 무작위 가우시안 노이즈가 점진적으로 추가되어 효과적으로 데이터를 파괴합니다. 그런 다음 AI는 역방향 확산을 통해 샘플을 재구성하는 방법을 학습합니다. 트레이닝 완료된 확산 모델은 완전한 무작위 노이즈로부터 새로운 데이터를 생성할 수 있습니다.
트랜스포머
트랜스포머(Transformer)는 순차적 입력 데이터 간의 장기적 관계를 처리하는 데 도움이 되는 특정 유형의 머신 러닝을 사용합니다. 그러려면 더 큰 데이터세트를 통해 모델을 트레이닝해야 합니다.
'어텐션(attention)'이라고 알려진 이 개념을 바탕으로 트랜스포머는 입력의 어느 부분이 다른 부분에 영향을 미치는지, 즉 컨텍스트를 이해할 수 있습니다. 따라서 이 모델은 컨텍스트에 대한 이해가 필요한 자연어 처리(NLP)와 관련된 텍스트 생성 작업에 가장 적합합니다. 잘 알려진 생성형 AI 프로그램 대부분이 트랜스포머 기반 모델에 속합니다.
트랜스포머는 매우 강력한 텍스트 생성기임이 입증되었습니다. 트레이닝 입력으로 텍스트만 필요하고 수십 억에 달하는 페이지를 사용할 수 있기 때문입니다. NLP 외에도 트랜스포머 AI 모델은 코드, 단백질, 화학물질, DNA 내의 연결 관계를 추적하고 식별하는 데 사용됩니다.
생성형 AI에서 딥러닝의 역할
딥러닝으로 전환하면서 AI 모델이 더욱 정교해졌고, 자연어 같이 점점 더 복잡해지는 데이터를 모델링할 수 있게 되었습니다. 생성형 AI 모델 대부분은 내부적으로 딥러닝을 사용하게 됩니다.
딥러닝이라는 이름은 이러한 모델에서 사용되는 수많은 처리 레이어에서 비롯되었습니다. 상호 연결된 노드의 첫 번째 레이어에서 트레이닝 데이터가 제공됩니다. 이 레이어의 출력이 다음 레이어의 입력으로 사용됩니다. 이전 레이어에서 얻은 지식을 기반으로 각 레이어가 구축되므로 복잡성과 추상화가 증가하고, 데이터세트의 세부 정보를 바탕으로 대규모 패턴을 이해할 수 있습니다.
기존 머신 러닝에서는 프로그래머가 특성 추출을 수행해야 하지만 딥러닝 프로그램은 지도학습을 줄이고 내부적으로 유용한 데이터 표현을 구축할 수 있습니다.
또한 AI 모델은 딥러닝 기술을 사용해 자연어 이해, 이미지 인식 등 복잡하고 추상적인 개념을 처리할 수 있습니다.
데이터 증강, 전이 학습, 미세 조정 등 AI 성능을 개선하는 방법에는 여러 가지가 있습니다. 데이터 증강은 생성 모델을 사용하여 데이터 트레이닝을 위한 새로운 합성 데이터 포인트를 생성합니다. 그런 다음 이 모델을 기존 데이터에 추가하여 데이터세트의 크기와 다양성을 늘리고, 결과적으로 모델의 정확도를 높입니다.
전이 학습에서는 사전 트레이닝된 모델을 두 번째 관련 작업에 사용합니다. 이 모델은 기존 모델의 출력을 다른 학습 문제의 입력으로 활용함으로써 첫 번째 트레이닝 인스턴스에서 얻은 지식을 적용할 수 있습니다. 전이 학습의 예로 자동차를 식별하도록 트레이닝된 모델을 사용하여 다른 차량을 식별하는 모델을 트레이닝하는 것이 있습니다. 전이 학습이 유용한 이유는 새로운 모델을 트레이닝하는 데 필요한 데이터의 양을 줄여주기 때문입니다.
마지막으로 미세 조정은 AI 모델을 보다 구체적인 데이터로 트레이닝하여 맞춤 구성하는 기술입니다. 이 모델을 사용해 사전 트레이닝된 모델을 특정 도메인이나 작업에 사용할 수 있도록 세부 조정할 수 있습니다. 미세 조정을 위해서는 최종 작업을 대표하는 고품질 데이터세트가 필요합니다.
생성형 AI의 실제 사용 사례
생성형 AI 기술은 텍스트 및 이미지 생성부터 소프트웨어 개발에 이르기까지 실제 사례를 광범위하게 보유하고 있습니다. 그 중 가장 일반적인 사용 사례 몇 가지에 대해 알아보겠습니다
이미지 생성
DALL-E와 같은 도구를 사용하면 시각적 또는 텍스트 형태의 프롬프트를 입력하여 새로운 이미지(예: 사진, 이미지, 비디오)를 생성할 수 있습니다. 멀티모달 모델은 텍스트 안내에 따라 이미지를 생성할 수 있으므로, 사용자는 원하는 만큼 모호하거나 구체적인 표현을 사용할 수 있습니다.
예를 들어 '동물'이나 '무지개'를 기반으로 한 그림을 요청하고 그 결과로 어떤 그림이 생성되는지 확인할 수 있습니다. 또는 '선글라스를 낀 새끼 코뿔소가 보라색 커튼이 쳐진 창문을 통해 무지개를 보고 있다'와 같이 자세한 안내를 제공할 수도 있습니다.
또 다른 옵션은 스타일 전이(style transfer)로, 한 이미지의 콘텐츠와 다른 이미지의 시각적 스타일을 결합하는 것입니다. 예를 들어 콘텐츠 이미지(코뿔소 사진)와 스타일 참조 이미지(피카소 그림)를 입력하면 AI가 이 둘을 혼합하여 피카소 스타일의 새로운 코뿔소 이미지를 생성합니다.
텍스트 생성
잘 알려진 텍스트 기반 GenAI 사용 사례 중 하나인 챗봇은 이제 다른 많은 작업에도 적용할 수 있습니다. 예를 들어 GrammarlyGo와 같은 도구는 비즈니스 양식의 이메일을 작성하고 답변을 보내는 데 도움이 될 수 있습니다.
기술 제품을 광고하는 브로셔를 제작한다고 가정해 보겠습니다. 인간의 경우 기능과 사양을 읽고 자세히 메모한 다음 초안을 작성하는 데 시간을 들입니다. 생성형 AI 프로그램은 입력된 정보를 바탕으로 몇 초 만에 이 모든 작업을 수행하여 바로 사용할 수 있는 콘텐츠를 빠르게 생성합니다. 텍스트 생성은 영화를 더빙하거나 비디오 콘텐츠에 자막을 제공하거나 콘텐츠를 다양한 언어로 번역할 때도 유용합니다.
음악 작곡
GenAI는 특정 장르의 음악을 작곡하거나 특정 작곡가의 스타일을 모방할 수 있습니다. 이미지 생성기와 마찬가지로 '무지개에 관한 노래' 또는 '우쿨렐레와 카주의 왈츠 박자 반주에 맞춘 무지개에 관한 3소절의 동요'와 같이 세부 정보를 제공하거나 완전한 창작의 자유를 허용할 수 있습니다.
또한 스타일 전이를 통해 거슈윈 스타일의 생일 축하 노래와 같이 서로 다른 두 곡을 섞거나 리믹스를 만들도록 AI에 요청할 수 있습니다. Amper Music은 사전에 녹음된 샘플에서 음악 트랙을 생성하는 반면, 동영상에서 개체를 인식하여 사운드트랙을 만드는 도구도 있습니다.
생성형 AI의 산업별 적용 사례
이 기술을 사용하는 방법은 다양하므로 리테일, 금융 서비스, 의료 등을 위한 생성형 AI가 예외가 아닌 표준으로 자리잡고 있는 것은 놀라운 일이 아닙니다.
리테일
이미 많은 리테일 기업이 고객 서비스를 자동화하기 위해 챗봇을 사용하고 있으며, 생성형 AI가 발전함에 따라 이러한 챗봇은 더욱 정교해질 것입니다. 앞으로 AI는 가상 피팅룸, 제품 개발, 적극적인 마케팅을 통해 고객에게 더욱 맞춤화된 서비스를 제공할 수 있습니다. 리테일 비즈니스도 GenAI를 사용하여 재고 및 수요 계획을 수립하고 피싱이나 사기를 식별하여 보안을 강화함으로써 이점을 얻을 수 있습니다.
금융 서비스
금융 서비스업(FSI) 기업들은 이미 대량의 데이터를 분석하기 위해 GenAI에 투자하고 있습니다. 한 가지 예로 올초 발표된 BloombergGPT LLM을 들 수 있습니다. 500억 개의 매개변수가 있는 이 AI는 FSI 및 예측을 위해 특별히 제작되었습니다.
현재는 물론 미래에 FSI에서 생성형 AI를 사용하는 다른 용도로는 위험 관리 및 사기 탐지가 있으며, 이는 운영 효율성을 높이고 고객 개인화를 강화합니다.
제조
산업혁명 이후 제조업은 자동화를 통해 효율성을 최적화하는 것을 목표로 삼아왔습니다. 생성형 AI는 이 산업을 다시 한 번 미래로 이끌 새로운 도구를 제공합니다.
AI는 가동 중단 없는 제조 작업에 대한 자동화된 보고서를 제공하여 성능 격차나 병목 현상을 식별하고 데이터를 기반으로 우선순위를 지정하여 효율성을 높일 수 있습니다. AI는 작업 모니터링뿐만 아니라 장비를 모니터링하고 예측적 유지관리 및 문제 해결을 통해 다운타임을 최소화할 수도 있습니다.
마지막으로 제조업의 LLM은 고객 서비스 맟 자동차나 스마트 기술과 같은 특정 제품에 대한 고객 경험을 개인화할 수 있습니다.
미디어
엔터테인먼트 업계에서 AI를 어떻게 활용할 것인지는 큰 논란이 되고 있습니다. 그러나 생성형 AI는 업계의 업무에 영향을 주지 않고도 여러 가지 방법으로 사용할 수 있습니다.
AI 모델을 통한 사용자 선호도, 소비 패턴, 소셜 미디어 신호 분석은 엔터테인먼트 서비스의 미디어 추천을 최적화하는 데 사용될 수 있습니다. GenAI 모델은 타겟 광고를 개선할 수도 있습니다. 그러나 엔터테인먼트의 LLM과 관련하여 가장 흥미로운 발전은 시청자의 결정이 내러티브를 형성하는 몰입형 인터랙티브 스토리텔링의 잠재력입니다.
의료 서비스
의료 분야에서 생성형 AI 모델은 새로운 화합물과 분자를 보여주는 그래프를 생성하여 신약 발견에 도움을 줄 수 있습니다. AstraZeneca는 이미 신약 발견에 AI를 사용하고 있으며, 2025년이면 신약과 재료의 30% 이상이 GenAI 기술을 통해 발견될 것으로 추정됩니다.
이러한 모델은 테스트할 새로운 화합물을 제안하고, 임상 시험에 사용할 적합한 후보를 식별하고 합성 이미지를 사용하여 의료 이미지 분석 애플리케이션을 미세 조정할 수도 있습니다. 또한 AI를 사용하여 개인화된 치료 계획을 생성하거나 전자 건강 기록에 업로드하기 위한 상담 내용을 기록할 수 있습니다.
생성형 AI 적용 환경에서 기업이 얻을 수 있는 이점
지금까지 몇 가지 실제 적용 사례를 살펴보았습니다. 그렇다면 생성형 AI가 비즈니스에 어떤 변화를 가져올까요? 생성형 AI를 사용하여 얻을 수 있는 주요 이점은 다음과 같습니다.
수익 창출
생성형 AI 기술을 사용하면 기업들은 참신한 디자인을 떠올리고 R&D 프로세스를 가속화하여 새로운 제품을 신속하게 제작하고 출시할 수 있습니다. 이 기술은 트렌드와 고객 행동을 분석하여 추가 수익원에 대한 새로운 아이디어를 제시할 수 있습니다.
AI는 제품 혁신뿐만 아니라 새로운 마케팅 계획을 수립하고 홍보 자료를 제작하는 데 도움을 줄 수 있습니다. 또한 고객 선호도를 분석하여 타겟 광고를 생성하고, 맞춤형 추천을 제공하며, 제품과 서비스를 개인화할 수 있습니다. AI 데이터 분석은 기업이 경쟁사보다 앞서고 경쟁력을 유지할 수 있는 기회를 포착하는 데 도움이 되기도 합니다.
마지막으로 GenAI를 사용하면 비즈니스 챗봇 성능이 향상되어 고객 만족도, 매출 및 유지율도 향상됩니다.
생산성
또 다른 주요 이점으로는 생산성을 들 수 있습니다. GenAI를 사용하면 데이터 입력, 일상적인 이메일, 회의 또는 통화 기록과 같이 시간이 많이 소요되는 수작업을 자동화할 수 있기 때문입니다.
AI 모델은 인간이 쉽게 이해하고 해석할 수 있도록 복잡한 정보를 요약하는 데 뛰어난 성능을 발휘합니다. 또한 데이터 를 분석하고 기존 워크플로를 개선하여 효율성을 극대화하는 방법을 제안할 수 있습니다.
고객 지원 분야에서는 AI 기반 챗봇과 가상 어시스턴트를 구현하여 지원 상담사의 부담을 줄일 수 있습니다. 이외에도 상담원의 응답 및 해결 시간이 단축되고, 상담원이 일반적인 쿼리를 처리하는 동시에 다른 작업을 처리할 수 있다는 장점이 있습니다.
위험 완화
생성형 AI 플랫폼을 사용하면 데이터를 더욱 심층적으로 파악할 수 있을 뿐만 아니라 재무 또는 보안 취약성을 신속하게 식별할 수 있습니다. 고급 AI 프로그램은 잠재적인 비즈니스 위험을 시뮬레이션할 수 있으므로 규정 준수를 평가하고 프로토콜을 구현하여 문제를 피하거나 완화할 수 있습니다.
한편, 데이터 압축 덕분에 조직은 필수 데이터만 보관하면 되므로 많은 개인정보를 보관하는 데 따른 위험이 줄어듭니다.
가장 일반적인 LLM 간의 차이점
LLM은 많은 기업에서 출시 및 개발 중이므로 선택할 수 있는 옵션의 수는 계속 늘어날 것입니다. 그러나 일반적으로 LLM은 독점 서비스와 오픈 소스 모델이라는 두 가지 범주로 그룹화할 수 있습니다. 이 두 범주에 대해 자세히 알아보겠습니다.
독점 서비스
가장 잘 알려진 LLM 서비스는 OpenAI가 2022년 말에 출시한 ChatGPT입니다. ChatGPT는 프롬프트를 수신하고 일반적으로 빠르고 관련성 있는 응답을 제공하는 사용자 친화적인 검색 인터페이스를 제공합니다. 개발자는 ChatGPT API에 액세스하여 LLM을 자체 애플리케이션, 제품 또는 서비스에 통합할 수도 있습니다.