기존 머신러닝 알고리즘과 계층적 표현을 학습하는 심층 신경망의 차이점을 설명하십시오.
작성자: Databricks 직원
기초적인 차이점과 각각이 AI 내에서 어디에 적합한지 알아보세요.
더 넓은 인공지능 (AI)의 세계에서 머신러닝과 딥러닝의 개념은 자주 혼동됩니다. AI는 인간과 같은 의사 결정이 필요한 작업을 수행하는 지능형 시스템을 구축하는 광범위한 분야입니다. Machine learning(ML)은 AI의 한 유형으로, 시스템이 모든 규칙을 명시적으로 프로그래밍하지 않아도 과거 데이터를 받아들여 패턴을 학습하고 의사 결정을 내립니다. 딥러닝(DL)은 다층 신경망을 사용하여 대규모 데이터세트에서 자동으로 학습하여 복잡한 인식 및 언어 문제를 해결하는 machine learning의 전문 하위 집합입니다.
다음 계층 구조는 AI, ML, DL 간의 관계를 설명합니다.
인공지능(AI) 규칙 및 논리
└── 머신러닝(ML)은 경험으로 규칙을 대체합니다
└── 딥러닝(DL) 자동 학습
ML과 DL은 AI를 달성하기 위한 접근 방식입니다. 사실, 오늘날 대부분의 AI 제품은 실제로는 ML 시스템, 딥러닝 모델 또는 ML 기반 데이터 파이프라인입니다.
| 측면 | 일체 포함 | ML | DL |
|---|---|---|---|
| 기술 | 규칙, 논리, 검색 | 통계 모델 | 신경망 |
| 데이터 요구 사항 | 중소 규모 데이터세트 | 중소 규모 데이터세트 | 매우 큰 데이터 세트 |
| 필요한 학습 | 항상 그런 것은 아닙니다 | 항상 | 항상 |
| 적응성 | 종종 정적임 | 데이터가 많을수록 개선됨 | 데이터가 많을수록 개선됨 |
| 컴퓨트 요구사항 | 낮음에서 중간 | 보통 | 높음 |
| 최적 활용 사례 | 추론, 제어 | 정형 데이터 | 비정형 데이터 |
| 예제 | 계획, 의사 결정 | 추천 | 비전, 음성, 언어 |
머신러닝 은 컴퓨터가 데이터에서 패턴을 학습한 다음 해당 패턴을 사용하여 예측하거나 결정을 내리는 방식으로 작동합니다. 명시적인 프로그래밍 없이도 경험을 통해 성능이 향상됩니다. 데이터는 ML의 원동력입니다. 시스템이 답변하기를 원하는 문제나 질문으로 시작하여 수집 및 정규화된 데이터를 모델(입력을 출력에 매핑하는 알고리즘)에서 사용합니다. 각 모델에는 데이터로부터 학습된 파라미터와 사람이 선택한 하이퍼파라미터가 있습니다.
일반적인 ML 모델은 다음과 같습니다.
머신 러닝 모델은 가공되지 않은 데이터를 모델에 유용한 신호로 변환하는 프로세스인 피처 엔지니어링을 통해 패턴을 더 효과적으로 학습합니다. 피처는 모델에서 사용하는 입력 변수(숫자, 범주형, 날짜/시간, 텍스트)입니다. 좋은 피처는 정확도와 해석 가능성을 향상시키고 훈련 시간을 단축할 수 있습니다.
딥러닝 은 다층 신경망을 사용하여 대량의 데이터에서 복잡한 패턴을 자동으로 학습하는 ML 접근 방식입니다. 인간 두뇌의 뉴런 구조를 모방하기 때문에 신경망이라고 불립니다. AI 시스템을 구축하는 가장 강력한 접근 방식 중 하나입니다.
딥러닝에서는 사람이 학습할 특성을 설계하지 않고, 모델이 여러 계층의 신경망을 사용하여 원시 데이터에서 직접 표현을 학습합니다. 계층은 특성의 계층 구조를 구축하며 입력 계층, 여러 개의 은닉 계층, 출력 계층을 포함합니다. 각 계층은 가중치를 적용하고, 편향을 더하며, 비선형 활성화를 통과합니다.
ML과 DL은 모두 AI에 속하며, 딥러닝은 machine learning의 하위 집합이므로 서로 밀접하게 관련되어 있습니다. 이들은 많은 기본 원칙, 워크플로, 목표를 공유합니다. 둘 다 데이터에서 패턴을 학습하고 해당 데이터를 기반으로 예측이나 의사결정을 내리는 것을 목표로 합니다.
데이터로부터 학습할 때, 둘 다 반복적인 학습 프로세스에서 더 많은 데이터를 볼수록 성능이 향상될 수 있습니다. 그리고 둘 다 해당 데이터로부터 새롭고 이전에 본 적 없는 데이터로 일반화할 수 있습니다. ML과 DL 모두 과거 데이터에 대한 훈련, parameter 조정을 위한 검증, 보지 못한 데이터에 대한 테스트가 필요합니다.
그리고 둘 다 분류, 회귀, 클러스터링 문제에 적용될 수 있습니다.
머신러닝과 딥러닝은 많은 유사점이 있지만, 데이터 요구사항과 피처 엔지니어링에 드는 노력에서 차이가 있습니다. ML은 종종 소규모에서 중간 규모의 정형 데이터세트에서 잘 작동하지만, 성능은 피처 품질에 따라 달라지며 관련 변수를 식별하기 위해 사람이 주도하는 피처 엔지니어링이 필요합니다.
DL은 대량의 비정형 데이터(이미지, 텍스트, 오디오)에 의존하며, DL이 최소한의 사람 개입으로 자동 특성 추출을 수행하므로 예시의 규모가 성능에 직접적인 영향을 미칩니다.
ML에서는 도메인 지식과 피처 품질이 필수적인 반면, DL에서는 모델이 내부적으로 피처를 학습하므로 데이터 규모와 인프라가 더 중요해집니다.
ML과 DL 모두에 필요한 컴퓨팅 요구사항과 학습 시간을 비교하는 것은 시스템의 비용, 반복 속도, 제품 실현 가능성에 가장 큰 영향을 미치는 요소이므로 유용합니다. 기존 ML 모델은 메모리가 적은 표준 CPU에서 실행할 수 있지만, DL은 효율적인 학습을 위해 메모리가 많은 GPU나 TPU가 필요하므로 DL의 인프라 비용이 더 높습니다.
ML 모델은 빠른 반복과 실험을 위해 신속하게 훈련되는 반면, DL 모델은 복잡한 다중 계층 아키텍처로 인해 더 긴 훈련 시간이 필요합니다. 따라서 DL은 훈련 비용, 인프라, 에너지, 복잡성이 더 높지만 ML은 대규모 문제에서는 좋은 성능을 내지 못할 수 있습니다.
머신러닝과 딥러닝을 비교할 때 고려해야 할 다른 요소는 해석 가능성(사람이 모델의 예측 이유를 얼마나 쉽게 이해할 수 있는지)과 투명성(모델의 내부 로직과 의사 결정 과정이 얼마나 가시적이고 설명 가능한지)입니다.
ML 모델은 투명하고 해석하기 쉽도록 설계되어 특성 중요도를 표시하고 단계별 추론을 지원합니다. 예를 들어, 의사결정 트리의 if-then 규칙은 사람이 읽을 수 있고, 선형 회귀 계수는 직접적인 피처 영향을 보여주며, 선형 회귀의 승산비는 영향력을 설명합니다.
DL 모델은 투명성 관점에서 '블랙박스'처럼 작동하는 경향이 있습니다. 명시적인 규칙이나 사람이 설계한 특성에 의존하지 않습니다. 수백만 개의 parameter를 포함하며 계층적이고 분산된 표현을 학습하므로 어떤 특징이 예측을 유발하는지 이해하기 어렵습니다.
해석 가능성은 감사에 중요하며, 중대한 결정이 일상적으로 내려지고 신뢰가 필수적인 의료, 금융, 법률과 같은 규제 산업에서는 매우 중요합니다.
일반적인 지침은 고정된 규칙으로 정의하기 어려운 데이터 패턴을 포함하는 잘 정의된 문제이지만 딥러닝이 불필요하거나 비효율적일 경우 ML을 사용하는 것입니다. ML은 비즈니스 데이터(매출 예측, 재무 지표, 고객 기록)와 같이 데이터가 정형화되어 있고 데이터세트가 중소 규모일 때 적합합니다.
ML은 컴퓨팅 예산이 제한적이고 빠른 반복이 중요한 경우(사기 탐지, 신용 평가)와 해석 가능성과 설명 가능성이 요구되는 애플리케이션(금융, 의료, 보험, 법률)에 효과적입니다.
DL은 GPU/TPU를 사용할 수 있고 이를 지원할 시간이 있을 때, 다양하고 방대한 양의 비정형 데이터에 포함된 복잡한 패턴과 관련된 문제에서 뛰어난 성능을 발휘할 수 있습니다. DL은 기존 ML로 모델링하기 어려운 입력(이미지, 동영상, 오디오)에 가장 적합합니다. 수동 특성 설계가 어렵거나 불가능하지만 가공되지 않은 데이터에 유용한 신호가 포함된 경우 DL이 필요합니다. DL은 해석 가능성과 비용보다 정확성이 더 중요하고 시스템이 더 긴 학습 주기를 감당할 수 있는 경우에도 적합합니다.
DL은 사전 학습된 모델(이미지 및 객체 인식)에서 전이 학습을 사용할 수 있고, 문제가 인식이나 언어(컴퓨터 비전, 음성 인식, 자연어 처리, 자율 주행차, 로보틱스)와 관련된 경우 특히 효과적입니다.
ChatGPT는 AI인가요, ML인가요? 정답은 '둘 다 맞다'입니다!
ML과 DL은 모두 AI의 한 종류이며, DL은 ML의 하위 집합이라는 점을 기억하세요. 실제로 ChatGPT는 매우 큰 트랜스포머 신경망으로 구축된 딥러닝 모델입니다. GPT(Generative Pre-trained Transformer)는 수백만에서 수십억 개의 매개변수와 방대한 양의 훈련 데이터로 구성되어 있습니다.
DALL-E 및 Midjourney와 같은 인기 있는 이미지 생성 시스템은 심층 신경망을 사용하여 구축된 확산 모델이므로 둘 다 DL 범주에 속합니다. 둘 다 텍스트 프롬프트에서 이미지를 생성하기 위해 대규모 훈련, 집약적인 계산 및 표현 학습이 필요합니다.
Netflix나 Spotify가 추천을 할 때, 이들은 기존 ML 모델과 DL 모델의 조합을 함께 사용합니다. 이러한 시스템은 사용자 행동, 콘텐츠 속성, 그리고 이 둘 간의 유사성을 분석하여 어떤 콘텐츠를 어떤 순서로 어떤 사용자에게 보여줄지 결정합니다. ML은 순위 지정, 개인화, A/B 테스트에 사용됩니다. DL은 사용자 취향 모델링, 콘텐츠 이해, 대규 모 사용자-아이템 관계 학습에 사용됩니다.
이러한 제품은 AI 시스템 계층 구조에서 다음과 같이 보입니다.
인공지능(AI)
└── Machine Learning(ML)
└── 협업 필터링 모델(Netflix/Spotify)
└── 딥러닝(DL)
└── 확산 모델(DALL·E, Midjourney)
└── 트랜스포머 모델(ChatGPT/GPT, Netflix/Spotify)
데이터 세트 크기:
소규모/정형 = ML
대규모/비정형 = DL
해석 가능성 필요
높음 = ML
낮음 = DL 허용 가능
사용 가능한 컴퓨팅 리소스
제한적 = ML
강력함 = DL 가능
문제 유형
테이블 형식 데이터 = ML
이미지/텍스트/오디오 = DL
DL은 ML의 기본을 기반으로 하므로, 몇 가지 공통된 기본 사항부터 시작하는 실용적인 학습 로드맵을 소개합니다. 또한 구체적인 경로는 해결하려는 특정 문제와 시스템에 사용 가능한 리소스에 따라 달라진다는 점을 명심하세요.
공통 기본 사항:
머신러닝 경로:
딥러닝 경로:
DL은 ML의 기초 위에 구축되므로 최종 목표에 관계없이 ML 기초부터 시작해야 한다는 점을 기억하세요.
머신러닝과 딥러닝은 데이터 요구사항, 컴퓨팅 요구, 해석 가능성 요구, 사용 사례에 따라 AI를 구현하는 두 가지 접근 방식입니다.
ML 사용 사례는 일반적으로 더 작고 테이블 형식의 정형 데이터세트를 특징으로 합니다. 이들은 종종 높은 해석 가능성/설명 가능성을 요구하며, 낮은 컴퓨팅 요구사항과 시간 투입을 필요로 합니다.
DL 사용 사례는 복잡한 패턴, 방대하고 다양한 비정형 데이터를 포함하며 해석 가능성보다 정확성이 더 중요합니다. DL 모델을 훈련하려면 훨씬 더 큰 컴퓨팅 인프라와 시간 투자가 필요합니다.
최선의 선택은 특정 문제와 사용 가능한 리소스에 따라 달라집니다. 두 기술 모두 더 적은 메모리를 사용하는 더 강력한 모델 아키텍처, 더 효율적인 훈련, 더 나은 평가 및 테스트를 통해 계속 발전하고 있다는 점을 알아두세요. AI에서는 ML, DL, 규칙이 하이브리드 시스템으로 결합되는 융합 현상이 증가하고 있습니다. 새로운 애플리케이션과 규제 및 거버넌스 요구사항 또한 모델이 구축되고 배포되는 방식에 영향을 미칠 것입니다.
ML이 DL을 대체하는 것은 아닙니다. 두 기술 모두 나란히 계속 발전하고 있습니다.
블로그를 구독하고 최신 게시물을 이메일로 받아보세요.