🤖 1. 생성형 AI란?
<aside>
정의: 대규모 데이터셋에서 학습한 모델이 텍스트, 이미지, 코드 등 실제와 유사한 출력물을 생성하는 AI 분야
</aside>
AI의 주요 유형
- 심볼릭 AI: 규칙 기반 시스템을 사용하여 인간의 의사 결정 과정을 모방하는 AI
- 고전적 머신러닝: 데이터 중심 접근 방식으로 패턴 학습을 기반으로 하는 AI
- 딥러닝: 뉴럴 네트워크(신경망) 구조를 사용하여 데이터로부터 자동으로 특징을 학습하는 기계 학습의 한 분야
- 생성형 AI: 학습된 데이터의 패턴을 기반으로 새로운 데이터를 생성하는 AI

📚 2. 대형 언어 모델(LLM)이란?
<aside>
LLM(Large Language Model): 방대한 데이터로 사전 학습하여 문맥을 이해하고, 다양한 요청에 응답하며 자연스러운 텍스트를 생성할 수 있는 AI 모델. 많은 LLM이 생성형 사전훈련 트랜스포머(GPT) 아키텍처를 기반으로 작동합니다.
</aside>
<aside>
멀티모달 LLM: 텍스트, 이미지, 오디오, 비디오 등 여러 형태의 데이터를 동시에 처리하는 모델 (예: GPT-4 Vision, Claude 3, Gemini)
</aside>
LLM의 3가지 유형
LLM은 용도에 따라 세 가지 유형으로 분류됩니다. 단순한 텍스트 생성부터 복잡한 추론까지, 작업의 복잡도에 따라 적절한 모델을 선택할 수 있습니다:
<aside>
1️⃣ 파운데이션 모델: 방대한 데이터로 훈련된 기본 모델
- 텍스트, 이미지, 음성 등 다양한 데이터로 학습
- 자연어 처리, 컴퓨터 비전, 음성 인식 등 다양한 작업 수행 가능
- 특정 용도에 맞게 파인튜닝이 가능한 범용 플랫폼
- 예시: GPT-3, BERT, LLaMA
</aside>
<aside>
2️⃣ 명령어 튜닝 모델: 사용자 지시에 최적화된 모델
- 사용자의 자연어 명령이나 질문에 정확한 답변 제공
- 전문화된 훈련으로 인간의 프롬프트에 대한 반응성 향상
- 사용자의 의도를 정확히 파악하여 적절한 응답 생성
- 테스트 스크립트 생성 등 비교적 단순한 작업에 적합
- 예시: ChatGPT, Claude, Gemini
</aside>
<aside>
3️⃣ 추론 모델: 단계적 사고 과정을 모방하는 모델
- 연쇄적 사고를 통한 복잡한 문제 해결
- 논리적 추론, 문제 해결, 의사 결정 능력 보유
- 여러 데이터를 통합하여 맥락적 이해 수행
- 시스템의 복잡한 동작을 예측하거나 분석하는 등 다단계의 추론이 필요한 작업에 적합
- 예시: OpenAI o1, Claude 3.5 Sonnet (extended thinking)
</aside>
소형 언어 모델(SLM)
- SLM(Small Language Model)은 LLM보다 적은 파라미터를 가진 경량화 모델
- 제한된 컴퓨팅 환경에서도 효율적으로 작동하며 특정 도메인에 특화된 작업에 적합
- 예시: Phi-3, Gemma, Llama 3.2