LLM 개념 정리

1. LLM이란 무엇인가? 정의 Large Language Model = 대규모 언어 모델 엄청난 양의 텍스트로 학습한 파라미터가 수백억~조 개인 언어를 이해하고 생성하는 AI 모델 본질 “다음 단어 예측"을 극한까지 잘하는 모델 입력: "오늘 날씨가 정말" LLM: "좋네요" (가장 자연스러운 다음 단어 선택) → 이 단순한 원리로 대화, 요약, 번역, 코딩까지 가능 2. LLM = 딥러닝의 한 종류 AI 기술 계층도 AI └─ 머신러닝 ├─ 전통 머신러닝 └─ 딥러닝 └─ Transformer └─ LLM ← 여기 LLM의 위치 AI의 일부 딥러닝의 일부 Transformer 기반 현재 가장 주목받는 분야 Multimodal 확장 최근 트렌드: ...

2025년 11월 13일

AI 개념 정리

1. AI 영역 구분 1번: AI 모델 개발 직접 머신러닝으로 모델 학습 추천, 예측 등 자체 모델 제작 시간/비용 많이 들고, 전문 인력 필요 2번: AI 기능 통합 외부 LLM API 활용 (GPT, Claude) 서비스에 챗봇, 요약, 검색 등 추가 빠르고, 기존 개발자가 가능 3번: AI 도구 사용 Claude Code, Copilot으로 개발 효율화 AI는 보조 도구 2. 데이터 마이닝 ↔ AI 관계 데이터 마이닝 AI (패턴/인사이트 발견) (지능적 판단·행동) ╲ ╱ ╲ ╱ ╲ ╱ ╲ ╱ 머신러닝 설명 데이터 마이닝: “왜 이런 일이 일어나는가?” (패턴 발견) AI: “이 상황에서 뭘 해야 하는가?” (문제 해결) 머신러닝: AI의 한 분야이자, 데이터 마이닝에서 활용되는 핵심 도구 예시 데이터 마이닝: 고객 데이터 분석 → “금요일 저녁 맥주+치킨 많이 팔림” 발견 AI: 고객 접속 시 → “이 사람에게 맥주 추천” 자동 판단 3. AI의 기술 체계 AI의 목적 지능적 판단·계획·행동으로 문제 해결 예측은 그 중 한 수단일 뿐 AI (지능적으로 판단·계획·행동하여 문제 해결) ├─ 규칙 기반 AI (if-then 로직) ├─ 탐색/최적화 알고리즘 └─ 머신러닝 ← 요즘 AI의 핵심 (특히 딥러닝) ├─ 전통 머신러닝 (SVM, 랜덤포레스트 등) └─ 딥러닝 ├─ CNN (이미지 인식) ├─ RNN (시계열 처리) └─ Transformer (2017~) ├─ BERT (양방향 이해) └─ LLM (대규모 언어모델) ← 요즘 가장 주목받는 분야 └─ GPT, Claude, Gemini 4. 머신러닝의 학습 방식 머신러닝 (데이터로 모델 학습) ├─ 지도 학습 (정답 있는 데이터로 학습) ├─ 비지도 학습 (정답 없이 패턴 찾기) └─ 강화 학습 (시행착오로 학습) 5. 핵심 프로세스 학습 데이터 → [학습/Training] → 모델 입력 데이터 → [추론/Inference] → 결과 6. 시대별 “AI"의 의미 1980년대: AI = 규칙 기반 한계에 부딪힘 (AI의 겨울) 2000년대: AI = 머신러닝 데이터 → 특징 → 학습 → 모델 → 추론 딥러닝 이론 존재, 컴퓨팅 파워 부족 2010년대: AI = 딥러닝 GPU 발달 2012 ImageNet: CNN으로 이미지 인식 돌파 2017 Transformer 등장 2020년대: AI ≈ LLM (대중 인식) ChatGPT, Claude 등의 폭발적 성장 7. 핵심 용어 정리 AI (인공지능) 지능적으로 판단·계획·행동하여 문제 해결 요즘은 사실상 머신러닝 의미로 많이 씀 머신러닝 (기계학습) 데이터로 기계를 학습시킴 AI 구현에 성공한 방법 데이터 마이닝과 AI가 공유하는 핵심 도구 딥러닝 신경망을 깊게 쌓은 것 특징을 자동으로 학습 (사람이 특징 정의 불필요) GPU 발달로 2010년대 실용화 Transformer 2017년 등장한 딥러닝 아키텍처 병렬 처리가 가능해서 대규모 학습에 유리 LLM (Large Language Model) Transformer 기반 대규모 언어 모델 ChatGPT, Claude 등 AI 중 일부지만 최근 2-3년 폭발적 유행 데이터 마이닝 데이터에서 패턴/인사이트 찾기 머신러닝을 도구로 활용

2025년 11월 11일