[#RAG] 00. RAG란 무엇인가?

AI 애플리케이션 개발에서 가장 중요한 개념 중 하나인 RAG(Retrieval-Augmented Generation, 검색 증강 생성)에 대해 정리해 보겠습니다. 모델이 학습하지 않은 최신 정보나 내부 기밀 데이터를 안전하게 참조하게 만드는 핵심 기술입니다.

1. RAG의 구조: Retrieval + Augmented + Generation

RAG는 이름 그대로 세 가지 과정을 통해 작동합니다.

Retrieval (검색): 컴퓨터 시스템에 저장된 방대한 자료 중 필요한 정보를 취득합니다. LLM이 학습한 이후의 최신 자료나 외부 정보를 가져오는 핵심 과정입니다.
Augmented (증강): 검색된 데이터를 LLM에게 제공하여, AI가 해당 내용을 기반으로 답변을 생성하도록 사실 관계를 주입(증강)합니다.
Generation (생성): 검색된 데이터를 바탕으로 LLM이 최종적으로 답변을 작성합니다.

구성요소	역할
LangChain	프롬프트 작성 및 데이터 흐름을 조율하는 엔진
Vector Database	데이터를 숫자(벡터) 형태로 저장하고 유사도 검색을 수행하는 저장소
Embedding Model	단어/문장을 AI가 이해하는 벡터로 변환 (유사도 측정 핵심)

RAG가 실제로 어떻게 데이터를 처리하고 답변을 내놓는지 그 단계를 살펴봅니다.

💡 RAG 개발 팁: 문서를 쪼갤 때(Chunking) 너무 크면 응답 시간이 늘어나고, 너무 작으면 문맥이 잘릴 수 있습니다. 이 균형을 맞추는 것이 성능 최적화의 첫걸음입니다!

일단 RAG의 기본 개념과 프로세스를 파악했습니다. 다음에는 실제 벡터 DB(Chroma 등)를 구축하고, 문서를 로드하여 검색하는 실습을 진행해 보겠습니다.

RAG #검색증강생성 #LLM #LangChain #VectorDB #임베딩 #AI개발 #AI공부 #정보검색 #잡다한공방

[#RAG] 01. RAG 프로세스 확인과 실습 진행 (0)	2026.03.01