검색 증강 생성 (Retrieval-Augmented Generation)
LLM의 한계를 극복하기 위해 '지식 검색'과 '언어 생성'을 결합한 프레임워크
LLM의 단점
사실 관계 오류 가능성 (할루시네이션)
- 잘못된 정보나 허위 정보를 진실로 간주하고 전파할 수 있음
맥락 이해의 한계
- 복잡한 맥락 파악과 심층적인 이해에 한계 존재
RAG의 보안
외부 지식 활용
- 대규모의 구조화된 지식베이스를 모델에 연결
- 주어진 질의에 대한 관련 정보를 지식 베이스에서 검색 및 추출
증거 기반 생성
- 검색된 지식 정보를 증거로 활용하여 보다 사실에 기반한 답변 생성
- 생성된 답변의 출처를 명시하여 신뢰성 향상
맥락 이해력 향상
- 외부 지식을 통해 질의에 대한 배경 지식과 맥락 정보를 파악
- 단순한 패턴 매칭이 아닌 추론 능력을 바탕으로 한 답변 생성
RAG의 주요 구성 요소
질의 인코더 (Query Encoder) : 사용자의 질문을 이해하는 언어 모델
지식 검색기 (Knowledge Retriever) : 인코딩된 질문을 바탕으로 외부 지식 베이스에서 관련 정보 검색
지식 증강 생성기 (Knowledge-Augmented Generator) : 검색된 지식을 활용하여 질문에 대한 답변을 생상하는 언어 모델
Fine-tuning(파인튜닝)과 비교
- 사전 학습된 모델에 특화 데이터를 추가 학습시켜 맞춤형 모델로 업데이트
- 기업의 도메인 데이터 품질과 양에 의존적
- 지속적으로 최신 상태를 유지하기 어려움
참조
https://modulabs.co.kr/blog/retrieval-augmented-generation/
추가적으로 볼 글
https://www.samsungsds.com/kr/insights/rag-customization.html
'STUDY' 카테고리의 다른 글
[데이터] GIS (0) | 2024.06.27 |
---|---|
[LLM] VLM (Multimodal) 업무 (1) | 2024.06.19 |
[NLP] 요약 모델 (0) | 2024.05.29 |
[자격증] SQLD 준비 (0) | 2024.05.24 |
RANSAC 알고리즘 (0) | 2023.09.12 |