본문 바로가기

STUDY

(13)
[LLM] VLM (Multimodal) 업무 비전-언어 모델 (Vision-Language Models, VLM)- 비전과 언어의 양상(Modality)를 통합하는 모델- 이미지와 자연어 텍스트를 모두 처리할 수 있는 능력을 가진 모델 멀티모달 (Multimodal)- 여러가지 데이터 형식을 가지고 수행하는 AI- Early Fusion : 종류가 다른 두가지 데이터를 하나의 데이터로 먼저 합친 이후 모델 학습- Late Fusion : 종류가 다른 두가지 데이터를 각각 다른 모델이 학습시킨 이후 나온 결과를 융합하는 방법- Joint or Intermediate Fusion : 하나의 모달리티로 모델 학습을 진행하다가 마지막 레이어 전에 다른 모달리티와 융합하는 방법 VLM의 3가지 핵심 요소- 이미지 인코더 (Image Encoder)- 텍스트..
[LLM] RAG 검색 증강 생성 (Retrieval-Augmented Generation)LLM의 한계를 극복하기 위해 '지식 검색'과 '언어 생성'을 결합한 프레임워크 LLM의 단점사실 관계 오류 가능성 (할루시네이션)- 잘못된 정보나 허위 정보를 진실로 간주하고 전파할 수 있음맥락 이해의 한계- 복잡한 맥락 파악과 심층적인 이해에 한계 존재 RAG의 보안외부 지식 활용- 대규모의 구조화된 지식베이스를 모델에 연결- 주어진 질의에 대한 관련 정보를 지식 베이스에서 검색 및 추출증거 기반 생성- 검색된 지식 정보를 증거로 활용하여 보다 사실에 기반한 답변 생성- 생성된 답변의 출처를 명시하여 신뢰성 향상맥락 이해력 향상- 외부 지식을 통해 질의에 대한 배경 지식과 맥락 정보를 파악- 단순한 패턴 매칭이 아닌 추론 능력을..
[NLP] 요약 모델 출처 문서의 수에 따른 분류- 단일 문서 (Single-document) : 하나의 문서를 요약- 다중 문서 (Multi-document) : 여러 문서에서 정보를 통합하여 하나로 요약 특정 작업에 대한 제약 (Task-specific constraints)- 특정 질문 (Query-focused)- 정보 업데이트 (Update)- 지침에 따름 (Guided) 지식의 양에 따른 분류- 지식이 적은 경우 (Knowledge-poor) : 문서 내의 정보에만 의존- 지식이 풍부한 경우 (Knowledge-rich) : 외부 지식이나 데이터베이스와 같은 외부 자원 활용 (Use of external resources) 요약 방법에 따른 분류 추출 요약 (Extractive Summarization)추출 기반 ..
[자격증] SQLD 준비 데이터 모델링의 이해데이터모델의 이해데이터 모델링의 3요소 : Thing, Attributes, Relationship데이터 모델링 특징 : 추상화(모형화), 단순화, 명확화(정확화)데이터 모델링 관점 : 데이터 관점, 프로세스 관점, 상관 관점데이터 모델링 유의사항 : 중복(Duplication), 비유연성(Inflexibility), 비일관성(Inconsistency)데이터 모델링 과정 : 개념적 - 논리적 - 물리적스키마 구조 3단계- 외부 스키마 (External Schema) : View 단계, 사용자 관점 접근 DB- 개념 스키마 (Conceptual Schema) : 조직 전체의 통합 관점 DB- 내부 스키마 (Internal Schema) : 물리적으로 저장된 형식ERD : 엔티티 그리기 ..
RANSAC 알고리즘 RANdom SAmple Consensus 특정 임계값 이상의 데이터를 완전히 무시해버리는 특성이 있어 outlier(이상점)에 강건한 알고리즘 = 가장 많은 수의 데이터들로부터 지지를 받는 모델을 선택하는 방법 outlier : 데이터의 분포에서 현저하게 벗어나 있는 관측값 Hypothesis - 가설 단계 전체 데이터에서 N개의 샘플을 선택하고, 선택된 샘플을 통해 모델을 예측한다. Verification - 검증단계 데이터셋에서 모델과 일치하는 데이터의 수를 센 후, 최대 값일 경우 모델 파라미터를 새롭게 저장한다. 위 두가지 단계를 반복하여 진행 파라미터 샘플링 과정을 몇 번 (N) 반복할 것인지, 그리고 inlier와 outlier의 경계를 (T) 어떻게 정할 것인지 RANSAC 반복회수를 N,..