본문 바로가기

분류 전체보기

(46)

[LLM] RAG 검색 증강 생성 (Retrieval-Augmented Generation)LLM의 한계를 극복하기 위해 '지식 검색'과 '언어 생성'을 결합한 프레임워크 LLM의 단점사실 관계 오류 가능성 (할루시네이션)- 잘못된 정보나 허위 정보를 진실로 간주하고 전파할 수 있음맥락 이해의 한계- 복잡한 맥락 파악과 심층적인 이해에 한계 존재 RAG의 보안외부 지식 활용- 대규모의 구조화된 지식베이스를 모델에 연결- 주어진 질의에 대한 관련 정보를 지식 베이스에서 검색 및 추출증거 기반 생성- 검색된 지식 정보를 증거로 활용하여 보다 사실에 기반한 답변 생성- 생성된 답변의 출처를 명시하여 신뢰성 향상맥락 이해력 향상- 외부 지식을 통해 질의에 대한 배경 지식과 맥락 정보를 파악- 단순한 패턴 매칭이 아닌 추론 능력을..

[프로그래머스] 아방가르드 타일링 (python) 문제 링크 : https://school.programmers.co.kr/learn/courses/30/lessons/181186 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.programmers.co.kr정말 대표적인 DP문제 입니다.점화식으로 풀이하는 방식이 굉장히 신선했습니다. 1. 기존 DP 방식case = ['000', '012', '210', '102', '201', '120', '021']우선 각 단계의 6가지 케이스를 나누었습니다.이 케이스는 이전 타일은 완성된 상태에서 튀어나온 칸의 수를 여섯가지 경우로 나눈 것 입니다.- 0 이 없는 경우는 그 부분에서 다음 dp 단계로..

[NLP] 요약 모델 출처 문서의 수에 따른 분류- 단일 문서 (Single-document) : 하나의 문서를 요약- 다중 문서 (Multi-document) : 여러 문서에서 정보를 통합하여 하나로 요약 특정 작업에 대한 제약 (Task-specific constraints)- 특정 질문 (Query-focused)- 정보 업데이트 (Update)- 지침에 따름 (Guided) 지식의 양에 따른 분류- 지식이 적은 경우 (Knowledge-poor) : 문서 내의 정보에만 의존- 지식이 풍부한 경우 (Knowledge-rich) : 외부 지식이나 데이터베이스와 같은 외부 자원 활용 (Use of external resources) 요약 방법에 따른 분류 추출 요약 (Extractive Summarization)추출 기반 ..

[자격증] SQLD 준비 데이터 모델링의 이해데이터모델의 이해데이터 모델링의 3요소 : Thing, Attributes, Relationship데이터 모델링 특징 : 추상화(모형화), 단순화, 명확화(정확화)데이터 모델링 관점 : 데이터 관점, 프로세스 관점, 상관 관점데이터 모델링 유의사항 : 중복(Duplication), 비유연성(Inflexibility), 비일관성(Inconsistency)데이터 모델링 과정 : 개념적 - 논리적 - 물리적스키마 구조 3단계- 외부 스키마 (External Schema) : View 단계, 사용자 관점 접근 DB- 개념 스키마 (Conceptual Schema) : 조직 전체의 통합 관점 DB- 내부 스키마 (Internal Schema) : 물리적으로 저장된 형식ERD : 엔티티 그리기 ..

[WEEK END] Generative AI 생성형 이미지 모델 분야- Style transfer : 이미지의 스타일을 다른 이미지에 적용- Inpainting : 이미지의 손상된 부분이나 누락된 부분을 복원하거나 채움- Image editing : 이미지를 변경하거나 개선- Super-resolution : 저해상도 이미지를 고해상도 이미지로 변환Multi-modal 생성형 이미지 모델- Text-to-Image : 텍스트를 입력으로 사용하여 이미지 생성- Text-to-Video : 텍스트를 입력으로 사용하여 비디오 생성- Image-to-Video : 이미지와 prompt를 사용하여 비디오 생성 LLM : 범용 목적 모델 구축, 하나의 모델을 이용하여 다양한 태스크 해결, Zero/Few-Shot Learning- SFT(Supervised ..

[백준 BOJ] 1385 벌집 (python) 문제 링크 : https://www.acmicpc.net/problem/1385 1385번: 벌집첫째 줄에는 당신이 있는 방의 번호 a와 출구가 있는 방의 번호 b가 주어진다.1 ≤ a, b ≤ 1,000,000)www.acmicpc.net저의 풀이는 시간복잡도를 줄이기 위해 좌표계 변환 후 BFS를 이용하는 방식이 아닌 복잡한 구현으로 풀이가 되었습니다.코드에 대한 설명은 코드 길이 8379B의 긴 풀이라 구간별로 설명 드리도록 하겠습니다.무엇보다 이 문제에서는 풀이보다는 풀어가는 아이디어에 대한 영감을 얻으시면 좋은 문제라고 생각합니다. 0. 전체 아이디어 입력값의 최대가 1,000,000인 만큼 BFS 풀이는 위험할 수 있다고 판단하였습니다.따라서 벌집을 1과 1을 제외..

[WEEK 17-18] Product Serving Batch 패턴- 실시간성이 필요 없는 경우에 주기적으로 예측 결과를 DB에 저장- Job Management Server : 작업을 실행하는 서버, Apache Airflow 등을 주로 사용- API 서버를 개발하지 않아도 되지만 별도의 스케줄러 필요Web Single 패턴- API 서버 코드에 모델을 포함시킨 뒤 배포- 이 패턴을 기본으로 ..

Hand Bone Image Segmentation 트러블 슈팅 # 한쪽 손 flip 모든 양손 데이터를 한쪽 손 방향으로 flip하여 학습, 추론 결과적으로 효과 없음 (오히려 하락세) # TTA scale TTA는 오히려 성능을 많이 저하시켰음 flip TTA만 진행한 결과는 아주 소량 성능 향상 # valid 결과가 제출 결과보다 안좋은 경우 학습과 추론은 잘 되었으므로 valid의 mask에 대해서 잘못 되었을 확률이 크다! 역시 valid set를 is_train=False를 적용한 경우 mask에 대해서 transform을 적용하지 않고 있었음 # 학습과 추론 이미지 사이즈 통일 한가지 resize로 학습했을때는 추론결과도 같은 size로 추론해야함 scale TTA가 제대로 안먹히는 이유인듯 위 이유로 Resize 앙상블도 해볼만 하다고 생각

목록 더보기

티스토리툴바