[WEEK 14-16] Semantic Seg

FCN

- VGG : nn.Linear를 nn.Conv2d로 사용해 위치정보 특징 추출, 입력값 상관 없음

- Transposed Convolution : Upsampling, Deconvolution(잘못)

- MaxPooling으로 잃어버린 정보 복원, Upsampled Size를 줄여 효율적인 이미지 복원

문제

- 객체가 크거나 작을때 예측을 잘 못함, 디테일한 모습이 사라짐

Decoder 개선

- DeconvNet : Unpooling과 Transposed Convolution 반복, 전반적 모습을 잡고, 구체적 모습을 잡고

- SegNet : FC layer를 제거, 시간 감소

Skip Connection 적용

- FC DenseNet, Unet

Receptive Field 확장 1

- DeepLab v1 : Dilated Convolution, Bilinear Interpolation, Dense Conditional Random Field

- DilatedNet

Receptive Field 확장 2

- DeepLab v2 : ResNet-101 Backbone, Atrous Spatial Pytamid Pooling

- PSPNet : Global Average Pooling로 전체 맥락 판단

- DeepLab v3 : 위 둘을 함침

- DeepLab v3+ : Encoder-Decoder 구조, modified Xception Backbone

U-Net

- Contracting Path : 이미지 특징 추출

- Expanding Path : localization을 가능하게 함

U-Net++

- Dense Skip Connection

- 모든 depth를 Ensemble한 효과

- Htbrid Loss, Deep Supervision

U-Net 3+

- Full-scale Skip Connection : (conventional + inter + intra) skip connection

- Classfication-guided Module (CGM)

Residual U-Net, Mobile-UNet, Eff-UNet

Segmentation Models (SMP)

실험 1

- 디버깅 모드, 시드 고정, 실험기록, 실험 하나씩, 역할 분배

- Validation : Hold Out, K-Fold, Stratified K-Fold, Group K-Fold

- Augmentation(Albumentation) : Cutout, Gridmask, Mixup, Cutmix, SnapMix, CropNonEmptyMaskIfExists

- SOTA Model : Paper with Codes에서..

- Scheduler : CosineAnnealingLR, ReduceLROnPlateau, Gradual Warmup (pretrained 일때 좋음)

- Bath size : Gradient Accumulation

- Optimizer : Adam, AdamW, AdamP, Radam, Lookahead optimizer

- Loss : 다양함, 여러 loss 결합

실험 2

- Ensemble : 5-Fold Ensemble, Epoch Ensemble, SWA (Stochastic Weight Averaging), Seed Ensemble, Resize Ensemble, TTA (Test time augmentation) (ttach Library)

- Pseudo Labeling, 외부 데이터 활용

HRNet (High Resolution Network)

- 고해상도 정보를 계속 유지

- Parallel Multi-Resolution Convolution Stream

- Repeated Multi-Resolution Fusions

- Representation Head

SegFormer

- Local Continuity 보존 : overlapping patch merging

- 효율적인 Attention 계산 : Efficient Self-Attention

- Positional Embedding의 단점 극복 : Mix-FFN

- MLP로 이루어진 Decoder : lightweight All-MLP

WSSS

CAM, Grad-CAM

'부스트캠프 AI Tech' 카테고리의 다른 글

[WEEK 17-18] Product Serving (1)	2024.02.26
Hand Bone Image Segmentation 트러블 슈팅 (0)	2024.02.19
글자 검출 프로젝트 트러블 슈팅 (1)	2024.01.22
[WEEK 12-13] CV Data-Centric (0)	2024.01.22
재활용 품목 분류를 위한 Object Detection 트러블 슈팅 (1)	2024.01.07

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

척척비전공자연계학사의 기술블로그

[WEEK 14-16] Semantic Seg

'부스트캠프 AI Tech' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

[WEEK 14-16] Semantic Seg

'부스트캠프 AI Tech' 카테고리의 다른 글

'부스트캠프 AI Tech' Related Articles

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역