Not All Out-of-Distribution Data Are Harmfulto Open-Set Active Learning 논문 공부

◻ 이 논문은 NeurIPS'24에 publish된 논문으로 2024.04.11 기준 2회의 citation을 보유하고 있다.

◻ 이 논문은 기존의 Open-set AL이 과도하게 OOD samples을 걸러내는 것을 지적한다.

◽ OOD detector를 학습시키려면 어느정도 OOD samples도 필요하다는 주장을 한다.

◻ 이 논문은 https://proceedings.neurips.cc/paper_files/paper/2023/hash/2c8d9636f74d0207ff4f65956010f450-Abstract-Conference.html에서, 코드는 https://github.com/njustkmg/PAL.에서 찾아볼 수 있다. 😉

Introduction

◻ 대체적으로 abstract에서 했던말을 반복한다.

◽ OOD samples을 적당히 뽑으면 모델 (classifier, OOD detector) 성능에 좋다 (위 figure(a))

◻ 샘플의 informativeness와 representativeness를 동시에 고려하여 selection을 수행한다.

◽ informativeness : one-vs-all (OVA) classifier의 entropy를 사용하여 계산

◽ representativeness : learned meta-weight를 사용하여 계산

Methodology

Sampling Criteria.

Uncertainty weight.

◻ 이 논문은 one-vs-all (OVA) classifier 를 사용하여 informativeness를 측정한다.

◽ OVA classifier는 각 클래스에 대해 하나의 이진 분류기를 생성한다.

◽ OVA classifier의 학습 loss는 아래와 같다. (정답 class는 1, 오답 class는 0을 predict하도록...)

◽ OVA classifier로 계산한 informativeness는 아래와 같다. (흠.. 뭔가 이상한데? 🤨)

◽ 어찌 되었던 $s^{ID}$ 가 높을수록 정보량이 낮다고 한다 (= 더 in-distribution에 속할 것 같다)

Meta weight.

◻ meta-weight을 통해 represenatation score을 측정한다.

◻ 여기서 meta-weight은 unlabeled sample의 weight이다. (in semi-supervised learning)

◽ unlabeled sample에 대한 loss는 entropy minimization loss 이다.

◽ (왜인지는 모르겠으나) meta-weight 값이 클수록 representativeness score가 더 높은 샘플이라 한다.

Progressive Sampling.

◻ 흠.. 딱히 progressive한 내용은 없는데, 왜 progressive sampling인지 모르겄다..

◻ 기존의 C개의 OVA classifier를 C+1 개의 classifier로 확장한다 (마지막 class는 labeled / unlabeled 유무 판단)

◻ ID data와 OOD data를 동시에 select한다.

◽ ID data의 경우 가장 정보량 (representativeneses & informativeness)가 높은 샘플을 선택한다.

◽ OOD data의 경우 가장 정보량이 낮은 샘플을 선택한다.

Classifier Training.

◻ 흠.. 딱히 progressive한 내용은 없는데, 왜 progressive sampling인지 모르겄다..

◻ 기존의 C개의 OVA classifier를 C+1 개의 classifier로 확장한다 (마지막 class는 labeled / unlabeled 유무 판단)

◽ ID data를 가지고 C개의 sub-classifier를 학습하고, OOD data로 남은 한개의 sub-classifier를 학습한다.

◽ 이 OVA classifier는 이후 informativeness를 측정하는데 사용된다. (위 식 참고)

◻ ID data만 가지고 그냥 일반적인 C-way classifier도 학습된다.

◽ 실제로는 이 classifier를 가지고 evaluation을 진행한다.

◽ evaluation은 ID setting에서 진행되기 때문에, C-way classifier만 사용해도 문제가 없다.

'Active Learning 공부' 카테고리의 다른 글

Budget aware Few-shot learning via Graph Convolutional Network 논문 공부 (0)	2024.04.09
Meta-Query-Net: Resolving Purity-InformativenessDilemma in Open-set Active Learning 논문 공부 (0)	2024.04.09

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

AI 공부 기록용 블로그

Not All Out-of-Distribution Data Are Harmfulto Open-Set Active Learning 논문 공부

Introduction

Methodology

'Active Learning 공부' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

Not All Out-of-Distribution Data Are Harmfulto Open-Set Active Learning 논문 공부

Introduction

Methodology

'Active Learning 공부' 카테고리의 다른 글

'Active Learning 공부' Related Articles

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역