Gaegul's devlog

[논문 리뷰] Domain Adaptation 본문

Artificial Intelligence/Research Paper 리뷰 📖

[논문 리뷰] Domain Adaptation

부지런깨꾹이 2021. 8. 31. 10:35
728x90
반응형

Domain Adaptation using Stochastic Neighborhood Embedding _CVPR 2019

Domain Adaptation?

도메인이 다르지만 관련이 있는 새로운 영역(distribution)에 기존 영역의 정보를 적응시키는 것.  

 

 

 

본 논문의 목표는 source domain(pretrained)의 정보를 target domain에 적응시켜 성능을 높일 수 있는 확률을 올려 주는 것이다. 사실 source 에 adaptation 되있는 모델은 새로운 source 데이터를 가지고 결과를 도출할 때 원하는 결과를 기대하기 어렵다. 이것은 domain-shift 때문인데, 피처들이 그들의 공간에 변형을 갖게 됨으로써 classifier boundary는 redrawn된다. 다른 도메인으로 부터 얻은 지식을 새로운 타겟 도메인에 재활용할 수 있는 방법을 domain adaptation이라고 한다. 만약, 솔루션이 두개의 도메인에 평등하게 수행될 수 있다면 그건 domain generalization이라고 한다.

 

Main Contribution

1. domain-agnostic latent space 를 배우기 위해 stochastic neighborhood embeding과 large-margin nearest neighborhood를 이용.

2. 수정된 Hausdorff distance를 이용,  min-max formulation을  이용.

3. domain generalization의 demonstration, state-of-the-art 결과 달성.

4. semi-supervised settings 적용.

 

d-SNE

latent-space 안에서 target domain으로 부터 하나와 source domain으로 부터 하나 사이의 거리를 고려.

formulation은 다음과 같다. target sample과 source sample 사이를 L2 loss fn(유클리안 거리)으로 정의하고 학습을 진행한다.

latent-space에서 Pij는 target sample이 source sample과 같은 label을 가질 확률. 그러므로, 본 논문에서의 목표는 같은 label 끼리의 거리는 최대한 가깝게하고, 다른 label 끼리의 거리는 최대한 멀게 하는 것이 목표이다. 

 

 

조금 더 이해하기 쉬운 그림으로 보자면 다음과 같다. 각 도메인의 sample을 feature space에서의 거리를 loss function으로 두고 학습을 시킨다. 본 d-sne의 장점으로 label이 잘 되어진 target domain이 없을 때 분류 정확도에 도움을 준다. 또한, Modified-Hausdorff distance을 이용하여 기존 t-sne나 SNE 보다 더 빠른 연산속도를 가지면서 더 명확한 시각화를 제공한다. 또한 어떤 pretrained 된 네트워크를 가져와도 사용할 수 있다는 장점이 있다.

출처 :  DMQA / 20200522_d-SNE_.pdf

 

 

Domain Adaptation for Medical Image Analysis: A Survey

본 논문은 domain adaptation을 이용해서 medical image에 적용시킨 논문이다. 의료 이미지 분석에 사용되는 병원 마다 사용하는 스캐너에 따라 이미지가 다릅니다. 서로 다른 분포로 인해 발생하는 도메인 이동 문제로 인해 모델링에 어려움을 겪는다. 이에 유망한 해결책으로 domain adaptation 이 있다. 본 논문에서는 기존 방법을 shallow 와 deep model로 나누고, supervised와 semi-supervised, unsupervised 방법으로 나눈다. 

Background 

Domain Shift

 

fig1. 4가지 MRI 데이터 셋의 밀도분포 
fig2. 4가지 다른 스캐너에서 추출한 brain slice image 와 그에 해당하는 이미지 distribution

위에 fig 1와 2에서 볼 수 있듯이 Normalization을 했을 때 각 기 다른 데이터셋에서 추출한 이미지의 분포에 차이가 있음을 확인할 수 있다. 이렇게 분포가 확연히 다름에도 불구하고 동일한 모델링으로 같은 성능을 기대하긴 힘들다. 이를 위해 domain adaptation과 transfer learning 이 해결책이 될 수 있다. transfer learning 셋팅에는 두 가지 컨셉이 있다, 하나는 "domain" 과 다른 하나는 "task" 이다. transfer learning 의 목표는 Ta 과제에서 학습한 지식을 A라는 도메인의 Ta 에서 B라는 도메인의 Tb로 이전한다. 중요한 것은 domain 과 task 는 transfer learning process를 하는 동안 바뀔 수 있다. 

domain adaptation을 위해, source domain 과 target domain 은 같은 학습 task를 공유할 수 있다.

domain adpatation 종류는 다음과 같이 다양하다. 본 논문에서는 domain adaptation 종류에 따라(e.g. 네트워크가 얇은지 딥한지, 라벨이 있다면 supervised인지 semi 인지 unsupervised인지) 적용시킬 수 있다. 자세한 내용은 논문을 참조하시면 좋을 것 같습니다 :)

 

[ Reference ]

  • d-SNE: Domain Adaptation Using Stochastic Neighborhood Embedding  :https://openaccess.thecvf.com/content_CVPR_2019/papers/Xu_d-SNE_Domain_Adaptation_Using_Stochastic_Neighborhood_Embedding_CVPR_2019_paper.pdf
  • Domain Adaptation for Medical Image Analysis: A Survey : https://arxiv.org/abs/2102.09508
728x90
반응형
Comments