Etc/Deep Learning

5장 합성곱 신경망Ⅰ(3) - 미세조정기법(전이학습), 설명 가능한 CNN

z.zzz 2021. 8. 6. 11:29

5.3.2 미세 조정 기법

미세 조정 기법이란?

  • 특성 추출 기법에서 더 나아가 사전 훈련된 모델, 합성곱층, 데이터 분류기의 가중치를 업데이트하여 훈련시킴
  • '사전 학습된 모델'을 목적에 맞게 재학습시키거나 '학습된 가중치의 일부'를 재학습시키는 것
  • 미세 조정하여 분석하려는 데이터셋에 잘 맞도록 모델의 파라미터를 조정하는 기법

      (파라미터에 큰 변화줌 → 과적합 발생 가능 ⇒ 정교, 미세한 파라미터 업데이트 必)

   + 연산량 多 → CPU보단 GPU 사용을 권장

 

특성 추출 기법 VS 미세 조정 기법

 · 특성 추출 기법 : 목표 특성을 잘 추출했다는 전제하에 좋은 성능이 나옴

 · 미세 조정 기법 : 특성 추출 기법에서 특성이 잘못 추출되었다면 미세 조정 기법으로 이미지 데이터를 사용해, 네트워크의 가중치를 업데이트해서, 특성을 다시 추출할 수 있음

 

미세 조정 기법의 전략

'훈련시키려는 데이터셋의 크기''사전 훈련된 모델'에 따라 나뉨

데이터셋 크기 사전훈련된 모델과의
유사성 정도
전략
작음 재학습 대상 : 모델 전체
(데이터셋 크기가 커서 재학습시키는 게 나음)
재학습 대상 : 합성곱층의 뒷부분(완전 연결층과 가까운 부분), 데이터 분류기
(데이터셋이 유사하므로 강한 특징이 나타나는 부분만 새로 학습해도, 최적의 성능 나옴)
작음 작음 재학습 대상 : 합성곱층의 일부분, 데이터 분류기
(데이터가 적어서 일부 계층에 미세 조정 기법을 적용한다해도 효과가 없을 수 있음 → 합성곱층 중 어디까지 새로 학습시켜야 할지 적당히 설정해줘야함)
작음 재학습 대상 : 데이터 분류기
(데이터가 적어서 많은 계층에 기법 적용하면 과적합 발생 가능. 따라서 최종 데이터 분류기인 완전 연결층에 대해서만 적용)

미세 조정 기법

 


5.4 설명 가능한 CNN

설명 가능한 CNN(explainable CNN)이란?

딥러닝 처리 결과를 사람이 이해할 수 있는 방식으로 제시하는 기술. CNN 처리 과정을 시각화

 

설명 가능한 CNN의 필요성

CNN은 블랙박스와 같아, 내부에서 어떻게 동작하는지 설명하기 어려움 → CNN으로 얻은 결과도 신뢰하기 어려움

CNN을 구성하는 중간 계층부터 최종 분류까지, 입력된 이미지에서 특성이 어떻게 추출되고 학습하는지를 시각적으로 설명한다면

→ 결과에 대한 신뢰성을 얻을 수 있음

 

CNN의 시각화 방법

1. 필터에 대한 시각화

2. 특성 맵에 대한 시각화 ✔