5.3.2 미세 조정 기법
미세 조정 기법이란?
- 특성 추출 기법에서 더 나아가 사전 훈련된 모델, 합성곱층, 데이터 분류기의 가중치를 업데이트하여 훈련시킴
- '사전 학습된 모델'을 목적에 맞게 재학습시키거나 '학습된 가중치의 일부'를 재학습시키는 것
- 미세 조정하여 분석하려는 데이터셋에 잘 맞도록 모델의 파라미터를 조정하는 기법
(파라미터에 큰 변화줌 → 과적합 발생 가능 ⇒ 정교, 미세한 파라미터 업데이트 必)
+ 연산량 多 → CPU보단 GPU 사용을 권장
특성 추출 기법 VS 미세 조정 기법
· 특성 추출 기법 : 목표 특성을 잘 추출했다는 전제하에 좋은 성능이 나옴
· 미세 조정 기법 : 특성 추출 기법에서 특성이 잘못 추출되었다면 미세 조정 기법으로 이미지 데이터를 사용해, 네트워크의 가중치를 업데이트해서, 특성을 다시 추출할 수 있음
미세 조정 기법의 전략
'훈련시키려는 데이터셋의 크기'와 '사전 훈련된 모델'에 따라 나뉨
데이터셋 크기 | 사전훈련된 모델과의 유사성 정도 |
전략 |
큼 | 작음 | 재학습 대상 : 모델 전체 (데이터셋 크기가 커서 재학습시키는 게 나음) |
큼 | 큼 | 재학습 대상 : 합성곱층의 뒷부분(완전 연결층과 가까운 부분), 데이터 분류기 (데이터셋이 유사하므로 강한 특징이 나타나는 부분만 새로 학습해도, 최적의 성능 나옴) |
작음 | 작음 | 재학습 대상 : 합성곱층의 일부분, 데이터 분류기 (데이터가 적어서 일부 계층에 미세 조정 기법을 적용한다해도 효과가 없을 수 있음 → 합성곱층 중 어디까지 새로 학습시켜야 할지 적당히 설정해줘야함) |
작음 | 큼 | 재학습 대상 : 데이터 분류기 (데이터가 적어서 많은 계층에 기법 적용하면 과적합 발생 가능. 따라서 최종 데이터 분류기인 완전 연결층에 대해서만 적용) |
5.4 설명 가능한 CNN
설명 가능한 CNN(explainable CNN)이란?
딥러닝 처리 결과를 사람이 이해할 수 있는 방식으로 제시하는 기술. CNN 처리 과정을 시각화함
설명 가능한 CNN의 필요성
CNN은 블랙박스와 같아, 내부에서 어떻게 동작하는지 설명하기 어려움 → CNN으로 얻은 결과도 신뢰하기 어려움
CNN을 구성하는 중간 계층부터 최종 분류까지, 입력된 이미지에서 특성이 어떻게 추출되고 학습하는지를 시각적으로 설명한다면
→ 결과에 대한 신뢰성을 얻을 수 있음
CNN의 시각화 방법
1. 필터에 대한 시각화
2. 특성 맵에 대한 시각화 ✔
'Etc > Deep Learning' 카테고리의 다른 글
5장 합성곱 신경망Ⅰ(+) - 이미지를 255로 나누는 이유(ELLIPSIS 객체, np.newaxis, 다차원 배열 슬라이싱, 255) (0) | 2021.08.08 |
---|---|
5장 합성곱 신경망Ⅰ(3) 실습 - 특성맵 시각화 (0) | 2021.08.08 |
5장 합성곱 신경망Ⅰ(2) 실습- 전이학습- 특성 추출 기법(+ 텐서플로 허브) (0) | 2021.08.04 |
5장 합성곱 신경망Ⅰ(2) - 전이 학습 (0) | 2021.08.04 |
5장 합성곱 신경망(1) - 합성곱 신경망의 구조(입력층, 합성곱층, 풀링층, 완전연결층, 출력층) (수정, 보완必) (0) | 2021.08.04 |