Convolution

Convolution(+Pooling)을 하는 이유

Feature extraction (강조, 외곽선을 따는 등의 효과를 줄 수 있음)

Fully connected layer

Decision making (ex. 분류, 회귀)

최근에는 이 fully connected layer를 줄이는 추세 Why?

파라미터가 많을수록 학습이 어렵고 generalization performance(학습 데이터가 아닌 데이터에 대한 성능)이 낮아지므로

1X1 Convolution**

bottleneck architecture

depth가 깊어져도 파라미터 수는 늘어나지 않도록..

Filter : stride크기만큼 지나가면서 conv연산할 때 쓰이는 것, 필터와 비슷할 수록 연산값이 크다. 즉 필터와 얼마나 같은지를 연산으로 구하는 것이라고도 볼 수 있다.

Stride : 건너뛰면서 convolution
- 5X5 stride size 1이면 그냥 그대로니까 Conv 연산 후에도 5X5
- stride size 2 이면 2.5X2.5인데 이건 불가능하니까 3X3
- stride와 filter 사이즈 같으면 overlap없음
Batch : 배치 사이즈 만큼의 개수를 갖고 학습시킬 것
- 보통 mini batch 많이 쓴다.

CNN - 1x1 convolution의 중요성(AlexNet, VGGNet, GoogleNet, ResNet, DenseNet) (0)	2022.02.08
Optimization (0)	2022.02.07
뉴럴 네트워크 - MLP (Multi-Layer Perceptron) (0)	2022.02.07
DL의 대표적인 논문들 (0)	2022.02.07

티스토리툴바