반응형

Convolution Layer

 

7주차 - CNN, Convolution Layer, Zero Padding

Computer Vision의 역사 지문인식으로 Computer Vision의 역사를 살펴보면 다음과 같다. 과거에는 이미지의 일부 정보만 활용하여 특징점을 추출했다. 이러한 경우에는 같은 특징점을 가지는 사람이 다

jschan0911.tistory.com

Convolution Layer는 이전에 작성한 내용처럼 필터를 통해 인위적으로 이미지를 훼손시켜서 특징만 남기는 역할을 한다. CNN은 이러한 Convolution Layer를 사용하여 정확도를 높인 모델이다. 그런데 만약 Convolution Layer 여러 개 둔다면 어떻게 될까?

 

위 그림은 Convolution Layer를 3개 두어 Fully Conneced Layer를 2개 만드는 과정을 나타낸 것이다. 그 결과 정확도는 오히려 하락했다. 그 이유는 Convolution Layer를 추가하는 과정에서 이미지 크기가 너무 작아졌기 때문이다. 

 

Fashion Mnist Data

Fashion Mnist Data는 Mnist Data와 똑같이 28 by 28 크기를 가지고, 60,000개의 Training Data, 10,000개의 Test Data를 가지는 데이터셋이다.

 

이미지 처리에 CNN이 효율적인 이유

CNN이 아닌 일반적인 딥러닝 모델로 이미지(2차원 데이터)를 학습하기 위해서는 2차원 데이터를 1차원으로 Flatten한 뒤, 순차적으로 입력되도록 설계한다. 그러면 이미지의 특성을 반영하지 못한다는 단점이 있다. 반면 CNN을 사용하면 2차원 데이터를 바로 입력할 수 있고, 2차원 구조의 특징도 반영할 수 있다는 장점이 있다. 그래서 CNN이 이미지 처리에 효율적이다.

 

Cifar10 Data

Cifar10 Data는 Mnist 데이터들과는 다르게 배경이 존재하고 32 by 32 by 3 크기의 이미지이다. 각 픽셀은 0~255의 강도를 가질 수 있기에 총 256 * 256 * 256 = 1670만 개의 색 표현을 할 수 있다.

반응형

+ Recent posts