Auto Encoding
This is Concept of Auto Encoding with Neural Network.
3. AutoEncoder
- 차원축소
3.1 문제 인식
- 대부분의 데이터는 소수의 변수로 표현할 수 있다
- 성격 형용사: 수 천개 = 성격요인: 5개 + 1~2개
- 차원 축소: 데이터를 소수의 변수로 표현하는 것
- 예: 요인분석(FA), 주성분분석(PCA)
3.2 차원 축소 용도
- 시각화
- 많은 변수를 가진 데이터 -> 2차원으로 축소 -> 시각화
시각화에서 변수가 많다. -> 차원이 많다 -> 보기 힘들고 그리기 힘들다. -> 2차원으로 줄인다.
- 노이즈 제거
- 차원이 축소되면 주요한 특징만 남음 -> 노이즈 제거
- 차원이 높으면 노이즈가 많을 확률이 높다. => 차원을 줄일 때 가능한 내용을 많이 포함할 수 있도록 줄인다. (PCA)
- 유사성
작은 차원에서 비교가 더 쉽고 정확할 수 있음
- 데이터 생성
- 차원 축소 -> 약간의 변화 -> 원래 차원으로 복구
- Input Shape : 784
- Output Shape : 784 동일하게
- 중간으로 갈 수록 줄어든다.
이미지 복원
from keras.datasets import mnist
(x_train, y_train), (x_test,y_test) = mnist.load_data()
_, width, height = x_train.shape
데이터 보기
%matplotlib inline
import matplotlib.pyplot as plt
데이터 전처리
input_train = x_train / 255.0
input_test = x_test / 255.0
from keras.models import Sequential
from keras.layers import Dense, Flatten, Reshape
from keras.optimizers import Adam
model = Sequential()
model.add(Flatten(input_shape=(width,height,))) # 784로 만들어주는 효과
model.add(Dense(width*height, activation='sigmoid'))
# softmax가 아니라 sigmoid가 나온 이유는 결과를 그대로 출력해야 되니깐.
# 원복하는 느낌으로 하는것이다.
Layer (type) Output Shape Param #
flatten_1 (Flatten) (None, 784) 0
dense_1 (Dense) (None, 196) 153860
dense_2 (Dense) (None, 49) 9653
dense_3 (Dense) (None, 196) 9800
dense_4 (Dense) (None, 784) 154448
reshape_1 (Reshape) (None, 28, 28) 0
Total params: 327,761
Trainable params: 327,761
Non-trainable params: 0
- mse로하면 0.2 - 0.1 = 0.1 ^2 으로 해야되므로 그나마 색이 가장 비슷하도록 만들어주려고 mse를 사용
- 뭘 사용해도 크게 변하는게 없다고는 한다.
batch_size = 128
epochs = 7
- input_train이 들어가서 input_train이 나와야 된다.
history =, input_train,
validation_data=(input_test, input_test))
input_regen = model.predict(input_test)
plt.imshow(input_test[0,], cmap='gray')
plt.imshow(input_regen[0,], cmap='gray')
노이즈 제거
import numpy as np
np.random.normal(scale=0.2, size=(width, height))[:1]
# 평균이 0 이고 표준편차가 0.2인 정규 분포 생성.
noise = input_test + np.random.normal(scale=0.2, size=(width, height))
noise = np.clip(noise, 0, 1) # 0보다 작은 값이 나오면 0 1보다 큰값이 나오면 1
plt.imshow(noise[0,], cmap='gray')
denoise = model.predict(noise)
plt.imshow(denoise[0,], cmap='gray')
모델 Save"model_save.sav")
모델 Load
from keras.models import load_model
model = load_model("model_save.sav")
output = model.predict(input_test)
plt.imshow(output[0,], cmap='gray')
