PCA 구현하기

snoohey 2018. 8. 20. 22:06

2018. 8. 20. 22:06

1. 데이터를 같은 범위로 rescaling한다.

<사용 라이브러리>

- from sklearn.preprocessing import StandardScaler

x_std = StandardScaler().fit_transform(X)

<사용 라이브러리>

- import numpy as np

features = x_std.T

covariance_matrix = np.cov(features)

<사용 함수>

eig_vals, eig_vecs = np.linalg.eig(covariance_matrix)

(이 고유벡터를 사용했을때의 데이터 유실정도)

eig_vals[0] / sum(eig_vals)

projected_X = x_std.dot(eig_vecs.T[0])