pca#decomposition#machinelearning#supervisedlearning
-
PCA를 활용한 차원 축소 방법머신러닝/FAQ 2023. 4. 13. 10:18
오랜만에 포스팅을 올립니다. PCA를 활용한 차원 축소는 일반적으로 정형데이터 feature(columns) 갯수가 많아 overfitting될 가능성이 있는 경우 해당 차원(일반적으로 feature 갯수 = 차원 갯수)에 대한 정보는 소실되지 않으면서 차원을 줄일 수 있는 방법이다. (자세한것은 구글에 PCA를 검색하면 쉽게 개념에 대해 접할 수 있음) 이번에는 아주 간략하게 PCA를 구현하는 파이썬 코드를 통해 만들어보고자 한다. 데이터는 데이콘의 전복나이예측경진대회의 데이터를 활용하였고, 방법은 어느 데이터든 동일하다. 참고로 featrue갯수가 많다는것은 보통 50개 이상 정도의 정형데이터의 차원에서 한번 try 해보는것을 추천한다. import pandas as pd import numpy as..