반응형 빅데이터1 [인공지능] PCA 주성분 분석 차원(Dimension) 이란? 차원은 데이터의 특성(Feature)를 표현하는 정보량, 즉 데이터 공간의 크기를 의미한다. 차원이 클수록 데이터를 더 잘 표현할 수 있지만, 차원이 너무 커지게 된다면 아래와 같은 문제가 생길 수 있다. 차원이 너무 커질 경우 -> 차원의 저주(Curse of dimensionality) 1) 데이터 내 노이즈가 증가하고, 과적합(Overfitting)이 될 확률이 커진다. * 노이즈란? 데이터 사이에 있는 빈 공간을 의미. 2) 계산량이 커지게 되고, 모델을 훈련하고 예측하는 데 시간이 길어진다. 3) 차원이 많아짐에 따라, 잘 학습하기 위해 필요한 데이터양이 증가한다. 여기 고양이 사진을 우리가 분석할 수 있는 형태로 만든다고 해보자. 사진의 높이가 3120,.. 2024. 4. 24. 이전 1 다음 반응형