[SK플래닛] ASAC 빅데이터전문가 11기 | 20일차
20일차는 전날 배운 선형대수 개념이 실제 머신러닝의 대표적인 차원 축소 방법인 PCA로 이어지는 흐름이었다. 19일차에는 basis, eigenvalue, gradient, Jacobian 같은 개념을 각각 따로 봤다면, 이번에는 그 개념들이 왜 필요한지 조금 더 연결해서 볼 수 있었다.전체 흐름은 크게 두 갈래였다. 앞부분은 데이터를 평균 중심으로 옮기고, 공분산 행렬을 만들고, 새로운 basis에서 분산이 가장 커지는 방향을 찾는 과정이었다. 뒷부분은 벡터 미분과 인공신경망을 연결하면서, forward 계산뿐 아니라 backward 과정도 행렬과 미분으로 볼 수 있다는 내용이었다. 특히 PCA에서 “분산이 가장 큰 방향을 찾는다”는 말이 단순 설명이 아니라, 실제로는 WᵀSW를 최대화하는 문제이고,..