EDA란 무엇인가 | 데이터 분석에서 왜 먼저 해야 하는가
데이터 분석에서 모델보다 먼저 해야 하는 일이 있다.바로 EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 다.많은 입문자가 데이터 분석을 시작하면 바로 머신러닝 모델부터 떠올리는데, 실제로는 그 전에 데이터가 어떻게 생겼는지, 무슨 패턴이 있는지, 무엇을 더 확인해야 하는지를 먼저 보는 과정이 필요하다.EDA는 바로 그 역할을 한다.즉, EDA는 모델링 이전의 부가 작업이 아니라, 분석 방향을 결정하는 첫 단계에 가깝다. EDA는 현상 파악 단계이고, 이후 머신러닝에서는 feature 설계와 연결되며, 딥러닝은 상대적으로 모델 구조와 튜닝 비중이 더 크다는 점도 함께 구분할 필요가 있다.EDA를 한 줄로 정리하면EDA는 데이터를 바로 모델에 넣기 전에, 데이터의 분포·결측치·..