[SK플래닛] ASAC 빅데이터전문가 11기 | 26일차
26일차는 전날 배운 머신러닝 기본 흐름에서 한 단계 더 들어가, 타이타닉 데이터를 실제 모델링 가능한 형태로 만들고, 여러 모델을 비교하고, 하이퍼파라미터 튜닝까지 이어가는 과정이었다. 25일차에는 load_digits()처럼 이미 정리된 샘플 데이터로 fit → predict → score 흐름을 봤다면, 이번에는 Kaggle 스타일의 train.csv를 가져와 결측치, 문자열 컬럼, 불필요한 컬럼, validation 분리, K-Fold, RandomizedSearchCV, GridSearchCV까지 한 번에 이어졌다. 특히 이번 날은 “모델을 돌리는 코드”보다 모델이 돌아갈 수 있는 상태를 만드는 코드가 더 중요하게 느껴졌다. 타이타닉 데이터에는 Name, Sex, Age, Ticket, Cab..