'scikit-learn' 태그의 글 목록

[SK플래닛] ASAC 빅데이터전문가 11기 | 26일차

26일차는 전날 배운 머신러닝 기본 흐름에서 한 단계 더 들어가, 타이타닉 데이터를 실제 모델링 가능한 형태로 만들고, 여러 모델을 비교하고, 하이퍼파라미터 튜닝까지 이어가는 과정이었다. 25일차에는 load_digits()처럼 이미 정리된 샘플 데이터로 fit → predict → score 흐름을 봤다면, 이번에는 Kaggle 스타일의 train.csv를 가져와 결측치, 문자열 컬럼, 불필요한 컬럼, validation 분리, K-Fold, RandomizedSearchCV, GridSearchCV까지 한 번에 이어졌다. 특히 이번 날은 “모델을 돌리는 코드”보다 모델이 돌아갈 수 있는 상태를 만드는 코드가 더 중요하게 느껴졌다. 타이타닉 데이터에는 Name, Sex, Age, Ticket, Cab..

format_list_bulleted [SK플래닛] ASAC 빅데이터전문가 11기/학습기록
· 2026. 5. 26.

[SK플래닛] ASAC 빅데이터전문가 11기 | 25일차

25일차는 머신러닝 개념을 코드로 직접 연결해보는 흐름이었다. 전날에는 머신러닝이 결국 Y = f(X)에서 좋은 함수와 파라미터를 찾는 과정이라는 쪽에 가까웠다면, 이번에는 그 과정을 scikit-learn으로 어떻게 실제 코드화하는지 봤다. 데이터 준비, train/test 분리, 모델 선택, .fit(), .predict(), 평가까지 이어지는 기본 흐름을 손글씨 숫자 데이터로 실습했다. 앞부분에서는 scikit-learn의 전반적인 역할과 전처리의 중요성을 다시 짚었다. 머신러닝 모델은 결국 수학적인 함수를 최적화하는 구조라서, 문자열은 숫자로 바꿔야 하고 결측치는 그대로 둘 수 없다. 뒤쪽에서는 KNN, Decision Tree, Random Forest, Boosting처럼 전통적인 머신러닝 ..

format_list_bulleted [SK플래닛] ASAC 빅데이터전문가 11기/학습기록
· 2026. 5. 22.

navigate_before
1
navigate_next

[SK플래닛] ASAC 빅데이터전문가 11기 | 26일차

[SK플래닛] ASAC 빅데이터전문가 11기 | 25일차

티스토리툴바