API 데이터 수집할 때 샘플 단위로 처리해야 하는 이유 | 열 단위 수집이 위험한 이유
API 응답을 DataFrame으로 만들 때 가장 중요한 건 데이터를 얼마나 많이 가져오느냐보다, 각 값이 같은 행에 정확히 묶여 들어가느냐다.그래서 실전 수집에서는 컬럼별로 한 번에 긁는 방식보다, 샘플 1개를 하나의 묶음으로 보고 필요한 필드를 추출한 뒤 append하는 방식이 훨씬 안전하다. 자료에서도 JSON과 XML 모두에서 “가로줄 샘플 베이스로 처리하는 것이 답”이라고 설명하고, 감독 정보처럼 없는 값이 있으면 열 단위 수집은 바로 밀릴 수 있다고 정리한다.이 글의 핵심이 글은 “API 응답에서 값을 어떻게 꺼내는가”보다 어떻게 쌓아야 데이터가 틀어지지 않는가에 초점이 있다.즉, 비교 기준은 이거다.열 단위 수집: movieCd만 쭉, movieNm만 쭉, peopleNm만 쭉샘플 단위 수집..