yeongdev
close
프로필 사진

yeongdev

github: @ Westzer00

  • 분류 전체보기 (83) N
    • [SK플래닛] ASAC 빅데이터전문가 11기 (30) N
      • 학습기록 (30) N
    • AI & Machine Learning (6) N
      • ML 수학 (6) N
      • Machine Learning (0)
      • Deep Learning (0)
    • Data Analytics (36)
      • Python·Pandas (6)
      • 수집·크롤링 (10)
      • SQL (19)
      • 시각화 (1)
    • Coding Test (11)
      • 문제풀이 (6)
      • Python & Algorithm (5)
    • DevOps & Tools (0)
  • 홈
  • 태그
  • 방명록

Pandas apply와 lambda 정리 | 줄 단위 계산을 간단하게 처리하는 방법

Pandas에서 DataFrame을 가공할 때, 각 행이나 각 열에 같은 규칙을 반복 적용해야 하는 경우가 많다.이럴 때 가장 자주 쓰는 방법이 apply()이고, 여기에 lambda를 붙이면 반복문 없이도 행·열 단위 계산을 짧고 읽기 쉽게 처리할 수 있다. 자료에서도 apply는 줄 단위 규칙을 적용하는 방식으로 설명되고, 날짜별 최고값과 변동성 계산 예시가 이어진다.apply는 무엇인가apply()는 DataFrame의 각 행(row) 또는 각 열(column) 에 같은 함수를 적용하는 메서드다.즉, 이런 상황에 잘 맞는다.각 행마다 최대값 구하기각 행마다 최대값과 최소값 차이 구하기여러 컬럼 값을 바탕으로 새 컬럼 만들기각 열마다 평균, 합계, 최댓값 계산하기핵심은 **“같은 규칙이 반복될 때”*..

  • format_list_bulleted Data Analytics/Python·Pandas
  • · 2026. 4. 29.

Pandas loc, iloc, at, iat 정리 | DataFrame 값 접근 기준 한 번에 정리

Pandas에서 DataFrame 값을 가져올 때 헷갈리는 이유는 기준이 두 개라서다.정리하면 간단하다. loc, at는 이름(label) 기준, iloc, iat는 정수 위치 기준이고, loc, iloc는 여러 값, at, iat는 단일 값 접근용이다.한 번에 정리메서드 기준 접근 범위 특징at이름(label)단일 값가장 빠름iat정수 위치단일 값가장 빠름loc이름(label)여러 값슬라이싱 가능iloc정수 위치여러 값배열처럼 접근먼저 코드로 보면import pandas as pddf = pd.DataFrame({ "시가": [100, 200, 300], "종가": [110, 210, 310]}, index=["2026-04-01", "2026-04-02", "2026-04-03"])1. i..

  • format_list_bulleted Data Analytics/Python·Pandas
  • · 2026. 4. 29.

EDA란 무엇인가 | 데이터 분석에서 왜 먼저 해야 하는가

데이터 분석에서 모델보다 먼저 해야 하는 일이 있다.바로 EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 다.많은 입문자가 데이터 분석을 시작하면 바로 머신러닝 모델부터 떠올리는데, 실제로는 그 전에 데이터가 어떻게 생겼는지, 무슨 패턴이 있는지, 무엇을 더 확인해야 하는지를 먼저 보는 과정이 필요하다.EDA는 바로 그 역할을 한다.즉, EDA는 모델링 이전의 부가 작업이 아니라, 분석 방향을 결정하는 첫 단계에 가깝다. EDA는 현상 파악 단계이고, 이후 머신러닝에서는 feature 설계와 연결되며, 딥러닝은 상대적으로 모델 구조와 튜닝 비중이 더 크다는 점도 함께 구분할 필요가 있다.EDA를 한 줄로 정리하면EDA는 데이터를 바로 모델에 넣기 전에, 데이터의 분포·결측치·..

  • format_list_bulleted Data Analytics/Python·Pandas
  • · 2026. 4. 29.

Pandas DataFrame이란 | Series와 무엇이 다른가

Pandas에서 실제로 많이 다루는 기본 단위는 Series보다 DataFrame이다.이유는 간단하다. Series는 한 줄짜리 1차원 데이터이고, DataFrame은 행과 열이 있는 2차원 표 구조라서 컬럼 추가, 값 가공, 정렬, 전처리 같은 작업이 훨씬 자연스럽기 때문이다. 자료에서도 Series는 1차원, DataFrame은 2차원으로 설명되고, DataFrame은 index와 columns를 함께 가지는 구조로 다뤄진다.DataFrame은 무엇인가DataFrame은 Pandas의 대표적인 2차원 자료형이다.엑셀 표처럼 생각하면 이해가 쉽다.가로축: index세로축: columns내부 값: 실제 데이터즉, DataFrame은 단순히 값 몇 개를 담는 자료형이 아니라, 속성별 컬럼을 기준으로 데이터..

  • format_list_bulleted Data Analytics/Python·Pandas
  • · 2026. 4. 24.

Pandas Series란 | 리스트·NumPy와 차이와 인덱스 활용 정리

1차원 데이터를 다룰 때 파이썬 리스트나 NumPy array만으로도 작업은 가능하다.그런데 데이터 분석에서는 금방 이런 요구가 생긴다.“세 번째 값”이 아니라 “2026-04-03 값”을 보고 싶다.특정 종목명, 날짜, 카테고리처럼 의미 있는 이름으로 데이터에 접근하고 싶다.값이 없는 항목은 따로 골라보고 싶다.이 지점에서 Pandas Series가 필요해진다.Series는 단순한 1차원 값 모음이 아니라, 값과 인덱스를 함께 다루는 자료형이다.즉, 리스트처럼 순서만 보는 게 아니라 사용자가 직접 붙인 인덱스를 기준으로 데이터에 접근할 수 있다.Series를 왜 쓰는가리스트는 값을 담는 데는 충분하다.prices = [213500, 22000, 200000, 195000, 214500]print(pri..

  • format_list_bulleted Data Analytics/Python·Pandas
  • · 2026. 4. 24.

NumPy array란 | 파이썬 리스트와 차이, 벡터 연산까지 정리

데이터 분석을 하다 보면 파이썬 리스트보다 먼저 보게 되는 자료형이 있다. 바로 **NumPy의 array**다.처음 보면 리스트랑 비슷하게 생겼는데, 실제로는 목적이 다르다.파이썬 리스트가 범용적으로 여러 값을 담는 자료형이라면, NumPy array는 수치 연산을 빠르고 일관되게 처리하기 위한 자료형에 더 가깝다.특히 데이터 분석이나 행렬 계산, 벡터 연산이 필요한 순간부터는리스트보다 NumPy array가 훨씬 자연스럽다.이 글에서는 아래 3가지만 정리한다.NumPy array가 왜 필요한가파이썬 리스트와 정확히 뭐가 다른가실제 코드에서는 어떤 차이가 나는가NumPy array가 필요한 이유파이썬 리스트도 여러 값을 담을 수 있다.a = [100, 200, 300, 400, 500]print(a)여..

  • format_list_bulleted Data Analytics/Python·Pandas
  • · 2026. 4. 24.
  • navigate_before
  • 1
  • navigate_next
공지사항
전체 카테고리
  • 분류 전체보기 (83) N
    • [SK플래닛] ASAC 빅데이터전문가 11기 (30) N
      • 학습기록 (30) N
    • AI & Machine Learning (6) N
      • ML 수학 (6) N
      • Machine Learning (0)
      • Deep Learning (0)
    • Data Analytics (36)
      • Python·Pandas (6)
      • 수집·크롤링 (10)
      • SQL (19)
      • 시각화 (1)
    • Coding Test (11)
      • 문제풀이 (6)
      • Python & Algorithm (5)
    • DevOps & Tools (0)
인기 글
전체 방문자
오늘
어제
Copyright © seooeyeong 모든 권리 보유.
SKIN: Copyright © 쭈미로운 생활 All rights reserved. Designed by JJuum.
and Current skin "dev-roo" is modified by Jin.

티스토리툴바