yeongdev
close
프로필 사진

yeongdev

github: @ Westzer00

  • 분류 전체보기 (83) N
    • [SK플래닛] ASAC 빅데이터전문가 11기 (30) N
      • 학습기록 (30) N
    • AI & Machine Learning (6) N
      • ML 수학 (6) N
      • Machine Learning (0)
      • Deep Learning (0)
    • Data Analytics (36)
      • Python·Pandas (6)
      • 수집·크롤링 (10)
      • SQL (19)
      • 시각화 (1)
    • Coding Test (11)
      • 문제풀이 (6)
      • Python & Algorithm (5)
    • DevOps & Tools (0)
  • 홈
  • 태그
  • 방명록

Seaborn boxplot과 violinplot 차이 | 데이터 분포 시각화하기

평균만 보면 데이터가 어떻게 퍼져 있는지 알 수 없다.분포를 보려면 최소한 중앙값, 사분위수, 이상치, 쏠림 정도를 같이 봐야 하고, 이때 가장 많이 쓰는 그래프가 boxplot과 violinplot이다. 둘 다 분포를 보는 그래프지만, boxplot은 요약 통계에 강하고, violinplot은 분포 모양 자체를 보여주는 데 강하다.즉 빠르게 정리하면 이렇다.boxplot: 중앙값, 사분위수, 이상치 확인용violinplot: 값이 어디에 몰려 있는지, 분포가 어떻게 생겼는지 확인용이 차이를 이해하고 나면, 어떤 그래프를 먼저 봐야 할지 훨씬 쉬워진다.평균만 보면 왜 부족할까평균이 같아도 분포는 전혀 다를 수 있다.예를 들어 어떤 데이터는 값이 고르게 퍼져 있을 수 있고, 다른 데이터는 특정 구간에 몰려..

  • format_list_bulleted Data Analytics/시각화
  • · 2026. 5. 28.

Python Selenium 사용법 | find_element, XPath, .text, get_attribute, 대기 처리 정리

Selenium은 브라우저를 직접 제어해야 할 때 쓰는 도구다.클릭이 필요하거나, 자바스크립트로 렌더링된 요소를 읽어야 하거나, 페이지 이동 후 DOM이 바뀌는 구조라면 requests보다 Selenium이 더 맞다.핵심은 네 가지다. 요소 찾기, 값 가져오기, 반복 구조 만들기, 대기 처리.1. Selenium 기본 흐름흐름은 단순하다.드라이버 실행URL 접속요소 찾기텍스트나 속성값 추출클릭 후 대기from selenium import webdriverfrom selenium.webdriver.chrome.service import Servicepath = "/Users/yourname/path/to/chromedriver"service = Service(path)driver = webdriver.Ch..

  • format_list_bulleted Data Analytics/수집·크롤링
  • · 2026. 5. 28.

SQL에서 NULL과 빈 문자열 차이 | age_certification 필터링 실수 방지

SQL에서 결측처럼 보이는 값이 있다고 해서 전부 NULL인 것은 아니다. 실제 데이터에서는 NULL 대신 빈 문자열('') 로 들어간 경우가 생각보다 자주 나온다. 그래서 필터링 전에 값을 직접 확인하지 않으면, 분명 등급 없는 데이터를 제외했다고 생각했는데 결과가 이상하게 남아 있는 상황이 생긴다.이 문제는 특히 범주형 컬럼을 다룰 때 자주 나온다. 예를 들어 콘텐츠 데이터의 age_certification처럼 연령 등급이 들어가는 컬럼은 값이 없을 때 NULL일 수도 있고, 빈 문자열일 수도 있고, 심지어 공백 문자열일 수도 있다. 그래서 분석 전에 먼저 해야 할 일은 **“결측처럼 보이는 값이 실제로 어떤 형태로 저장돼 있는지 확인하는 것”**이다.NULL과 빈 문자열은 왜 다를까SQL에서 NUL..

  • format_list_bulleted Data Analytics/SQL
  • · 2026. 5. 28.

MySQL CSV 파일 넣기 | LOAD DATA LOCAL INFILE 사용법과 오류 체크

MySQL에 CSV 파일을 넣을 때 가장 많이 막히는 포인트는 SQL 문법보다 순서다. 보통은 LOAD DATA LOCAL INFILE 문장만 외우고 바로 실행하려다가 No database selected, table doesn't exist, local_infile disabled 같은 오류를 먼저 만나게 된다. 실제로는 DB 선택 → 테이블 생성 확인 → local infile 확인 → CSV 적재 → 결과 검증 순서로 가야 훨씬 덜 꼬인다.특히 처음 CSV를 넣을 때는 “CSV만 있으면 바로 들어가겠지”라고 생각하기 쉬운데, MySQL은 먼저 어느 DB에 넣을지, 어느 테이블에 넣을지, 로컬 파일 읽기를 허용하는지가 정리돼 있어야 한다. 이 글에서는 MySQL 기준으로 CSV 파일을 불러오는 전체 ..

  • format_list_bulleted Data Analytics/SQL
  • · 2026. 5. 26.

SQL CASE WHEN + LIKE 정리 | 리뷰 데이터에서 키워드 언급 수 세기

리뷰 데이터에서 특정 키워드가 얼마나 자주 언급되는지 확인하고 싶다면, SQL에서는 LIKE와 CASE WHEN을 함께 쓰는 방식이 가장 단순하고 실용적이다. LIKE '%keyword%'로 특정 단어 포함 여부를 확인하고, CASE WHEN ... THEN 1 ELSE 0 END로 이를 숫자로 바꾼 뒤, SUM()으로 합치면 키워드 언급 수를 바로 집계할 수 있다.이 패턴은 리뷰 분석, VOC 분류, 상품 피드백 요약처럼 텍스트가 섞인 데이터에서 자주 쓰인다. 특히 NLP까지 가지 않고도 “사이즈 언급 수”, “large/small 언급 비율”, “카테고리별 불만 키워드” 정도는 SQL만으로 빠르게 볼 수 있어서 EDA 단계에서 꽤 유용하다.이 패턴이 자주 쓰이는 이유리뷰 데이터는 길게 읽어야 의미가 ..

  • format_list_bulleted Data Analytics/SQL
  • · 2026. 5. 26.

SQL 서브쿼리 주의점 | 최고값 비교할 때 조건 범위를 맞춰야 하는 이유

SQL에서 서브쿼리로 최고값을 비교할 때 가장 흔한 실수는 바깥 쿼리의 조건 범위와 안쪽 서브쿼리의 조건 범위를 다르게 잡는 것이다. 이 문제는 문법 실수라기보다 비교 기준을 잘못 만드는 문제에 가깝다. MAX(), MIN(), AVG() 같은 집계 함수를 서브쿼리와 함께 쓸 때는 “무엇의 최고값인지”, “어떤 범위의 평균인지”를 먼저 맞춰야 한다.예를 들어 “2015년 영화 중 최고 평점”을 찾고 싶다면, 바깥 쿼리만 2015년 조건을 가지면 안 된다. 서브쿼리 안에서도 같은 범위를 봐야 비교가 성립한다. 이 원리를 이해하지 못하면 결과가 비거나, 전혀 다른 데이터를 가져오는 쿼리가 된다.서브쿼리에서 조건 범위가 중요한 이유서브쿼리는 쿼리 안에서 비교 기준값을 만드는 역할을 자주 맡는다. 대표적인 패턴..

  • format_list_bulleted Data Analytics/SQL
  • · 2026. 5. 26.
  • navigate_before
  • 1
  • 2
  • 3
  • 4
  • ···
  • 6
  • navigate_next
공지사항
전체 카테고리
  • 분류 전체보기 (83) N
    • [SK플래닛] ASAC 빅데이터전문가 11기 (30) N
      • 학습기록 (30) N
    • AI & Machine Learning (6) N
      • ML 수학 (6) N
      • Machine Learning (0)
      • Deep Learning (0)
    • Data Analytics (36)
      • Python·Pandas (6)
      • 수집·크롤링 (10)
      • SQL (19)
      • 시각화 (1)
    • Coding Test (11)
      • 문제풀이 (6)
      • Python & Algorithm (5)
    • DevOps & Tools (0)
인기 글
전체 방문자
오늘
어제
Copyright © seooeyeong 모든 권리 보유.
SKIN: Copyright © 쭈미로운 생활 All rights reserved. Designed by JJuum.
and Current skin "dev-roo" is modified by Jin.

티스토리툴바