yeongdev
close
프로필 사진

yeongdev

github: @ Westzer00

  • 분류 전체보기 (83) N
    • [SK플래닛] ASAC 빅데이터전문가 11기 (30) N
      • 학습기록 (30) N
    • AI & Machine Learning (6) N
      • ML 수학 (6) N
      • Machine Learning (0)
      • Deep Learning (0)
    • Data Analytics (36)
      • Python·Pandas (6)
      • 수집·크롤링 (10)
      • SQL (19)
      • 시각화 (1)
    • Coding Test (11)
      • 문제풀이 (6)
      • Python & Algorithm (5)
    • DevOps & Tools (0)
  • 홈
  • 태그
  • 방명록

BeautifulSoup HTML 파싱 정리 | 일반 웹사이트에서 태그와 속성으로 데이터 추출하는 방법

일반 웹사이트 데이터를 수집할 때 핵심은 HTML 문자열을 받는 데 있지 않다.실제로 중요한 건 개발자도구로 요청 규칙을 먼저 찾고, BeautifulSoup로 태그와 속성을 함께 읽어 원하는 데이터만 정확하게 타겟팅하는 것이다. API처럼 JSON 키값으로 바로 접근할 수 없기 때문에, HTML 파싱은 “어디에 정보가 숨어 있는지 찾는 과정” 자체가 중요하다. 자료에서도 DART 최근공시 페이지를 기준으로 개발자도구 Network에서 요청 URL 규칙을 찾고, HTML을 BeautifulSoup(..., "html.parser")로 파싱한 뒤 find_all()과 속성 접근으로 원하는 값을 뽑는 흐름이 정리되어 있다.이 글의 포인트이 글은 API 호출 글이 아니다.핵심은 명시적으로 JSON/XML을 주..

  • format_list_bulleted Data Analytics/수집·크롤링
  • · 2026. 5. 8.
  • navigate_before
  • 1
  • navigate_next
공지사항
전체 카테고리
  • 분류 전체보기 (83) N
    • [SK플래닛] ASAC 빅데이터전문가 11기 (30) N
      • 학습기록 (30) N
    • AI & Machine Learning (6) N
      • ML 수학 (6) N
      • Machine Learning (0)
      • Deep Learning (0)
    • Data Analytics (36)
      • Python·Pandas (6)
      • 수집·크롤링 (10)
      • SQL (19)
      • 시각화 (1)
    • Coding Test (11)
      • 문제풀이 (6)
      • Python & Algorithm (5)
    • DevOps & Tools (0)
인기 글
전체 방문자
오늘
어제
Copyright © seooeyeong 모든 권리 보유.
SKIN: Copyright © 쭈미로운 생활 All rights reserved. Designed by JJuum.
and Current skin "dev-roo" is modified by Jin.

티스토리툴바