연향동큰손

  • 홈
  • 태그
  • 방명록

2025/09/19 1

Jsoup을 활용한 웹 크롤링

크롤링이란크롤링(crawling)이란 웹 페이지의 소스를 그대로 가져와서 그 안에서 원하는 데이터를 추출해 내는 행위이고, 이러한 과정을 수행하는 소프트웨어를 크롤러(Crawler)라고 한다. 인터넷 상의 방대한 양의 데이터를 빠르고 효율적으로 수집할 수 있기 때문에 크롤링은 매우 유용하게 활용된다. 크롤링을 통해 정적 데이터를 수집할 경우 데이터를 한번만 수집해와도 되지만 동적 데이터(ex 뉴스,주식 시세, 날씨...)를 수집해야하는 경우에는 주기적으로 크롤러를 실행하여 데이터베이스를 업데이트 해줘야 한다. 관련 라이브러리Python에서는 Beautiful Soup, Selenium등의 라이브러리가 사용되고, Java에서는 Jsoup을 통해 크롤링을 구현할 수 있다. Jsoup을 활용한 웹 크롤..

BackEnd/spring 2025.09.19
이전
1
다음
더보기
프로필사진

연향동큰손

https://github.com/yangwoohyeon

  • 분류 전체보기 (241)
    • BackEnd (101)
      • spring (23)
      • 스프링 MVC (25)
      • Thymeleaf (17)
      • HTTP (12)
      • Database (14)
      • Kafka (6)
      • Redis (4)
    • 알고리즘 (0)
      • 백준 (53)
      • 해시 (4)
      • 스택 큐 (8)
      • DP (5)
      • 힙 (2)
      • 정렬 (3)
      • 완전탐색 (6)
      • DFS,BFS (6)
      • 탐욕법(Greedy) (5)
      • 배열 (1)
    • Deployment (13)
      • Docker (5)
      • AWS (5)
      • github Actions (1)
      • Cloudflare (2)
    • 자바 (7)
    • 컴퓨터 (3)
    • git (5)
    • 프로젝트 (1)
    • 에러 일기 (2)
    • 9oormthonUNIV 스터디 프로젝트 (4)
    • DevOps (11)
      • Kubernetes (7)

Tag

프로그래머스, 백준, BFS, 타임리프, spring, 스프링, AWS, dfs, 배포, Docker, 브루트포스, 검증, 그리디 알고리즘, 정렬, 자바, kubernetes, 그래프, EC2, @Transactional, Kafka,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

Archives

Calendar

«   2025/09   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

  • 깃허브

티스토리툴바