일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 조합
- 클래스
- BFS
- 완전 탐색
- 백트래킹
- DP
- BeautifulSoup
- 문자열
- 스택
- 그리디
- lis
- 링크드리스트
- 중복 순열
- Knapsack
- dfs
- MST
- 이분 탐색
- 빠른 입출력
- 메모리풀
- 순열
- 재귀
- 분할 정복
- 피보나치 수
- 큐
- 세그먼트 트리
- 크루스칼
- 비트마스크
- 우선순위 큐
- SSAFY
- 시뮬레이션
- Today
- Total
목록BeautifulSoup (2)
작심 24/7
네이버 웹툰에 이어 이번에는 다음 웹툰 정보를 가져와보자. 내가 수집하고 싶은 정보 : 제목, 작가, 요일, 장르, 줄거리 Daum 웹툰 상상이 시작되는 곳 Daum 웹툰 webtoon.daum.net 네이버는 모든 웹툰 리스트를 한번에 볼 수 있게 되어있어서 수월했는데 다음은 요일별로 분리해놔서 조금 더 번거롭게 되어있다. 그래서 요일마다 클릭하면서 제목, 작가명과 요일을 수집하고 작품 링크로 들어가서 장르와 줄거리를 수집할 것이다. 필요한 모듈들 from bs4 import BeautifulSoup from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui impo..
졸작 하는데 네이버와 다음 웹툰 데이터가 필요해서 크롤링을 해보았다. 파이썬도 처음 써보고 크롤링도 처음 해보지만 이것저것 열심히 찾아보면서 나름대로 열심히 짠 코드라 잊어버리지 않기 위해 포스팅하게 되었다. 내가 수집하고 싶은 정보 : 제목, 작가, 요일, 장르, 줄거리 네이버 웹툰 매일매일 새로운 재미, 네이버 웹툰. comic.naver.com 일단 네이버 웹툰을 들어가 보면 이렇게 월요일부터 일요일까지 한번에 모든 작품들이 보인다. 개발자 도구를 보면 이런 식으로 요일마다 a 태그 안에 class명이 'title'인 코드에만 제목이 들어있다는 것을 알 수 있다. 그럼 먼저 BeautifulSoup을 이용해서 제목들만 저장해놓고 Selenium으로 각 작품별 링크를 클릭해서 작가명, 요일, 장르, ..