반복문을 활용한 페이지별 크롤링

□ url 링크 패턴을 파악 후 If문과 for문을 활용하여 페이지별 해당하는 조건의 데이터를 추출

#관련 라이브러리 호출
import requests
from bs4 import BeautifulSoup

for page_num in range(10):
    if page_num == 0:   #조건문을 활용하여 0이면 홈화면 출력
        target_page = requests.get('https://davelee-fun.github.io/')
        print('홈화면 입니다')
    else: #0이 아니라면 그다음 페이지는 아래 링크로 이동하며 h4이며 클래스명이 card-text인 데이터를 추출
        target_page = requests.get(f'https://davelee-fun.github.io/page{str(page_num+1)}') #받은 페이지넘을 str로 형변환하여 링크값으로 적용
        #target_page = requests.get(f'https://davelee-fun.github.io/page')+str(page_num+1)
        tool_parser = BeautifulSoup(target_page.content, 'html.parser')
        h4_data = tool_parser.select('h4.card-text')
        a=0
        for v in h4_data:
            a+=1
            print(f'{page_num}페이지\t{a}번째 제품\t:\t{v.get_text().strip()}')

저작자표시

'Python > Python_Crawling' 카테고리의 다른 글

openpyxl을 활용한 데이터 크롤링 및 엑셀저장 (0)	2023.12.27
openpyxl : 엑셀파일 저장 (0)	2023.12.27
크롤링 예제 4 (1)	2023.12.20
css selector (0)	2023.12.20
크롤링 예제 3 (0)	2023.12.19

Dandora.Blog.Ninety

반복문을 활용한 페이지별 크롤링

'Python > Python_Crawling' 카테고리의 다른 글

티스토리툴바

반복문을 활용한 페이지별 크롤링

'Python > Python_Crawling' 카테고리의 다른 글

관련글

티스토리툴바