.text 와 .string 차이점(보완)

# 라이브러리 호출
from bs4 import BeautifulSoup

html = '''
<a class='logo_naver'>
    <span class = 'blind'>
        네이버
    </spn>
</a>
'''
#html.parser를 활용해 html 파싱
soup = BeautifulSoup(html, 'html.parser')
#클레스네임이 logo_naver인것 활용
logo = soup.select_one(".logo_naver")
print(f'text\t:\t{logo.text}\n.logo_naver 네임을 가진 태그의 모든 하위요소의 텍스트 추출. 좀 두루뭉실하게 사용하려면 사용')
print('\n\n')
print(f'string\t:\t{logo.string}\n정확하게 한개의 태그안에 텍스트가 있어야 인식하고 추출가능함. 빈칸, 빈줄이 있다면 무엇을 추출해야하는지 몰라함. 정확한 값을 위해서라면 사용')

.text 사용시 공란 또는 띄어쓰기가 된 상태로 추출되지만 .logo_naver 하위에 있는 모든 값들을 가져옴. 반면 .string이 None이 출력되었는데 만약 추출하고자하면 span.blind를 선택하여 사용했다면 값이 추출되었을 것임

저작자표시 (새창열림)

'Python > Python_Crawling' 카테고리의 다른 글

SSG 이벤트 크롤링 : select, find_all(string=True) (1)	2024.02.09
다음 뉴스(제목, 링크, 회사, 카테고리) 크롤링 (1)	2024.02.05
크롤링 : 멜론 (0)	2024.02.02
네이버 뷰 크롤링 : 제목, 작성자, 링크 + 예외처리 (1)	2024.01.30
특정 영역의 하위태그별 데이터 크롤링 (0)	2024.01.28

Dandora.Blog.Ninety

.text 와 .string 차이점(보완)

'Python > Python_Crawling' 카테고리의 다른 글

티스토리툴바

.text 와 .string 차이점(보완)

'Python > Python_Crawling' 카테고리의 다른 글

관련글

티스토리툴바