# 라이브러리 호출
from bs4 import BeautifulSoup
html = '''
<a class='logo_naver'>
<span class = 'blind'>
네이버
</spn>
</a>
'''
#html.parser를 활용해 html 파싱
soup = BeautifulSoup(html, 'html.parser')
#클레스네임이 logo_naver인것 활용
logo = soup.select_one(".logo_naver")
print(f'text\t:\t{logo.text}\n.logo_naver 네임을 가진 태그의 모든 하위요소의 텍스트 추출. 좀 두루뭉실하게 사용하려면 사용')
print('\n\n')
print(f'string\t:\t{logo.string}\n정확하게 한개의 태그안에 텍스트가 있어야 인식하고 추출가능함. 빈칸, 빈줄이 있다면 무엇을 추출해야하는지 몰라함. 정확한 값을 위해서라면 사용')
'Python > Python_Crawling' 카테고리의 다른 글
SSG 이벤트 크롤링 : select, find_all(string=True) (1) | 2024.02.09 |
---|---|
다음 뉴스(제목, 링크, 회사, 카테고리) 크롤링 (1) | 2024.02.05 |
크롤링 : 멜론 (0) | 2024.02.02 |
네이버 뷰 크롤링 : 제목, 작성자, 링크 + 예외처리 (1) | 2024.01.30 |
특정 영역의 하위태그별 데이터 크롤링 (0) | 2024.01.28 |