본문 바로가기

분류 전체보기349

(북한산 카페) 커피/디저트 맛집 카페 ○ 북한산카페 (1) 맛 : ☆☆☆☆☆(강추 및 생각날것 같음) (2) 친절도 및 서비스(사장 및 종업원 포함) : ☆☆☆☆☆[가족같아. 너가 웃으니 나도 웃음이나요.] ※ 북한산 주변 카페란 카페는 80%이상 가봤지만 이곳처럼 디저트도 커피도 그리고 카페분위기도 좋은곳은 처음이었음 ※ 처음 방문했을때 비가와서 빙수가 먹고싶었지만 다음을 기약하고, 이번에 다시와서 빙수를 먹게됨 ※ 가격대비 풍부한 양과 맛 정말 100점 만점 100000점이었음 ※ 북한산 등반 또는 북한산 둘레길 산책 후 들리면 최고일것 같음 ※ 아래 사진처럼 북한산이 보이고 카페에는 백운대를 관찰할 수 있는 망원경이있는데 날씨좋을때 보면 정상까지 모두 보여 뷰에 감탄하고 더 나아가 인테리어에도 감탄하게됨 ※ 참!! 빙수에는 다양한 재료.. 2024. 2. 3.
.text 와 .string 차이점(보완) # 라이브러리 호출 from bs4 import BeautifulSoup html = ''' 네이버 ''' #html.parser를 활용해 html 파싱 soup = BeautifulSoup(html, 'html.parser') #클레스네임이 logo_naver인것 활용 logo = soup.select_one(".logo_naver") print(f'text\t:\t{logo.text}\n.logo_naver 네임을 가진 태그의 모든 하위요소의 텍스트 추출. 좀 두루뭉실하게 사용하려면 사용') print('\n\n') print(f'string\t:\t{logo.string}\n정확하게 한개의 태그안에 텍스트가 있어야 인식하고 추출가능함. 빈칸, 빈줄이 있다면 무엇을 추출해야하는지 몰라함. 정확한 값을.. 2024. 2. 2.
판다스 : 타이타닉 데이터 결측값 처리 □ 목적 : 타이타닉 데이터에서 결측값을 처리해보자 import pandas as pd #타이타닉 누락 titanic_file = pd.read_excel('C:/python/DataScience/Data/data/python_data/titanic.xls') □ 예제 ○ 불러온 데이터 프레임 정보확인 : .info() #문제1 정보확인 titanic_file.info() ○ 필드별 결측값 개수 확인 - .count() : 필드별 데이터개수 집계(결측값을 포함시키진 않음) - shape[0] : 행/열 정보를 나타내는 함수에서 [0] 인덱스를 활용해서 값 추출 #문제2 필드별 결측값 개수 구하기 a = titanic_file.count() #결측값을 제외한 집계 b = titanic_file.shape[.. 2024. 2. 2.
판다스 : 결측값 예제 □ 문제 1 ○ 라이브러리 및 데이터 불러오기 import pandas as pd import numpy as np #라이브러리 호출 ebola = pd.read_csv('C:/python/DataScience/Data/data/python_data/country_timeseries.csv') ebola.shape ○ 필드별 행수 집계(결측값 제외) : 데이터프레임명.count() # 필드별 행수 집계(결측값 제외) ebola.count() ○ NaN 결측값을 제외한 컬럼별 행 개수 - 데이터프레임명.shpa[0] 총 행수에서 결측값을 제외한 ebola.count() 를 빼면 잔여값이 결측값 개수임 # 필드별 행수 집계(결측값 제외) ebola.count() having_NaN = ebola.shape[.. 2024. 2. 2.
판다스 : 결측값 □ 결측값 ○ 누락값을 의미 ○ 0 또는 '' 과는 다른의미임 ○ 데이터 자체가 없다는 의미임 ○ 그렇다고 같다라는 의미도 아님 ○결측값과 True, False, 0, ' ' 비교결과 → 모두 False 출력 print(NaN == True) print(NaN == 0) print(NaN == False) print(NaN == NaN) #값 자체가 없어, 자신과 비교해도 거짓 ○결측값을 확인하는 매서드 isnull, notnull → True, True, False 출력 print(pd.isnull(NaN)) print(pd.isnull(nan)) print(pd.notnull(NaN)) 2024. 2. 2.
판다스 : 중복개수 확인, 조건 False일 때 에러발생 코드 □ 문법 ○ 변수명['필드명'].value_counts() visited['site'].value_counts() ○ assert : False일시 assertionError assert ps_vs.shape[0] == 19 #참이라 오류반환 X / 행수와 같아서 True assert ps_vs.shape[0] == 10 #오류반환 / 행수와 달라서 False 2024. 2. 2.
판다스 : Merge □ 기본설명 및 함수기능 □ 예제 1 ○ 라이브러리 호출 및 파일 불러오기를 통한 데이터 프레임 생성 #라이브러리호출 import pandas as pd #csv불러오기 및 데이터프레임 생성 person = pd.read_csv('C:/python/DataScience/Data/data/python_data/survey_person.csv') site = pd.read_csv('C:/python/DataScience/Data/data/python_data/survey_site.csv') survey = pd.read_csv('C:/python/DataScience/Data/data/python_data/survey_survey.csv') visited = pd.read_csv('C:/python/Data.. 2024. 2. 2.
크롤링 : 멜론 □ 목적 ○ 차트 1~100위 곡명, 아티스트, 엘범명 데이터 크롤링 ○ 아티스트 세부정보 접속 링크 추출 ○ 엘범명 세부정보 접속 링크 추출 □ 코딩과정 ○ 라이브러리 호출 ○ 함수정의 : 아티스트, 엘범 세부정보 접속시 자바스크립트 코드 안에 있는 번호 추출을 위해 함수지정 ○ * .text 는 해당 태그 또는 하위 태그안의 텍스트를 출력하지만, .string은 특정 태그값이 지정되었을 때 정확한텍스트를 추출함 □ 코드 # 라이브러리 호출 import requests import re from bs4 import BeautifulSoup # 크롤링 페이지 입력 # 네이버뷰 주소 + 검색키워드 target_url = 'https://www.melon.com/chart/index.htm' print(f'.. 2024. 2. 2.
판다스 : 예제(concat, 정규표현) □ 예제 ○ 데이터 프레임 병합 ○ 필드 두개 생성 및 기존필드 값을 가공하여 신규 필드에 저장 - 정규표현 활용 - split 및 리스트 인데스 활용 □ 코드 import re #정규표현를 위한 라이브러리 호출 import pandas #판다스 라이브러리 호출 #데이터프레임 호출 및 병합 paper_2011 = pd.read_csv('C:/Users/romangrism/Desktop/Datasicence/Data/data/python_data/paper_information_2011.csv') paper_2012 = pd.read_csv('C:/Users/romangrism/Desktop/Datasicence/Data/data/python_data/paper_information_2012.csv') p.. 2024. 2. 2.