본문 바로가기

분류 전체보기349

Selenium : 특정메뉴 클릭 및 입력방법 ○ 방법1 : Xpath 입력 - XPATH : //*[text()='메뉴명'] ma_driver.find_element(By.XPATH, '//*[@title="카페"]').click() ○ 방법2 : LinkText 입력 ma_driver.find_element(By.LINK_TEXT, '카페').click() ○ 방법3 :PARTIAL_LINK_TEXT 입력 : 상황 → 카페 클릭을 원할 시 ma_driver.find_element(By.LINK_TEXT, '카').click() #또는 ma_driver.find_element(By.LINK_TEXT, '페').click() ○ 방법4 :get_attribute("outerHTML"), .text 활용 : 상황 → 네이버 치지직 추천 클릭시 navs.. 2024. 2. 25.
Plotly2 ( + Bonus) □ 단순 시각화를 위해서는 plotly 만 사용 ○ chart_studio.plotly : Plotly 그래프를 생성하고 온라인으로 공유하는 데 사용되는 Plotly의 라이브러리임. ○ plotly.offline: Plotly : 그래프를 오프라인(로컬에서 실행) 모드로 사용하는 데 필요한 라이브러리임. plotly.offline를 사용하면 오프라인에서도 Plotly 그래프를 생성하고 시각화할 수 있음 ○ cufflinks: Pandas 데이터프레임을 사용하여 간단하게 Plotly 그래프를 생성하는 데 사용되는 라이브러리임. cufflinks를 사용하면 Pandas 데이터프레임에 대해 쉽게 시각화할 수 있음 #라이브러리 호출 import chart_studio.plotly as py import plot.. 2024. 2. 19.
(충청북도 제천시) 등갈비 맛집 : 두꺼비식당 ○ 두꺼비식당 (1) 맛 : ☆☆☆☆☆(강추 및 생각날것 같음) (2) 친절도 및 서비스(사장 및 종업원 포함) : ☆☆☆☆(힘들텐데 친절하게 해줘서 고마워.) ※ 제천갈때마다 반드시, 무조건, 기필코 가는곳 ※ 가끔은 이곳 맛이 생각나서 억지로라도 제천까지 드라이브겸 식 사하 는곳 등갈비 양도 많고 살도 많아 배부르게 먹을 수 있음. 맛은 당연히 최고 2024. 2. 18.
Selenium : 기본 옵션세팅 □ 라이브러리 from selenium.webdriver.chrome.options import Options □ 옵션지정시 ma_option = Options() □ 옵션지정 시 ma_option.add_experimental_option("excludeSwitches", ["enable-automation"]) #드라이버 시작시 불필요문구 미표시되도록 설정 ma_option.add_experimental_option("excludeSwitches", ["enable-logging"]) #터미널상의 불필요문구 미표시되도록 설정 ma_option.add_argument("--headless") #드라이버창 안열리게 설정 ma_option.add_argument(f"user-agent={ma_agent}".. 2024. 2. 18.
query, where 함수를 활용한 전처리 및 시각화 예제 □ 라이브러리 호출 및 데이터 불러오기 #라이브러리 호출 import pandas as pd import numpy as np import seaborn as sns #데이터 불러오기 raw_welfare = pd.read_spss("C:/Users/Lenovo/Downloads/Koweps_hpwc14_2019_beta2.sav") #데이터 변수에 카피 welfare = raw_welfare.copy() □ 복수개의 컬럼명변경 welfare = welfare.rename(columns = { 'h14_g3' : 'sex', 'h14_g4' : 'birth', 'h14_g10' : 'marriage_type', 'h14_g11':'religion', 'p1402_8aq1':'income', 'h14_ec.. 2024. 2. 16.
전처리 후 시각화(Series 타입을 Seaborn으로 그래프화) □ 라이브러리 호출 #라이브러리 호출 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from matplotlib import font_manager, rc □ 데이터 불러오기 upjong_data = pd.read_excel('C:/Users/Lenovo/Downloads/result1.xlsx') □ 특정필드(열) 데이터 대문자 변환 ○ .str. : 판다스(Pandas)에서 문자열 데이터에 대한 벡터화된 문자열 연산을 수행하기 위한 속성 ○ .upper : 대문자 변환 upjong_data['업종코드(SE_UPJONG)'] = upjong_data['업종코드(SE_UPJONG)']... 2024. 2. 16.
판다스 parse_dates, assign 함수를 활용한 시각화 □ 라이브러리 호출 및 데이터 불러오기 ○ parse_dates - 판다스(Pandas)의 read_csv() 함수에서 사용되는 매개변수 중 하나임. - 이를 이용하여 CSV 파일을 읽을 때 날짜 데이터를 파싱(parse)하여 datetime 형식으로 처리 import pandas as pd import matplotlib.pyplot as plt banks = pd.read_csv('C:/python/DataScience/Data/data/python_data/banklist.csv', parse_dates=['Closing Date','Updated Date']) banks.head() ○ parse_dates banks = banks.assign( closing_quarter = banks['Clo.. 2024. 2. 16.
Datetime & pd.to_datetime □ Dataetime ○ 호출 라이브러리 from datetime import datetime ○ KST kst_time = datetime.now() ○ UTC utc_time = datetime.now() ○ 시간별도지정 sample = datetime(1990,1,1) ○ 시간연산 kst_time = datetime.now() # kst시간 sample = datetime(1990,1,1) # 시간지정 result = kst_time - sample print(result) ○ 시간 표시형식 #YYYY-mm-dd 추출 nowDate1 = kst_time.strftime('%Y-%m-%d') #YY-mm-dd 추출 nowDate2 = kst_time.strftime('%y-%m-%d') #YYYY-m.. 2024. 2. 16.
Plotly ( + Bonus) Plotly 를 활용하여 초보자들은 복잡한 플롯을 만드는 과정을 단순화하고 훌륭한 시각화를 시작할 수 있음 https://plotly.com/python/reference/ Single-page Figure plotly.com □ 라이브러리 import chart_studio.plotly as py import cufflinks as cf □ 생성규칙 ○ fig = go.Figure()로 기본 객체를 만들고 ○ fig.add_trace()에 그래프 객체를 추가 ○ fig.update_layout()으로 layout 업데이트 (필요시) ○ fig.update_annotation()으로 annotation (필요시) ○ fig.show()로 그래프 보기 #판다스로 데이터프레임 생성 #넘파이 .random.r.. 2024. 2. 15.