본문 바로가기

Python231

Numpy 정해진 방식으로 N차원 배열생성 □ .zeros : 모든 원소 0으로 지정 □ .ones : 모든 원소 1로 지정 □ .full([행,열], 지정값) : 모든 원소 특정값으로 지정 □ .eye(행,열, k=시작위치 인덱스번호) : k번째로부터 대각선으로 1인 행렬 □ .zros_like(변수명) : 지정된 배열 원소값을 모두 0으로 변경 □ .ones_like(변수명) : 지정된 배열 원소값을 모두 1로 변경 □ .full_like(변수명, 특정값) : 지정된 배열 원소값을 모두 특정값으로 변경 #모든 배열 값을 0으로 설정 arr = np.zeros([2,2]) print(f".zero : {arr}") print('\n') #모든 배열 값을 1로 설정 arr = np.ones([4,4]) print(f".ones : {arr}") .. 2024. 3. 8.
Numpy 타입지정 □ 타입지정 : dtype = 타입 #데이터 타입지정 dtype arr1 = np.array([1,2,3,4,5], dtype=float) print(f"배열 및 타입확인 : {arr1}, {arr1.dtype}") arr2 = np.array([1.1,2.2,3.3,4.4,5.5], dtype=int) print(f"배열 및 타입확인 : {arr2}, {arr2.dtype}") arr3 = np.array([0,1,0,1,1,1,0], dtype=bool) print(f"배열 및 타입확인 : {arr3}, {arr3.dtype}") □ 타입지정 : dtype = 타입 #데이터 타입변경 astype arr1_1 = arr1.astype(np.float32) print(f"arr1 타입 :{arr1.dty.. 2024. 3. 8.
Numpy 차원 * 배열 원소개수 확인 : 배열명.size * 배열 행과열 확인 : 배열명.shape * 배열 차원 확인 : 배열명.ndim * axis=0 행방향 * axis=1 열방향 □ 1차원 배열(axis = 0) : Vector = array # 배열 one_array_1 = np.array([1,2,3,4,5]) print(f"배열확인 : {one_array_1}") print(f"배열타입 : {type(one_array_1)}") print(f"배열행과열 : {one_array_1.shape}") print(f"배열차원 : {one_array_1.ndim}") #차원확인 print(f"배열원소개수 : {one_array_1.size}") #원소개수 확인 print('\n') one_array_2 = np.a.. 2024. 3. 6.
Numpy Intro □ “Numerical Python” 의 약자로 대규모 다차원 배열과 □ 행렬 연산에 필요한 다양한 함수 제공 □ NumPy는 Pandas, Scikit-learn, Tensorflow등 데이터 사이언스 분야에서 사용되는 라이브러리들의 토대가 되는 라이브러리 □ 기본적으로 array 라는 단위로 데이터 관리하며, 행렬이라는 개념으로 생각하면 됨 ○ 배열(array) : 컴퓨터에서 일반적으로 사용하는 개념으로 수를 포함한 어떤 데이터의 묶음을 의미. ○ 벡터(vector) : 1차원으로 묶은 수를 수학에서 벡터(vector)라 부르며 행만 구성된 것을 행백터, 열만으로 구성된 것을 열벡터라 부름 ○ 행렬(matrix) : 2차원으로 묶은 수를 수학에서 행렬(matrix)이라 부르고, 우리가 알고있는 수많은.. 2024. 3. 6.
Selenium : 특정메뉴 클릭 및 입력방법 ○ 방법1 : Xpath 입력 - XPATH : //*[text()='메뉴명'] ma_driver.find_element(By.XPATH, '//*[@title="카페"]').click() ○ 방법2 : LinkText 입력 ma_driver.find_element(By.LINK_TEXT, '카페').click() ○ 방법3 :PARTIAL_LINK_TEXT 입력 : 상황 → 카페 클릭을 원할 시 ma_driver.find_element(By.LINK_TEXT, '카').click() #또는 ma_driver.find_element(By.LINK_TEXT, '페').click() ○ 방법4 :get_attribute("outerHTML"), .text 활용 : 상황 → 네이버 치지직 추천 클릭시 navs.. 2024. 2. 25.
Plotly2 ( + Bonus) □ 단순 시각화를 위해서는 plotly 만 사용 ○ chart_studio.plotly : Plotly 그래프를 생성하고 온라인으로 공유하는 데 사용되는 Plotly의 라이브러리임. ○ plotly.offline: Plotly : 그래프를 오프라인(로컬에서 실행) 모드로 사용하는 데 필요한 라이브러리임. plotly.offline를 사용하면 오프라인에서도 Plotly 그래프를 생성하고 시각화할 수 있음 ○ cufflinks: Pandas 데이터프레임을 사용하여 간단하게 Plotly 그래프를 생성하는 데 사용되는 라이브러리임. cufflinks를 사용하면 Pandas 데이터프레임에 대해 쉽게 시각화할 수 있음 #라이브러리 호출 import chart_studio.plotly as py import plot.. 2024. 2. 19.
Selenium : 기본 옵션세팅 □ 라이브러리 from selenium.webdriver.chrome.options import Options □ 옵션지정시 ma_option = Options() □ 옵션지정 시 ma_option.add_experimental_option("excludeSwitches", ["enable-automation"]) #드라이버 시작시 불필요문구 미표시되도록 설정 ma_option.add_experimental_option("excludeSwitches", ["enable-logging"]) #터미널상의 불필요문구 미표시되도록 설정 ma_option.add_argument("--headless") #드라이버창 안열리게 설정 ma_option.add_argument(f"user-agent={ma_agent}".. 2024. 2. 18.
query, where 함수를 활용한 전처리 및 시각화 예제 □ 라이브러리 호출 및 데이터 불러오기 #라이브러리 호출 import pandas as pd import numpy as np import seaborn as sns #데이터 불러오기 raw_welfare = pd.read_spss("C:/Users/Lenovo/Downloads/Koweps_hpwc14_2019_beta2.sav") #데이터 변수에 카피 welfare = raw_welfare.copy() □ 복수개의 컬럼명변경 welfare = welfare.rename(columns = { 'h14_g3' : 'sex', 'h14_g4' : 'birth', 'h14_g10' : 'marriage_type', 'h14_g11':'religion', 'p1402_8aq1':'income', 'h14_ec.. 2024. 2. 16.
전처리 후 시각화(Series 타입을 Seaborn으로 그래프화) □ 라이브러리 호출 #라이브러리 호출 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from matplotlib import font_manager, rc □ 데이터 불러오기 upjong_data = pd.read_excel('C:/Users/Lenovo/Downloads/result1.xlsx') □ 특정필드(열) 데이터 대문자 변환 ○ .str. : 판다스(Pandas)에서 문자열 데이터에 대한 벡터화된 문자열 연산을 수행하기 위한 속성 ○ .upper : 대문자 변환 upjong_data['업종코드(SE_UPJONG)'] = upjong_data['업종코드(SE_UPJONG)']... 2024. 2. 16.