□ 라이브러리 호출
#라이브러리 호출
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib import font_manager, rc
□ 데이터 불러오기
upjong_data = pd.read_excel('C:/Users/Lenovo/Downloads/result1.xlsx')
□ 특정필드(열) 데이터 대문자 변환
○ .str. : 판다스(Pandas)에서 문자열 데이터에 대한 벡터화된 문자열 연산을 수행하기 위한 속성
○ .upper : 대문자 변환
upjong_data['업종코드(SE_UPJONG)'] = upjong_data['업종코드(SE_UPJONG)'].str.upper()
□ 날짜 필드 표시형식 변환 및 변환된 형식기반으로 year, month 신규필드 생성
#날짜 표시형식 변경
upjong_data['이용년월(TS_YM)'] = pd.to_datetime(upjong_data['이용년월(TS_YM)'], format='%Y%m')
#변경된 필드를 기준으로 신규 필드 생성
upjong_data = upjong_data.assign(
year = upjong_data['이용년월(TS_YM)'].dt.year,
month = upjong_data['이용년월(TS_YM)'].dt.month
)
□ 특정열기준으로 그룹바이 및 요소 개수세기
upjong_grp = upjong_data.groupby(['업종분류코드명(UPJONG_NM)']).size()
upjong_grp = upjong_grp.sort_values(ascending=False)
□ 시각화 : Seaborn (시본 제공 색상 파레트 지정 및 가로막대 그래프 작성)
mypalette = sns.color_palette('Set3') #seaborn에서 제공하는 색상표로 파레트 지정
sns.barplot(x=upjong_grp, y=upjong_grp.index, hue=upjong_grp.index, palette=mypalette)
□ 특정 조건에 해당하는 데이터 출력 : 2017년이며 6월달인 것
upjong_data[(upjong_data['이용년월(TS_YM)'].dt.year ==2017)&(upjong_data['month']==6)]
'Python > seaborn & matplotlib' 카테고리의 다른 글
Plotly2 ( + Bonus) (0) | 2024.02.19 |
---|---|
query, where 함수를 활용한 전처리 및 시각화 예제 (0) | 2024.02.16 |
판다스 parse_dates, assign 함수를 활용한 시각화 (0) | 2024.02.16 |
Plotly ( + Bonus) (0) | 2024.02.15 |
pie, barplot 차트 (+glob함수로 다중 데이터 불러오기) (0) | 2024.02.07 |