본문 바로가기
Python/seaborn & matplotlib

전처리 후 시각화(Series 타입을 Seaborn으로 그래프화)

by Mr.DonyStark 2024. 2. 16.

□ 라이브러리 호출

#라이브러리 호출
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib import font_manager, rc

 

□ 데이터 불러오기

upjong_data = pd.read_excel('C:/Users/Lenovo/Downloads/result1.xlsx')

 

□ 특정필드(열) 데이터 대문자 변환

  ○ .str. : 판다스(Pandas)에서 문자열 데이터에 대한 벡터화된 문자열 연산을 수행하기 위한 속성

  ○ .upper : 대문자 변환

upjong_data['업종코드(SE_UPJONG)'] = upjong_data['업종코드(SE_UPJONG)'].str.upper()

 

□ 날짜 필드 표시형식 변환 및 변환된 형식기반으로 year, month 신규필드 생성

#날짜 표시형식 변경
upjong_data['이용년월(TS_YM)'] = pd.to_datetime(upjong_data['이용년월(TS_YM)'], format='%Y%m')
#변경된 필드를 기준으로 신규 필드 생성
upjong_data = upjong_data.assign(
    year = upjong_data['이용년월(TS_YM)'].dt.year,
    month = upjong_data['이용년월(TS_YM)'].dt.month
)

 

□ 특정열기준으로 그룹바이 및 요소 개수세기

upjong_grp = upjong_data.groupby(['업종분류코드명(UPJONG_NM)']).size()
upjong_grp = upjong_grp.sort_values(ascending=False)

 

□ 시각화 : Seaborn (시본 제공 색상 파레트 지정 및 가로막대 그래프 작성)

mypalette = sns.color_palette('Set3') #seaborn에서 제공하는 색상표로 파레트 지정
sns.barplot(x=upjong_grp, y=upjong_grp.index, hue=upjong_grp.index, palette=mypalette)

□ 특정 조건에 해당하는 데이터 출력 : 2017년이며 6월달인 것

upjong_data[(upjong_data['이용년월(TS_YM)'].dt.year ==2017)&(upjong_data['month']==6)]