본문 바로가기
Python/seaborn & matplotlib

판다스 parse_dates, assign 함수를 활용한 시각화

by Mr.DonyStark 2024. 2. 16.

□ 라이브러리 호출 및 데이터 불러오기

  ○ parse_dates

    - 판다스(Pandas)의 read_csv() 함수에서 사용되는 매개변수 중 하나임.

    - 이를 이용하여 CSV 파일을 읽을 때 날짜 데이터를 파싱(parse)하여 datetime 형식으로 처리

import pandas as pd
import matplotlib.pyplot as plt

banks =  pd.read_csv('C:/python/DataScience/Data/data/python_data/banklist.csv', parse_dates=['Closing Date','Updated Date'])
banks.head()

 

  ○ parse_dates

banks = banks.assign(
    closing_quarter = banks['Closing Date'].dt.quarter,
    closing_year = banks['Closing Date'].dt.year
)

 

  ○ size 함수 : size() 메서드는 Pandas 라이브러리에서 제공되는 메서드 중 하나로 이 메서드는 데이터프레임 또는 시리즈의 크기, 즉 원소의 총 개수를 반환

closing_year = banks.groupby(['closing_year']).size()
closing_quarter = banks.groupby(['closing_quarter']).size()
closing_year_quarter = banks.groupby(['closing_year','closing_quarter']).size()

 

  ○matplotlib 함수 를 활용한 시각화

fig = plt.figure()
fig.suptitle('close bank situation')  #그림판 대제목
fig.set_tight_layout('True')   #그래프와 소제목 겹치지않도록 간격 생성
visual_1 = fig.add_subplot(1,3,1) #11시 방향에 배치
visual_2 = fig.add_subplot(1,3,2) #1시 방향에 배치
visual_1.set_title('closing_year') #그래프별 소제목
visual_2.set_title('closing_quarter') #그래프별 소제목
visual_1.plot(closing_year,'-')
visual_2.plot(closing_quarter,'-')

#또는
fig, ax = plt.subplots(1, 2, figsize=(14, 6))
closing_year.plot(ax=ax[0])
closing_year_quarter.plot(ax=ax[1])
plt.show()