□ 라이브러리 호출 및 데이터 불러오기
○ parse_dates
- 판다스(Pandas)의 read_csv() 함수에서 사용되는 매개변수 중 하나임.
- 이를 이용하여 CSV 파일을 읽을 때 날짜 데이터를 파싱(parse)하여 datetime 형식으로 처리
import pandas as pd
import matplotlib.pyplot as plt
banks = pd.read_csv('C:/python/DataScience/Data/data/python_data/banklist.csv', parse_dates=['Closing Date','Updated Date'])
banks.head()
○ parse_dates
banks = banks.assign(
closing_quarter = banks['Closing Date'].dt.quarter,
closing_year = banks['Closing Date'].dt.year
)
○ size 함수 : size() 메서드는 Pandas 라이브러리에서 제공되는 메서드 중 하나로 이 메서드는 데이터프레임 또는 시리즈의 크기, 즉 원소의 총 개수를 반환
closing_year = banks.groupby(['closing_year']).size()
closing_quarter = banks.groupby(['closing_quarter']).size()
closing_year_quarter = banks.groupby(['closing_year','closing_quarter']).size()
○matplotlib 함수 를 활용한 시각화
fig = plt.figure()
fig.suptitle('close bank situation') #그림판 대제목
fig.set_tight_layout('True') #그래프와 소제목 겹치지않도록 간격 생성
visual_1 = fig.add_subplot(1,3,1) #11시 방향에 배치
visual_2 = fig.add_subplot(1,3,2) #1시 방향에 배치
visual_1.set_title('closing_year') #그래프별 소제목
visual_2.set_title('closing_quarter') #그래프별 소제목
visual_1.plot(closing_year,'-')
visual_2.plot(closing_quarter,'-')
#또는
fig, ax = plt.subplots(1, 2, figsize=(14, 6))
closing_year.plot(ax=ax[0])
closing_year_quarter.plot(ax=ax[1])
plt.show()
'Python > seaborn & matplotlib' 카테고리의 다른 글
query, where 함수를 활용한 전처리 및 시각화 예제 (0) | 2024.02.16 |
---|---|
전처리 후 시각화(Series 타입을 Seaborn으로 그래프화) (0) | 2024.02.16 |
Plotly ( + Bonus) (0) | 2024.02.15 |
pie, barplot 차트 (+glob함수로 다중 데이터 불러오기) (0) | 2024.02.07 |
countplot 차트 (+glob함수로 다중 데이터 불러오기) (0) | 2024.02.07 |