본문 바로가기

Python/seaborn & matplotlib14

Plotly2 ( + Bonus) □ 단순 시각화를 위해서는 plotly 만 사용 ○ chart_studio.plotly : Plotly 그래프를 생성하고 온라인으로 공유하는 데 사용되는 Plotly의 라이브러리임. ○ plotly.offline: Plotly : 그래프를 오프라인(로컬에서 실행) 모드로 사용하는 데 필요한 라이브러리임. plotly.offline를 사용하면 오프라인에서도 Plotly 그래프를 생성하고 시각화할 수 있음 ○ cufflinks: Pandas 데이터프레임을 사용하여 간단하게 Plotly 그래프를 생성하는 데 사용되는 라이브러리임. cufflinks를 사용하면 Pandas 데이터프레임에 대해 쉽게 시각화할 수 있음 #라이브러리 호출 import chart_studio.plotly as py import plot.. 2024. 2. 19.
query, where 함수를 활용한 전처리 및 시각화 예제 □ 라이브러리 호출 및 데이터 불러오기 #라이브러리 호출 import pandas as pd import numpy as np import seaborn as sns #데이터 불러오기 raw_welfare = pd.read_spss("C:/Users/Lenovo/Downloads/Koweps_hpwc14_2019_beta2.sav") #데이터 변수에 카피 welfare = raw_welfare.copy() □ 복수개의 컬럼명변경 welfare = welfare.rename(columns = { 'h14_g3' : 'sex', 'h14_g4' : 'birth', 'h14_g10' : 'marriage_type', 'h14_g11':'religion', 'p1402_8aq1':'income', 'h14_ec.. 2024. 2. 16.
전처리 후 시각화(Series 타입을 Seaborn으로 그래프화) □ 라이브러리 호출 #라이브러리 호출 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from matplotlib import font_manager, rc □ 데이터 불러오기 upjong_data = pd.read_excel('C:/Users/Lenovo/Downloads/result1.xlsx') □ 특정필드(열) 데이터 대문자 변환 ○ .str. : 판다스(Pandas)에서 문자열 데이터에 대한 벡터화된 문자열 연산을 수행하기 위한 속성 ○ .upper : 대문자 변환 upjong_data['업종코드(SE_UPJONG)'] = upjong_data['업종코드(SE_UPJONG)']... 2024. 2. 16.
판다스 parse_dates, assign 함수를 활용한 시각화 □ 라이브러리 호출 및 데이터 불러오기 ○ parse_dates - 판다스(Pandas)의 read_csv() 함수에서 사용되는 매개변수 중 하나임. - 이를 이용하여 CSV 파일을 읽을 때 날짜 데이터를 파싱(parse)하여 datetime 형식으로 처리 import pandas as pd import matplotlib.pyplot as plt banks = pd.read_csv('C:/python/DataScience/Data/data/python_data/banklist.csv', parse_dates=['Closing Date','Updated Date']) banks.head() ○ parse_dates banks = banks.assign( closing_quarter = banks['Clo.. 2024. 2. 16.
Plotly ( + Bonus) Plotly 를 활용하여 초보자들은 복잡한 플롯을 만드는 과정을 단순화하고 훌륭한 시각화를 시작할 수 있음 https://plotly.com/python/reference/ Single-page Figure plotly.com □ 라이브러리 import chart_studio.plotly as py import cufflinks as cf □ 생성규칙 ○ fig = go.Figure()로 기본 객체를 만들고 ○ fig.add_trace()에 그래프 객체를 추가 ○ fig.update_layout()으로 layout 업데이트 (필요시) ○ fig.update_annotation()으로 annotation (필요시) ○ fig.show()로 그래프 보기 #판다스로 데이터프레임 생성 #넘파이 .random.r.. 2024. 2. 15.
pie, barplot 차트 (+glob함수로 다중 데이터 불러오기) □ 라이브러리 호출 및 한글 설정 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import glob □ 다중 데이터 불러오기 및 불러오면서 데이터별 전처리(컬럼추가 및 값 넣기) #파일 불러오기 child_data = glob.glob('C:/python/DataScience/Data/data/python_data/names/yob20*') #불러온 파일을 저장할 빈 리스트 생성 child_list = list() #반복문을 활용하여 데이터 집어 넣기 for i in child_data: year = i.split('yob')[1].split('.')[0] #불러온 파일경로 및 파일명을 split하여 년도 추출 df .. 2024. 2. 7.
countplot 차트 (+glob함수로 다중 데이터 불러오기) □ 라이브러리 호출 및 한글 설정 import glob import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from matplotlib import font_manager, rc #한글폰트 사용 및 적용을 위한 코드 plt.rcParams['axes.unicode_minus'] = False f_path = 'C:/Windows/Fonts/malgun.ttf' font_name = font_manager.FontProperties(fname=f_path).get_name() rc('font',family = font_name) □ glob함수를 활용하여 다중 데이터 불러오기 #데이터 불러오기 glob함수 사용 data = g.. 2024. 2. 7.
파이형 그래프 (feat. 한글출력/폰트설정) #라이브러리 호출 import matplotlib.pyplot as plt from matplotlib import font_manager, rc #폰트지정 및 불러오기 plt.rcParams['axes.unicode_minus'] = False f_path = 'C:/Windows/Fonts/malgun.ttf' font_name = font_manager.FontProperties(fname=f_path).get_name() rc('font',family = font_name) #데이터 지정 labels = '개구리', '돼지', 'Dogs', 'Logs' colors = ['red','skyblue','dogs','logs'] sizes = [15,30,45,10] explode = (0,0.1,0.. 2024. 2. 6.
Seaborn 활용 데이터 시각화 □ Seaborn과 Matplotlib은 둘 다 데이터 시각화를 위한 파이썬 라이브러리임 □ Seaborn은 Matplotlib을 기반으로 한 고수준의 인터페이스이며, 통계 그래픽을 쉽게 그릴 수 있도록 도와줌 □ Seaborn은 Matplotlib을 기반으로하여 더 간편한 문법을 제공하고, 예쁜 테마와 색상 팔레트를 제공하여 그래프를 빠르게 스타일링할 수 있도록 도와줌 □ Seaborn은 통계적 그래픽스에 특화되어 있어 회귀선, 박스 플롯, 히스토그램 등을 간단한 명령어로 그릴 수 있음 □ 히스토그램 시각화 ○ seaborn에서 sbplot 사용시 두가지 값을 반환함 - 첫번째는 그림영역 즉, 틀을 생성 - 두번쨰는 그래프의 모든 객체 #라이브러리 호출 import seaborn as sns impor.. 2024. 2. 6.