본문 바로가기

파이썬 시각화10

비지도학습 : 군집 알고리즘 기본 □ 비지도학습 : 타깃이 없을때 사용하는 머신러닝 알고리즘임. □ 예제 #라이브러리 import numpy as np import matplotlib.pyplot as plt #데이터 로드 fruits = np.load("../jupyterNotebook/data/fruits_300.npy") print(f"차원 : {fruits.ndim}") print(f"형태 : {fruits.shape}") print("첫번째 차원은 샘플개수 300, 두번째 차원은 높이 100, 세번째 차원은 너비 100") print("\n") print(fruits[:3]) #첫번째 행 데이터 출력 print(fruits[0,0,:]) #이미지화 : imshow plt.imshow(fruits[0], cmap="gray") p.. 2024. 3. 26.
Plotly2 ( + Bonus) □ 단순 시각화를 위해서는 plotly 만 사용 ○ chart_studio.plotly : Plotly 그래프를 생성하고 온라인으로 공유하는 데 사용되는 Plotly의 라이브러리임. ○ plotly.offline: Plotly : 그래프를 오프라인(로컬에서 실행) 모드로 사용하는 데 필요한 라이브러리임. plotly.offline를 사용하면 오프라인에서도 Plotly 그래프를 생성하고 시각화할 수 있음 ○ cufflinks: Pandas 데이터프레임을 사용하여 간단하게 Plotly 그래프를 생성하는 데 사용되는 라이브러리임. cufflinks를 사용하면 Pandas 데이터프레임에 대해 쉽게 시각화할 수 있음 #라이브러리 호출 import chart_studio.plotly as py import plot.. 2024. 2. 19.
전처리 후 시각화(Series 타입을 Seaborn으로 그래프화) □ 라이브러리 호출 #라이브러리 호출 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from matplotlib import font_manager, rc □ 데이터 불러오기 upjong_data = pd.read_excel('C:/Users/Lenovo/Downloads/result1.xlsx') □ 특정필드(열) 데이터 대문자 변환 ○ .str. : 판다스(Pandas)에서 문자열 데이터에 대한 벡터화된 문자열 연산을 수행하기 위한 속성 ○ .upper : 대문자 변환 upjong_data['업종코드(SE_UPJONG)'] = upjong_data['업종코드(SE_UPJONG)']... 2024. 2. 16.
Plotly ( + Bonus) Plotly 를 활용하여 초보자들은 복잡한 플롯을 만드는 과정을 단순화하고 훌륭한 시각화를 시작할 수 있음 https://plotly.com/python/reference/ Single-page Figure plotly.com □ 라이브러리 import chart_studio.plotly as py import cufflinks as cf □ 생성규칙 ○ fig = go.Figure()로 기본 객체를 만들고 ○ fig.add_trace()에 그래프 객체를 추가 ○ fig.update_layout()으로 layout 업데이트 (필요시) ○ fig.update_annotation()으로 annotation (필요시) ○ fig.show()로 그래프 보기 #판다스로 데이터프레임 생성 #넘파이 .random.r.. 2024. 2. 15.
pie, barplot 차트 (+glob함수로 다중 데이터 불러오기) □ 라이브러리 호출 및 한글 설정 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import glob □ 다중 데이터 불러오기 및 불러오면서 데이터별 전처리(컬럼추가 및 값 넣기) #파일 불러오기 child_data = glob.glob('C:/python/DataScience/Data/data/python_data/names/yob20*') #불러온 파일을 저장할 빈 리스트 생성 child_list = list() #반복문을 활용하여 데이터 집어 넣기 for i in child_data: year = i.split('yob')[1].split('.')[0] #불러온 파일경로 및 파일명을 split하여 년도 추출 df .. 2024. 2. 7.
countplot 차트 (+glob함수로 다중 데이터 불러오기) □ 라이브러리 호출 및 한글 설정 import glob import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from matplotlib import font_manager, rc #한글폰트 사용 및 적용을 위한 코드 plt.rcParams['axes.unicode_minus'] = False f_path = 'C:/Windows/Fonts/malgun.ttf' font_name = font_manager.FontProperties(fname=f_path).get_name() rc('font',family = font_name) □ glob함수를 활용하여 다중 데이터 불러오기 #데이터 불러오기 glob함수 사용 data = g.. 2024. 2. 7.
청소년 우울증(18년도, 22년도) : 연속 시각화(파이형그래프) 차트 생성 및 배치 □ 같은 내용의 데이터지만 년도가 각자 다른 파일에 대하여 시각화 차트를 구현해보자 □ 작업진행 : 데이터별 전처리 → 필요 데이터 추출 → 시각화 틀(판)생성 및 추출된 데이터기반으로 시각화 그래프 생성 □ 세부내용 ○ 라이브러리 호출 #라이브러리 호출 import pandas as pd import matplotlib.pyplot as plt from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False # 한글 깨짐 방지를 위해 호출 #한글표시 및 사용을 위해 f_path = 'C:/Windows/Fonts/malgun.ttf' font_name = font_manager.FontProperties(fname = .. 2024. 2. 7.
타이타닉 데이터 전처리 및 시각화 □ 타이타닉 데이터를 전처리 후 시각화 ○ 승객 나이대별 히스토그램 시각화 ○ 남녀 승객수를 막대그래프 시각화 ○ 객실별 사망자수 시각화 ○ 사망자와 생존자 비율 pie 그래프 시각화 □ 데이터 불러오기 및 조회 #라이브러리 호출 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd from matplotlib import font_manager, rc #폰트지정 및 불러오기 plt.rcParams['axes.unicode_minus'] = False f_path = 'C:/Windows/Fonts/malgun.ttf' font_name = font_manager.FontProperties(fname=f_path).get_na.. 2024. 2. 6.
Seaborn 활용 데이터 시각화 □ Seaborn과 Matplotlib은 둘 다 데이터 시각화를 위한 파이썬 라이브러리임 □ Seaborn은 Matplotlib을 기반으로 한 고수준의 인터페이스이며, 통계 그래픽을 쉽게 그릴 수 있도록 도와줌 □ Seaborn은 Matplotlib을 기반으로하여 더 간편한 문법을 제공하고, 예쁜 테마와 색상 팔레트를 제공하여 그래프를 빠르게 스타일링할 수 있도록 도와줌 □ Seaborn은 통계적 그래픽스에 특화되어 있어 회귀선, 박스 플롯, 히스토그램 등을 간단한 명령어로 그릴 수 있음 □ 히스토그램 시각화 ○ seaborn에서 sbplot 사용시 두가지 값을 반환함 - 첫번째는 그림영역 즉, 틀을 생성 - 두번쨰는 그래프의 모든 객체 #라이브러리 호출 import seaborn as sns impor.. 2024. 2. 6.