Python/seaborn & matplotlib14 다변량 그래프 □ 다변량 그래프 : 변수가 여러개인 그래프로 3개 이상의 변수를 나타낸 시각화를 의미 #라이브러리 호출 import seaborn as sns import matplotlib.pyplot as plt tips = sns.load_dataset('tips') #색지정 colors = {'Female':'#f1a340','Male':'#998ec3'} #틀생성 scatter_plot = plt.figure() #위치 및 순서 지정 axes1 = scatter_plot.add_subplot(1,1,1) #데이터 지정 axes1.scatter(data=tips, x='total_bill', y='tip', s=tips['size']**2*10, c=tips['sex'].map(colors), alpha=0.5.. 2024. 2. 6. 이산변수 / 박스 그래프 그리기 □ 박스 그래프 : 이산변수와 연속변수 사이의 관계를 나타냄 ○ 이산 변수 : 명확하게 구분이되는 값을 의미 ○ 연속형 변수 : 명확하게 셀수 없는 범위의 값을 의미 #라이브러리 호출 import seaborn as sns import matplotlib.pyplot as plt tips = sns.load_dataset('tips') #틀생성 boxplot = plt.figure() #시각화 위치 및 범위 지정 axes1 = boxplot.add_subplot(1,1,1) #데이터 지정 axes1.boxplot( x=[ tips[tips['sex'] == 'Female']['tip'], tips[tips['sex'] == 'Male']['tip'] ], labels=['Female','Male']) #.. 2024. 2. 6. 일변량 / 이변량 시각화 □ 일변량 ○ 변수가 1개일 때 이를 일변량 ○ 하나의 변수를 시각화하는 가장 일반적 방법 ○ 값을 일정 구간별로 묶어서 해당 구간의 데이터 개수를 빈도로 표시하는 그래프로 변수의 분포를 나타냄 * bins : x축 구간의 막대 표시 개수를 의미함 #라이브러리 호출 import seaborn as sns import matplotlib.pyplot as plt tips = sns.load_dataset('tips') fig = plt.figure() #틀생성 axes1 = fig.add_subplot(1,1,1) #위치 및 순서 지정 axes1.hist(data = tips, x='total_bill', bins = 10) axes1.set_title('histogram of Total Bill') #대.. 2024. 2. 6. 한번에 4개 그래프 그리기 □ 순서 ○ 데이터 불러오기 및 셋 구축 ○ 틀 생성 plt.figure() ○ 데이터 시각화 배치 #데이터셋 필드의 값이 I 인것으로 설정 dataset_1 = anscombe[anscombe['dataset'] == 'I'] dataset_2 = anscombe[anscombe['dataset'] == 'II'] dataset_3 = anscombe[anscombe['dataset'] == 'III'] dataset_4 = anscombe[anscombe['dataset'] == 'IV'] #기본틀 생성 fig = plt.figure() fig.suptitle('Visual Data') #그림판 대제목 fig.set_tight_layout('True') #그래프와 소제목 겹치지않도록 간격 생성 #2*.. 2024. 2. 6. 파이플롯(pyplot) 시각화 □ 데이터 셋 지정 #데이터 불러오기 anscombe = sns.load_dataset('anscombe') #데이터셋 필드의 값이 I 인것으로 설정 dataset_1 = anscombe[anscombe['dataset'] == 'I'] □ plot 차트 생성 및 라인색상 지정 #데이터셋 중 x필드와 y필드로 plot 차트 생성 및 색상 blue추가 plt.plot(dataset_1['x'], dataset_1['y'], c='b') □ plot 차트 생성 및 라인 굵기 지정 plt.plot(dataset_1['x'], dataset_1['y'], c='b', lw = 5) #선 굵기 추가 □ plot 차트 생성 및 라인 스타일 점선 지정 plt.plot(dataset_1['x'], dataset_1['.. 2024. 2. 6. 이전 1 2 다음