본문 바로가기

분류 전체보기349

countplot 차트 (+glob함수로 다중 데이터 불러오기) □ 라이브러리 호출 및 한글 설정 import glob import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from matplotlib import font_manager, rc #한글폰트 사용 및 적용을 위한 코드 plt.rcParams['axes.unicode_minus'] = False f_path = 'C:/Windows/Fonts/malgun.ttf' font_name = font_manager.FontProperties(fname=f_path).get_name() rc('font',family = font_name) □ glob함수를 활용하여 다중 데이터 불러오기 #데이터 불러오기 glob함수 사용 data = g.. 2024. 2. 7.
판다스 : 다중데이터 불러오기 □ glob 라이브러리 사용 □ 방법 1 : 데이터 하나하나 불러오기 import pandas as pd import glob nyc_taxi_data = glob.glob('C:/python/DataScience/Data/data/python_data/fhv_*') #glob라이브러리를 활용해 담긴 변수의 인덱스번호를 활용하여 데이터 저장 taxi1 = pd.read_csv(nyc_taxi_data[0]) taxi2 = pd.read_csv(nyc_taxi_data[1]) taxi3 = pd.read_csv(nyc_taxi_data[2]) taxi4 = pd.read_csv(nyc_taxi_data[3]) taxi5 = pd.read_csv(nyc_taxi_data[4]) #저장된 데이터 concat .. 2024. 2. 7.
판다스 : .melt() 함수2 (한 필드의 고정 값이 2개 이상시) □ 라이브러리 호출 및 데이터 불러오기 #라이브러리 호출 import pandas as pd #파일불러오기 weather = pd.read_csv('C:/python/DataScience/Data/data/python_data/weather.csv') □ 멜트 1차 시도 : 특정 열 기준으로 멜트작업 진행 ○ element 고정값이 2개(tmax, tmin)인 것을 확인 weather_melt = weather.melt(id_vars=['id','year','month','element'], var_name = 'day', value_name = 'temp' ) □ 멜트 2차 시도 : 특정 열 기준으로 멜트 재작업 진행 ○ .reset_index() : 인덱스 정리 + reset_index()를 활용하여.. 2024. 2. 7.
판다스 : .melt() 함수1 □ melt 함수 ○ 데이터 재구조화 ○ 전처리 과정에서 사용. 쉽게생각하여 필드(컬럼)들을 행으로 녹여 배치시키는 것으로 생각하면됨. ○ 데이터프레임의 열이 옆으로(행방향으로)길게 늘어진 데이터에서 보통 사용 □ melt 함수 매개변수 □ melt 함수 매개변수1 ○ 데이터 불러오기 #라이브러리 호출 import pandas as pd #데이터 불러오기 pew = pd.read_csv('C:/python/DataScience/Data/data/python_data/pew.csv') ○ .melt() 함수를 사용하여 특정열 고정 및 기준으로 재구조화 진행 #특정열 고정(religion 필드를 기준으로 melt 적용) pew_long = pew.melt(id_vars='religion') ○ .melt().. 2024. 2. 7.
청소년 우울증(18년도, 22년도) : 연속 시각화(파이형그래프) 차트 생성 및 배치 □ 같은 내용의 데이터지만 년도가 각자 다른 파일에 대하여 시각화 차트를 구현해보자 □ 작업진행 : 데이터별 전처리 → 필요 데이터 추출 → 시각화 틀(판)생성 및 추출된 데이터기반으로 시각화 그래프 생성 □ 세부내용 ○ 라이브러리 호출 #라이브러리 호출 import pandas as pd import matplotlib.pyplot as plt from matplotlib import font_manager, rc plt.rcParams['axes.unicode_minus'] = False # 한글 깨짐 방지를 위해 호출 #한글표시 및 사용을 위해 f_path = 'C:/Windows/Fonts/malgun.ttf' font_name = font_manager.FontProperties(fname = .. 2024. 2. 7.
타이타닉 데이터 전처리 및 시각화 □ 타이타닉 데이터를 전처리 후 시각화 ○ 승객 나이대별 히스토그램 시각화 ○ 남녀 승객수를 막대그래프 시각화 ○ 객실별 사망자수 시각화 ○ 사망자와 생존자 비율 pie 그래프 시각화 □ 데이터 불러오기 및 조회 #라이브러리 호출 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd from matplotlib import font_manager, rc #폰트지정 및 불러오기 plt.rcParams['axes.unicode_minus'] = False f_path = 'C:/Windows/Fonts/malgun.ttf' font_name = font_manager.FontProperties(fname=f_path).get_na.. 2024. 2. 6.
파이형 그래프 (feat. 한글출력/폰트설정) #라이브러리 호출 import matplotlib.pyplot as plt from matplotlib import font_manager, rc #폰트지정 및 불러오기 plt.rcParams['axes.unicode_minus'] = False f_path = 'C:/Windows/Fonts/malgun.ttf' font_name = font_manager.FontProperties(fname=f_path).get_name() rc('font',family = font_name) #데이터 지정 labels = '개구리', '돼지', 'Dogs', 'Logs' colors = ['red','skyblue','dogs','logs'] sizes = [15,30,45,10] explode = (0,0.1,0.. 2024. 2. 6.
Seaborn 활용 데이터 시각화 □ Seaborn과 Matplotlib은 둘 다 데이터 시각화를 위한 파이썬 라이브러리임 □ Seaborn은 Matplotlib을 기반으로 한 고수준의 인터페이스이며, 통계 그래픽을 쉽게 그릴 수 있도록 도와줌 □ Seaborn은 Matplotlib을 기반으로하여 더 간편한 문법을 제공하고, 예쁜 테마와 색상 팔레트를 제공하여 그래프를 빠르게 스타일링할 수 있도록 도와줌 □ Seaborn은 통계적 그래픽스에 특화되어 있어 회귀선, 박스 플롯, 히스토그램 등을 간단한 명령어로 그릴 수 있음 □ 히스토그램 시각화 ○ seaborn에서 sbplot 사용시 두가지 값을 반환함 - 첫번째는 그림영역 즉, 틀을 생성 - 두번쨰는 그래프의 모든 객체 #라이브러리 호출 import seaborn as sns impor.. 2024. 2. 6.
다변량 그래프 □ 다변량 그래프 : 변수가 여러개인 그래프로 3개 이상의 변수를 나타낸 시각화를 의미 #라이브러리 호출 import seaborn as sns import matplotlib.pyplot as plt tips = sns.load_dataset('tips') #색지정 colors = {'Female':'#f1a340','Male':'#998ec3'} #틀생성 scatter_plot = plt.figure() #위치 및 순서 지정 axes1 = scatter_plot.add_subplot(1,1,1) #데이터 지정 axes1.scatter(data=tips, x='total_bill', y='tip', s=tips['size']**2*10, c=tips['sex'].map(colors), alpha=0.5.. 2024. 2. 6.