본문 바로가기

python pandas12

판다스 : 시리즈, 데이터프레임 생성 □ 시리즈 *시리즈를 만들때 데이터와 인덱스 수 가 반드시 일치해야함 #형식 변수명 = pd.Series(data=[데이터1,데이터2], index=[데이터1,데이터2]) #예제 import pandas as pd my_s = pd.Series(data =['banana',42], index=['person','Who']) idx = my_s.index #인덱스만 저장 val = my_s.values #벨류(데이터)만 저장 □ 딕셔너리 #형식 변수명 = pd.Dataframe( { 키 : 벨류, 키 : 벨류, 키 : 벨류 } ) #예제(1) 키값은 필드명으로 벨류값은 필드별 데이터로 저장 scientists_1 = pd.DataFrame({ 'name' : ['Rosaline Flankine','Will.. 2024. 1. 31.
판다스 : 기초통계 □ 형식 #단일그룹 변수명.groupby('필드명')['필드명'].집계함수() #다중그룹 변수명.groupby(['필드명1','필드명2'])[['필드명3','필드명4']].집계함수() □ 예제 #라이브러리 호출 import pandas as pd #라이브러리 약어지정 # csv 파일 불러오기 # ┗ pandas.read_csv(경로, sept='\t') ex_df = pd.read_csv('경로', sep='\t') #data폴더에서 tsv파일 호출 #연도별 평균 기대수명 ex_df.groupby('year')['lifeExp'].mean() #연도와 대륙별 평균 기대수명과 gdp ex_df.groupby(['year','continent'])[['lifeExp','gdpPercap']].mean() #.. 2024. 1. 31.
csv 파일 불러오기 및 정보확인 □ 라이브러리 호출 및 파일 불러오기 #라이브러리 호출 import pandas as pd #라이브러리 약어지정 □ 데이터 프레임 기본정보 확인 : 변수명.info() ○ 컬럼(필드)의 종류 및 개수, 컬럼 타입 조회 가능 #라이브러리 호출 import pandas as pd #라이브러리 약어지정 # csv 파일 불러오기 # ┗ pandas.read_csv(경로, sept='\t') ex_df = pd.read_csv('경로', sep='\t') #data폴더에서 tsv파일 호출 ###데이터프레임 기본정보 확인 #(1)불러온 데이터 타입 확인 : 데이터 기준 pandas.core.frame.DataFrame 출력 type(ex_df) #(2)요약정보 확인 ex_df.info() #(3)행/열 개수 확인 .. 2024. 1. 31.