본문 바로가기
Python/Pandas & numpy

판다스 : 시리즈, 데이터프레임 생성

by Mr.DonyStark 2024. 1. 31.

□ 시리즈 *시리즈를 만들때 데이터와 인덱스 수 가 반드시 일치해야함

#형식
변수명 = pd.Series(data=[데이터1,데이터2], index=[데이터1,데이터2])

#예제
import pandas as pd
my_s = pd.Series(data =['banana',42], index=['person','Who'])
idx = my_s.index #인덱스만 저장
val = my_s.values #벨류(데이터)만 저장

첫번째) my_s = pd.Series(data =['banana',42], index=['person','Who']) , 두번째) idx = my_s.index , 세번째) val = my_s.values

 

□ 딕셔너리

#형식
변수명 = pd.Dataframe(
	{
    키 : 벨류,
    키 : 벨류,
    키 : 벨류
    }
)

#예제(1) 키값은 필드명으로 벨류값은 필드별 데이터로 저장
scientists_1 = pd.DataFrame({
    'name' : ['Rosaline Flankine','William Gosset'],
    'Occupation' : ['Chemist','Stastician'],
    'Born' : ['1920-07-25','1876-06-13'],
    'Died': ['1958-04-16','1937-10-16'],
    'Age' : [37,61]})
    
#예제(2) 키값은 필드명으로 벨류값은 필드별 데이터로 저장, 단 인덱스는 문자로 별도지정
# └ 인덱스를 문자열로 지정했으므로 loc로 데이터 조회 가능
scientists = pd.DataFrame({
    'Occupation' : ['Chemist','Stastician'],
    'Born' : ['1920-07-25','1876-06-13'],
    'Died': ['1958-04-16','1937-10-16'],
    'Age' : [37,61]},
    index=['Rosaline Flankine','William Gosset'], #인덱스 설정
    columns = ['Occupation', 'Born', 'Age', 'Died']) #필드명 순서지정

좌) 예제(1)    우) 예제(2)