Python/Pandas & numpy
판다스 : .numeric_only, groupby/get_group
Mr.DonyStark
2024. 2. 8. 18:10
□ numeric_only
○ True : True이면 필드들 중 숫자 데이터를 가진 필드들을 대상으로만 연산하겠다라는 의미
○ False : False이면 필드들 중 숫자 데이터 가진 필드들을 대상으로 연산하지 않겠다라는 의미
#라이브러리 불러오기
import numpy as np
import seaborn as sns
#데이터 불러오기
tips = sns.load_dataset('tips')
□ get_group
○ groupby 를 한 필드를 기준으로 get_group을 사용하면
○ 그룹화한 필드는 인덱스로 적용되며, get_group을 활용해 인덱스의 값을 선택하여 해당 값에 맞는 데이터들을 뽑음
○ 하나의 그룹만 선택할 수 있으며 복수의 인덱스를 동시에 지정하는 것은 불가함
#(1) 그룹바이 진행
grouped = tips.groupby('sex')
#(2)get_group
grouped_male = grouped.get_group('Male') #인덱스 sex 하위의 단일값을 get_group으로 선택
grouped_Female = grouped.get_group('Female') #인덱스 sex 하위의 단일값을 get_group으로 선택