□ .agg() : 여러 개의 집계함수 한 번에 사용하기
□ 기본적으로 리스트, 딕셔너리 형태의 데이터를 agg함수에 담아 전달함
□ 형식 : 보통,
○ 단일 : 모든 열에 여러 함수를 매핑 : group 객체.agg([함수1, 함수2, 함수3, ...])
- 데이터 불러오기
import pandas as pd
import numpy as np
#데이터 불러오기
df = pd.read_csv('C:/python/DataScience/Data/data/python_data/gapminder.tsv', delimiter='\t')
df.head()
- 그룹화 후 agg함수를 활용하여 집계연산(집계연산은 numpy에서 제공하는 집계함수 사용)
# 단일 : 집계 메서드를 리스트에 담아 전달-연도별 그룹화한 lifeExp열의 평균을 리스트에 담아 전달
df.groupby('year')['lifeExp'].agg(np.mean)
○ 복수 : 각 열마다 다른 함수를 매핑 : group 객체.agg({'열1':함수1, '열2':함수2,...})
# 복수 : 집계 메서드를 리스트에 담아 전달-연도별 그룹화한 lifeExp열의 0이 아닌 값의 개수, 평균, 표준편차를 리스트에 담아 전달
df.groupby('year')['lifeExp'].agg([np.mean, np.count_nonzero, np.std]).rename(
columns={ #컬럼명 변경
'count_nonzero':'count',
'mean':'avg',
'std':'std_dev'
}
□ +TMI) 그룹바이함수
'Python > Pandas & numpy' 카테고리의 다른 글
판다스 : .filter() 함수 (0) | 2024.02.08 |
---|---|
판다스 : .transform() (0) | 2024.02.08 |
판다스 : 전처리 예제(feat. agg함수) (0) | 2024.02.08 |
판다스 : .apply() 함수 예제 (1) | 2024.02.08 |
.apply() / .agg() 함수 (0) | 2024.02.07 |