본문 바로가기
Python/Pandas & numpy

판다스 : agg 심화

by Mr.DonyStark 2024. 2. 8.

□ .agg() : 여러 개의 집계함수 한 번에 사용하기

기본적으로 리스트, 딕셔너리 형태의 데이터를 agg함수에 담아 전달함

□ 형식 : 보통, 

  ○ 단일 : 모든 열에 여러 함수를 매핑 : group 객체.agg([함수1, 함수2, 함수3, ...])

   - 데이터 불러오기

import pandas as pd
import numpy as np
#데이터 불러오기
df = pd.read_csv('C:/python/DataScience/Data/data/python_data/gapminder.tsv', delimiter='\t')
df.head()

 

   - 그룹화 후 agg함수를 활용하여 집계연산(집계연산은 numpy에서 제공하는 집계함수 사용)

# 단일 : 집계 메서드를 리스트에 담아 전달-연도별 그룹화한 lifeExp열의 평균을 리스트에 담아 전달
df.groupby('year')['lifeExp'].agg(np.mean)

 


  ○ 복수 : 각 열마다 다른 함수를 매핑 : group 객체.agg({'열1':함수1, '열2':함수2,...})

# 복수 : 집계 메서드를 리스트에 담아 전달-연도별 그룹화한 lifeExp열의 0이 아닌 값의 개수, 평균, 표준편차를 리스트에 담아 전달
df.groupby('year')['lifeExp'].agg([np.mean, np.count_nonzero, np.std]).rename(
    columns={ #컬럼명 변경
        'count_nonzero':'count',
        'mean':'avg',
        'std':'std_dev'
    }

 

□ +TMI) 그룹바이함수

 

'Python > Pandas & numpy' 카테고리의 다른 글

판다스 : .filter() 함수  (0) 2024.02.08
판다스 : .transform()  (0) 2024.02.08
판다스 : 전처리 예제(feat. agg함수)  (0) 2024.02.08
판다스 : .apply() 함수 예제  (1) 2024.02.08
.apply() / .agg() 함수  (0) 2024.02.07