본문 바로가기
공부/데이터

[pandas] groupby 에 컬럼별로 count, sum, mean 하기

by demonic_ 2019. 10. 8.
반응형

컬럼별로 데이터를 조정하고 싶을 때 사용할 수 있다.

데이터 샘플은 캐글에 있는 타이타닉의 train.csv 로 했다.

받으러 가기 번거로우니 여기에 파일추가

 

titanic.csv
0.06MB

 

 

import pandas as pd

df1 = pd.read_csv('data/titanic.csv')
df1.head()

 

단순 groupby 를 사용하면 모든 컬럼이 적용된다.

df1.groupby('Survived').count()

 

이번엔 Servived를 기준으로 Pclass는 갯수를, Age는 평균을 Fare는 최대값이 나오도록 설정했다

df1.groupby('Survived').agg({'Pclass': 'count','Age':'mean', 'Fare':'max'})

끝.

반응형

댓글