[pandas] groupby 에 컬럼별로 count, sum, mean 하기

컬럼별로 데이터를 조정하고 싶을 때 사용할 수 있다.

데이터 샘플은 캐글에 있는 타이타닉의 train.csv 로 했다.

받으러 가기 번거로우니 여기에 파일추가

import pandas as pd

df1 = pd.read_csv('data/titanic.csv')
df1.head()

단순 groupby 를 사용하면 모든 컬럼이 적용된다.

df1.groupby('Survived').count()

이번엔 Servived를 기준으로 Pclass는 갯수를, Age는 평균을 Fare는 최대값이 나오도록 설정했다

df1.groupby('Survived').agg({'Pclass': 'count','Age':'mean', 'Fare':'max'})

끝.

[NLP] 형태소 분석기 mecab 설치하기(mac) (0)	2019.10.19
[pandas] loc 와 iloc 차이 (0)	2019.10.09
[pandas] 날짜 문자열을 datetime 형태로 변경 (0)	2019.10.06
통계용어정리, 기술통계, 추론통계 (0)	2019.02.17
[python3] NLTK 설치하기 (0)	2019.01.08

side impact