반응형
컬럼별로 데이터를 조정하고 싶을 때 사용할 수 있다.
데이터 샘플은 캐글에 있는 타이타닉의 train.csv 로 했다.
받으러 가기 번거로우니 여기에 파일추가
import pandas as pd
df1 = pd.read_csv('data/titanic.csv')
df1.head()
단순 groupby 를 사용하면 모든 컬럼이 적용된다.
df1.groupby('Survived').count()
이번엔 Servived를 기준으로 Pclass는 갯수를, Age는 평균을 Fare는 최대값이 나오도록 설정했다
df1.groupby('Survived').agg({'Pclass': 'count','Age':'mean', 'Fare':'max'})
끝.
반응형
'공부 > 데이터' 카테고리의 다른 글
[NLP] 형태소 분석기 mecab 설치하기(mac) (0) | 2019.10.19 |
---|---|
[pandas] loc 와 iloc 차이 (0) | 2019.10.09 |
[pandas] 날짜 문자열을 datetime 형태로 변경 (0) | 2019.10.06 |
통계용어정리, 기술통계, 추론통계 (0) | 2019.02.17 |
[python3] NLTK 설치하기 (0) | 2019.01.08 |
댓글