Pandas Grouping
기준에 따른 여러 그룹으로 데이터 분할(splitting)
각 그룹에 독립적으로 함수 적용(applying)
결과물들을 하나의 데이터 구조로 결합(combining)
0 foo one -0.759985 -0.830048
1 bar one -0.361017 1.040381
2 foo two 0.927589 -0.976534
3 bar three -0.255237 -1.149321
4 foo two 0.535983 1.545994
5 bar two -0.865925 0.306166
6 foo one -0.995362 -1.492863
7 foo three 1.256075 -0.243938
A를 기준으로 합을 구해본다.
df.groupby('A').sum()
아래와 같은 결과를 얻을 수 있다.
A C D
bar -1.482179 0.197225
foo 0.964299 -1.997389
A의 값에 따른 C의 값과 D의 값의 합을 구할 수 있다.
SQL의 group by 와 같은 역할을 한다
Pandas의 기능 중 몇가지의 rows만 보여주는 함수가 있다.
pandas.DataFrame.tail
or pandas.DataFrame.head
이며, 마지막 N개의 행만 출력한다.
pd.tail(5)
와 같이 사용가능하다.
댓글