Note
pandas 10 minutes (3) 본문
728x90
8. Reshaping
(1) stack - 데이터 쌓기
tuples와 index 생성
zip은 묶어서 재배열해주는 함수, 특수한 경우에 사용한다.
랜덤한 수를 이용해 df라는 데이터 프레임 생성
데이터 프레임 df를 4행까지 분리해서 df2에 지정해준다.
그다음 stack()을 사용하면 밑으로 데이터가 쌓인 형태를 볼 수 있다.
unstack()을 사용하면 원래의 데이터 형태로 되돌릴 수 있다.
여기서, unstack(0)이나 unstack(1)을 사용하면 다양한 옵션으로 바꿀 수 있다.
unstack(0)과 unstack(1)을 사용한 모습인데 원래 데이터 형태와 다른 것을 알아볼 수 있다.
(2) Pivot tables(*중요!)
데이터 프레임 df 생성
pivot=기준, 기준을 잡아서 재배치한다.
c가 컬럼으로 들어간다.
pd.pivot_table(데이터, values='재배치하고자 하는 컬럼', index=기준, columns=지정컬럼)
'Machine Learning' 카테고리의 다른 글
pandas다루기_보스톤마라톤(캐글 데이터) (0) | 2021.04.28 |
---|---|
4. 엑셀을 다루는 판다스 (0) | 2021.04.28 |
pandas 10 minutes (2) (0) | 2021.04.27 |
pandas 10 minutes (1) (0) | 2021.04.27 |
pandas cheat sheet (0) | 2021.04.27 |
Comments