Data/Data Analysis
[Pyspark ] pivot 함수 사용방법
재융
2020. 11. 18. 15:29
반응형
다음과 같이 result란 pyspark dataframe이 있다고할때.
날짜별로, Reason column을 pivot시켜서 사람수를 보고싶을때 다음과같이 코드를 사용해서 pivot을 진행할수있다
result\
.groupBy('date')\
.pivot('Reason')\
.agg(F.sum('count_user'))\
.orderBy('date')\
.show(100,False)
출력은 다음과같다
반응형