Data/Data Analysis
2020. 11. 18.
[Pyspark ] pivot 함수 사용방법
다음과 같이 result란 pyspark dataframe이 있다고할때. 날짜별로, Reason column을 pivot시켜서 사람수를 보고싶을때 다음과같이 코드를 사용해서 pivot을 진행할수있다 result\ .groupBy('date')\ .pivot('Reason')\ .agg(F.sum('count_user'))\ .orderBy('date')\ .show(100,False) 출력은 다음과같다