본문 바로가기

Data/Data Analysis

[Pyspark ] pivot 함수 사용방법

반응형

다음과 같이 result란 pyspark dataframe이 있다고할때.

날짜별로, Reason column을 pivot시켜서 사람수를 보고싶을때 다음과같이  코드를 사용해서 pivot을 진행할수있다

result\
    .groupBy('date')\
    .pivot('Reason')\
    .agg(F.sum('count_user'))\
    .orderBy('date')\
    .show(100,False)

출력은 다음과같다

반응형