본문 바로가기

Data/Data Analysis

[Pyspark] sparkSQL groupBy concat사용하기

반응형

하나의 row에서 문자열들을 모두 합치는건 concat함수를 사용하면 되긴하지만, 가끔 여러 row에서 문자열들을 합쳐야할때가 있다. 그럴때 다음과 같은 코드를 활용하면 된다

select time, Id, concat_ws('', collect_list(item)) as concat
from welcome
group by 1,2

collect_list와, concat_ws 함수를 활용하면 SQL의 GROUP_CONCAT함수 효과를 맛볼수(?)있다.

반응형