Data/Data Analysis
2021. 2. 24.
[Pyspark] sparkSQL groupBy concat사용하기
하나의 row에서 문자열들을 모두 합치는건 concat함수를 사용하면 되긴하지만, 가끔 여러 row에서 문자열들을 합쳐야할때가 있다. 그럴때 다음과 같은 코드를 활용하면 된다 select time, Id, concat_ws('', collect_list(item)) as concat from welcome group by 1,2 collect_list와, concat_ws 함수를 활용하면 SQL의 GROUP_CONCAT함수 효과를 맛볼수(?)있다.