반응형
하나의 row에서 문자열들을 모두 합치는건 concat함수를 사용하면 되긴하지만, 가끔 여러 row에서 문자열들을 합쳐야할때가 있다. 그럴때 다음과 같은 코드를 활용하면 된다
select time, Id, concat_ws('', collect_list(item)) as concat
from welcome
group by 1,2
collect_list와, concat_ws 함수를 활용하면 SQL의 GROUP_CONCAT함수 효과를 맛볼수(?)있다.
반응형
'Data > Data Analysis' 카테고리의 다른 글
[Pyspark] pyspark Pipeline을 이용한 Data Normalizatioon (0) | 2021.04.20 |
---|---|
[Pyspark] 차원축소 pyspark.ml.feature의 PCA 사용 (0) | 2021.04.09 |
[Pyspark] 비어있는 dataframe만들기 (0) | 2021.01.18 |
[Pyspark] pyspark에서 percentile사용하기 (0) | 2020.12.10 |
[Pyspark] pyspark 파일 저장 coalesce함수가 시간이 오래걸릴때 (0) | 2020.11.24 |