Data/Data Analysis
2020. 4. 29.
[SQL] ROW_NUMBER(), LEAD(), LAG()
설명전에 해당 sql은 pyspark.sql 이라는 점 확인! row_number() - 행 번호 매겨주는 sql함수 LEAD() - 다음 행 값을 가져오는 sql 함수 LAG() - 이전 행 값을 가져오는 sql 함수 아래와 같은 테이블이 있을때 (shot) user timestamp shot_id jaeyung 12:34:54 123 jaeyung 12:45:34 234 jaeyung 12:50:55 456 seung 12:55:23 334 seung 13:01:34 523 seung 13:12:43 646 1. row_number() spark.sql(""" select user, timestamp, shot_id, row_number() over(partition by user order by t..