반응형
dataframe에 없고 내가 원하는 값만 들어가는 column을 생성하고 싶을때는
pyspark.sql.functions의 lit함수를 사용하면 간단하게 추가할수가 있다
예제는 다음과 같다
1 2 3 4 5 6 7 8 | >>> from pyspark.sql.functions import lit >>> df1.withColumn('manager1',lit('x1')).show() +--------+--------+ |manager1|manager2| +--------+--------+ | x1| value2| | x1| value4| +--------+--------+ |
반응형
'Data > Data Science' 카테고리의 다른 글
[LightGBM] save model, load model방법 (0) | 2019.03.05 |
---|---|
[LightGBM] 알고리즘 설명(임시) (0) | 2019.03.04 |
[Pyspark] Pyspark dataframe isin 과 is not in 방법 (0) | 2019.02.18 |
[SQL] Coalesce 함수를 이용한 NULL값 처리 (0) | 2019.01.21 |
[Pytorch] CrossEntropy, BCELoss 함수사용시 주의할점 (0) | 2018.11.07 |