Data/Data Analysis
2019. 1. 15.
[Pyspark] pyspark 함수 정리(3)
select(*cols) Dataframe column선택하여 해당 column을 출력123456>>> df.select('*').collect()[Row(age=2, name='Alice'), Row(age=5, name='Bob')]>>> df.select('name', 'age').collect()[Row(name='Alice', age=2), Row(name='Bob', age=5)]>>> df.select(df.name, (df.age + 10).alias('age')).collect()[Row(name='Alice', age=12), Row(name='Bob', age=15)] selectExpr(*expr)select와 기능은 같지만 추가적인 산술, SQL식 언어를 위해서 사용하는 함수 12..