Data/Data Analysis
2019. 1. 11.
[Pyspark] pyspark 함수 정리(2)
drop(*cols) dataframe에서 지우고싶은 column이 있을때 해당 함수를 사용한다. 반환되는 값은 삭제가된 이후의 dataframe이 나오게 된다 1234567891011121314>>> df.drop('age').collect()[Row(name='Alice'), Row(name='Bob')] >>> df.drop(df.age).collect()[Row(name='Alice'), Row(name='Bob')] >>> df.join(df2, df.name == df2.name, 'inner').drop(df.name).collect()[Row(age=5, height=85, name='Bob')] >>> df.join(df2, df.name == df2.name, 'inner').drop(..