TIL/잡다한

[Pyspark] pandas dataframe to pyspark dataframe

재융 2019. 1. 18. 11:58
반응형


Sometimes we have to change pandas.dataframe to pyspark.dataframe

there one solution exist


1
2
3
4
5
from pyspark.sql import SQLContext
 
temp_csv = pd.read_csv("./tmep.csv")
 
temp_pyspark = sqlContext.createDataFrame(temp_csv)




20200304

가끔 위 방법이 안될때가 있어서 새로운 방법 추가


1
2
3
4
5
temp_csv = pd.read_csv("./tmep.csv")

temp_pyspark = spark.createDataFrame(temp_csv)


반응형