TIL/개인공부
2022. 2. 14.
[Pyspark] Vector Column에서 값 가져오기
업무 관련 작업을 하다가 Vector형식의 Column에서 값을 가져오고싶은데 뜻대로 작동이 되지않았다. 찾아보니까 두가지 방법이 있는것같은데... 제일 간단한건 일단 https://spark.apache.org/docs/3.1.1/api/python/reference/api/pyspark.ml.functions.vector_to_array.html pyspark.ml.functions.vector_to_array — PySpark 3.1.1 documentation The data type of the output array. Valid values: “float64” or “float32”. spark.apache.org pyspark에 내장되어있는 vector_to_array함수를 사용하는것인데, ..