반응형
본 내용은 DataCamp에서 배운내용을 간단하게 정리한 내용입니닷
- replace 함수
NaN 이 들어가있는 column에 대해서 특정 값으로 바꾸고싶을 때 자주사용하는 함수
temp.replace([8], np.nan, inplace=True)
NaN이 들어가있는 index에 대해서 8로 대체
또 다른방법으로는 fillna함수를 사용
temp['target_column'].fillna(8)
- value_counts 함수
특정 column에 대해서 값을 가지고있는 행을 count하는 함수
temp['target_column'].value_counts()
- describe 함수
특정 column에 대해서 통계를 내줌 (raw count, min, max, mean, 4분위수등)
temp['target_column'].describe()
반응형
'Data > Data Analysis' 카테고리의 다른 글
[Statistics] 통계학 공부 (0) | 2019.11.25 |
---|---|
[Pandas] DataCamp - Histogram, filter data (0) | 2019.11.25 |
[Pyspark] UDF함수에서 return 을 list형식으로 하고싶을 때 (0) | 2019.11.15 |
[Pyspark] sorted와 sort 의 차이 (2) | 2019.11.14 |
[Pyspark] pyspark 로컬에 설치 (1) | 2019.10.19 |