본문 바로가기

Data/Data Analysis

[Pandas] Datacamp - Clean a variable

반응형

본 내용은 DataCamp에서 배운내용을 간단하게 정리한 내용입니닷

 

- replace 함수

NaN 이 들어가있는 column에 대해서 특정 값으로 바꾸고싶을 때 자주사용하는 함수

temp.replace([8], np.nan, inplace=True)

NaN이 들어가있는 index에 대해서 8로 대체

 

또 다른방법으로는 fillna함수를 사용

temp['target_column'].fillna(8)

 

- value_counts 함수

특정 column에 대해서 값을 가지고있는 행을 count하는 함수

temp['target_column'].value_counts()

- describe 함수

특정 column에 대해서 통계를 내줌 (raw count, min, max, mean, 4분위수등)

temp['target_column'].describe()

 

 

반응형