반응형
기준선을 정하려고 전체 데이터의 describe함수를 사용해보았는데
사실 count, mean, std, min 밖에 잘안보았다.
근데 이번에 기준선을 정할때 describe함수를 이용하면 좋다고 얘기를들어서 밑에 25%, 50%, 75%가 무엇인지 찾아보았고
이것들은 통계쪽에서 4분위수 라고 부르는것들이였다
즉, 25% 라는 뜻은 25%의 데이터들이 해당 값보다 낮다 라고 이해하면 될꺼같다.
반응형
'Data > Data Science' 카테고리의 다른 글
[ML] Semi-Supervised Learning (label_propagation) (0) | 2019.11.01 |
---|---|
[LSTM] 단계별 수식 정리 (0) | 2019.09.23 |
[인터뷰] 머신러닝 인터뷰 질문 모음(영어) (0) | 2019.07.11 |
[Pyspark] pyspark to_csv() ascii에러 문제 해결 (0) | 2019.07.03 |
[Pandas] insert 함수이용하기 (0) | 2019.06.07 |