Data/Data Analysis
2019. 11. 26.
[Statistics] 통계학 공부 2
상관관계 머신러닝(딥러닝)에서 중요한 feature를 찾을때 자주사용하는 단어, x가 큰 값을 가지면 y도 큰 값을 갖고, x가 작은 값을 가지면 y도 작은 값을가질때 x와 y는 서로 양의 상관관계를 갖는다고 말함. x와 y가 반비례일때 음의 상관관계를 갖는다고 말함. - 상관계수는 -1 ~ +1 사이 값을 가진다 temp라는 pandas.dataframe의 각 column별 상관관계를 계산하고 싶을때 다음과 같이 corr함수를 쓰면 알수가 있다. temp.corr() 여기서는 기본적으로 피어슨 상관계수(Pearson's Correlation)를 이용해서 계산한다. 두개 feature의 관계를 가장 잘표현하는건 산점도(scatterplot)를 그려보는것, 단순하게 x, y축으로 두개의 값을 점으로 표시해..