Data/Data Analysis
2020. 3. 6.
[Statistics] 회귀와 예측
용어 정리 응답변수(반응변수) - 예측하고자 하는 변수 독립변수 - 응답치를 예측하기 위해 사용되는 변수 레코드 - 한 특정 경우에 대한 입력과 출력을 담고 있는 벡터 절편 - 회귀직선의 절편. 즉, X=0일 때 예측값 회귀계수 - 회귀직선의 기울기 적합값 - 회귀선으로부터 얻은 추정치 (예측값) 잔차 - 관측값과 적합값의 차이 (오차) 최소제곱 - 잔차의 제곱합을 최소화하여 회귀를 피팅하는방법 (보통최소제곱) 회귀식 책에는 글이 너무많아서 대충 정리 Y = aX + b b - 절편 a - 회귀계수 (기울기) Y - 응답변수 또는 종속변수 (머신러닝분야에선 목표벡터) X - 독립변수 혹은 예측변수 (머신러닝분야에선 피처벡터) 적합값과 잔차 회귀분석에서 중요한 개념은 적합값과 잔차. 보통 모든 데이터가 정..