본문 바로가기

Data/Data Statistics

[통계학] 가중평균(Weighted Average)

반응형

이번에 특정 지표를 제작할때, 전 팀장님께서 만들어두신 수식이 이해가안되서

부득이하게 이직하신 전팀장님에게 연락을 드려서 여쭤보았다...

결국엔 사용한 공식은 가중평균이였다.

 

평균을 산정하는데에는 두가지가 있는데

- 일반적으로 우리가 흔히 알고있는 "단순평균" 이 있고

- 이번 글에서 정리할 "가중평균"이 있다

 

자 그럼 두개가 어떤 차이가 있는지 알아보자. 만일 다음과같이 데이터가 있고. 속도위반기준이 110m/s라고 했을때.

차량속도 주행시간
100m/s 5s
130m/s 1s

 

차량속도의 단순평균의 값은 다음과 같이 계산할수있다

- (100m/s + 130m/s)/2 = 115m/s

단순평균으로 산정된 값은 115m/s로 속도위반이 되어버린다.

 

하지만 단순히 짧은 시간의 130m/s로 1분간 주행을 했다고 속도위반에 걸린다면 운전자 입장에선 굉장히 억울할것같다.

따라서 해당 평균값은 가중평균을 사용하는것이 더 바람직하다. 다음과같이 계산이 가능하다.

- (100m/s * 5s + 130m/s * 1s) / (5s + 1s) = 105m/s

 

가중평균으로 산정된 차량의 평균값은 105m/s으로 속도위반이 걸리지않는다.

 

위와같이 어떤 특정상황에서 극소수의 샘플수때문에 평균값이 망가질경우, 가중평균을 사용하여 정확한 평균값을 산정한다.

반응형