반응형
이번에 특정 지표를 제작할때, 전 팀장님께서 만들어두신 수식이 이해가안되서
부득이하게 이직하신 전팀장님에게 연락을 드려서 여쭤보았다...
결국엔 사용한 공식은 가중평균이였다.
평균을 산정하는데에는 두가지가 있는데
- 일반적으로 우리가 흔히 알고있는 "단순평균" 이 있고
- 이번 글에서 정리할 "가중평균"이 있다
자 그럼 두개가 어떤 차이가 있는지 알아보자. 만일 다음과같이 데이터가 있고. 속도위반기준이 110m/s라고 했을때.
차량속도 | 주행시간 |
100m/s | 5s |
130m/s | 1s |
차량속도의 단순평균의 값은 다음과 같이 계산할수있다
- (100m/s + 130m/s)/2 = 115m/s
단순평균으로 산정된 값은 115m/s로 속도위반이 되어버린다.
하지만 단순히 짧은 시간의 130m/s로 1분간 주행을 했다고 속도위반에 걸린다면 운전자 입장에선 굉장히 억울할것같다.
따라서 해당 평균값은 가중평균을 사용하는것이 더 바람직하다. 다음과같이 계산이 가능하다.
- (100m/s * 5s + 130m/s * 1s) / (5s + 1s) = 105m/s
가중평균으로 산정된 차량의 평균값은 105m/s으로 속도위반이 걸리지않는다.
위와같이 어떤 특정상황에서 극소수의 샘플수때문에 평균값이 망가질경우, 가중평균을 사용하여 정확한 평균값을 산정한다.
반응형
'Data > Data Statistics' 카테고리의 다른 글
[Outlier Detection] Outlier 탐지를 위한 몇가지 알고리즘 (0) | 2020.12.11 |
---|