안녕하세요. 지난 포스팅의 기초통계학[26].예측 구간에서는 사전 확률분포를 모를 때 합리적인 사전 확률분포를 선택하는 방법에 대해서 알아보았습니다. 물론 이는 굉장히 주관적인 내용을 담고 있기 때문에 개개인이 서로 다른 사전 확률분포를 선택할 수도 있다라는 것을 언급하였습니다. 지금까지는 베이지안 관점의 통계학을 알아보았습니다. 오늘부터는 빈도론자(Frequentist) 관점의 통계학을 알아보도록 하겠습니다.
사실 고등학교에서 배우는 통계학은 제가 기억하기로는 빈도론자 관점의 통계학일 것입니다. 대표적인 예시로 신뢰 구간, $p$ 값, $t$ 검정, $\chi^{2}$ 검정입니다. 하지만, 최근의 머신러닝에서는 고속 컴퓨팅에 있어서 베이지안 관점의 통계학을 적용하는 것이 일반화되고 있습니다. 오늘은 두 가지 관점의 통계학에 대해서 비교를 해보는 시간도 가져보겠습니다.
사실 두 관점의 통계학 모두 "확률"이라는 개념에서 시작됩니다. 베이지안 관점에서는 대표적으로 베이즈 정리, 즉 베이즈 공식에서 출발한 것을 기억하실 겁니다. 이는 사전 확률분포만 정확하게 알고 있다면, 언제든지 이 공식을 사용할 수 있음을 의미합니다. 지난 포스팅을 제대로 확인하셨다면 충분히 이해하실겁니다. 물론 사전 확률분포가 주어지지 않을 때는 합리적으로 선택하는 방법이 있었지만 그것이 정확한 것이 아닐수도 있기 때문에 사전 확률분포가 정확하게 주어질 때 사용하는 것이 더 안전할 수 있겠습니다.
하지만 지난 포스팅과 더불어 일반적인 경우에 사전 확률분포가 주어지는 것이 아님을 알 수 있었습니다. 왜냐하면 사람마다 생각하는 어떤 데이터의 사전 확률분포가 다를 수 있을 것이기 때문입니다. 예를 들어서 어떤 동전이 앞면이 나온다는 사전 확률분포는 아마도 대부분의 사람들이 0.5라고 생각할 것입니다. 그러나 평생 동전의 앞면이 나올 확률이 0.2 이 나오는 동전을 사용하는 나라의 사람이 생각할 때는 사전 확률분포는 0.2일 것입니다.
그럼에도 불구하고 저희는 데이터를 바탕으로 합리적인 추론을 하고 싶습니다. 그래서 베이지안 관점과 빈도론자 관점의 통계학은 아래 그림과 같이 서로 다른 행동을 취하게 됩니다.
베이지안 관점과 빈도론자 관점의 가장 큰 차이점은 사전 확률분포를 활용하는 지에 대한 여부입니다. 빈도론자 관점의 경우에는 사전 확률분포를 사용하지 않고 오직 우도(likelihood)로만 추론하게 됩니다. 이에 반해 베이지안 관점의 경우에는 지금까지 얻은 데이터를 통해서 회상의 결과를 유도하는 것을 알 수 있습니다.
위에서 언급했다싶이 베이지안 관점과 빈도론자 관점 모두 확률에서 출발한다고 하였습니다. 하지만 두 관점은 확률을 정의하는 방법에서도 약간의 차이점이 있습니다.
빈도론자의 경우에는 확률을 반복가능한 무작위 실험의 장기적인 빈도를 나타낸다고 하였습니다. 한 단어씩 해석해보면 반복가능하다는 것은 횟수에 제한받지 않고 무한번 반복할 수 있다는 것을 의미합니다. 무작위 실험이란 매 실험마다 무작위성이 개입되는 실험이라는 의미입니다. 즉, 실험을 수행하기 직전까지는 그 결과를 전혀 알 수 없고, 오직 실험이 종료되어야 그 결과를 알 수 있다는 것을 의미합니다. 마지막으로 장기적인 빈도란 앞에서 언급한 무작위 실험을 무한히 반복했을 때 얻을 수 있는 결과의 상대적인 빈도를 의미합니다. 쉬운 말로 풀어서 써보면 실험을 수행하기 직전까지 결과를 예측할 수 없는 실험을 무한번 반복했을 때 결과의 상대적인 빈도인 것입니다.
예를 들어서 생각해보겠습니다. 빈도론자 입장에서 동전의 앞면이 나올 확률이 0.5라는 의미는 동전을 무한히 던졌을 때 앞면이 나온다는 그 결과의 빈도가 0.5에 수렴해가는 것입니다.
빈도론자 관점의 확률이 의도하는 것은 확률 분포의 모수를 고정된 값으로 두는 것이 중요하지 않다는 것을 의미합니다. 그에 반해 베이지안 관점에서는 확률 분포의 모수를 추정한 뒤 그 모수가 얼마나 신뢰도를 갖는 지 계산하는 과정까지 거쳐야만 했습니다. 빈도론자 관점은 이를 거부한다는 것이죠.
오늘은 빈도론자 관점의 통계학과 베이지안 관점의 통계학 사이의 간단한 비교를 해보았습니다. 다음 포스팅부터는 본격적으로 빈도론자 관점의 통계학을 더 자세히 알아보도록 하겠습니다.
'수학 > 기초통계학' 카테고리의 다른 글
기초통계학[29].귀무가설의 유의성 검정 2 (0) | 2020.07.16 |
---|---|
기초통계학[28].귀무가설의 유의성 검정 1 (0) | 2020.07.14 |
기초통계학[26].예측 구간 (0) | 2020.07.10 |
기초통계학[25].공액 사전 확률분포 선택 (0) | 2020.06.30 |
기초통계학[24].공액 사전 확률분포 2 (0) | 2020.04.27 |