안녕하세요. 오늘은 지난 시간의 기초통계학[20].베이즈 추론 4(https://everyday-image-processing.tistory.com/39)에 이어서 이후에 중요하게 쓰이는 연속 확률분포인 베타 분포에 대해서 알아보겠습니다.
일단 베타 분포 $beta(a, b)$는 2개의 모수($a$, $b$)를 가지는 분포입니다. 이때 베타 분포의 정의역은 $[0, 1]$입니다. 확률 밀도함수는 아래와 같습니다.
$$f(\theta)=\frac{(a+b-1)!}{(a-1)!(b-1)!}\theta ^{a-1}(1-\theta)^{b-1}$$
지금보면 굉장히 복잡하고 이게 어디에 쓰일 지 감이 안오는 분포이지만 이후 포스팅에서 요긴하게 쓰입니다. 이번 포스팅에서는 베타 분포를 간단하게 설명만하고 넘어가도록 하겠습니다.
먼저, 베타분포에서 눈여겨볼만한 부분은 분포의 정의역입니다. 분포의 정의역이 현재 $[0 , 1]$사이로 정해져있는 데 이는 곧 이후에 베타분포가 어떤 확률을 모델링이 될 수 있음을 암시합니다.
그리고 베타분포의 계수부분이 상당히 복잡한데 이를 간단하게 쓰기 위해서 $c = \frac{(a+b-1)!}{(a-1)!(b-1)!}$이라고 하겠습니다. 그러면 $f(\theta)=c\theta^{a-1}(1-\theta)^{b-1}$로 쓸 수 있습니다. 그 상태에서 계수의 뒷부분을 보면 이산 확률분포에서 봤던 이항분포의 구조를 가지고 있음을 볼 수 있습니다. 다만 이항분포의 경우 모수가 1개만 있었지만 베타분포의 경우 모수가 2개가 있습니다.
마지막으로 베타분포의 가장 중요한 특징은 사전 확률분포와 사후 확률분포가 동일하다는 점에 있습니다. 이 경우 공액 사전확률(Conjugate priors)이라고 말합니다. 이 특징은 다음 절에 계속 쓰이니 이 특징은 꼭 알아두셔야합니다.
'수학 > 기초통계학' 카테고리의 다른 글
기초통계학[23].공액 사전 확률분포 1 (0) | 2020.04.22 |
---|---|
기초통계학[22].베이즈 추론 5 - 연속 사전확률과 연속 데이터를 가지는 경우에 대하여 (0) | 2020.04.17 |
기초통계학[20].베이즈 추론 4 - 연속 사전확률을 가지는 경우에 대하여 (0) | 2020.04.12 |
기초통계학[19].베이즈 추론 3 - 오즈(Odds) (0) | 2020.04.09 |
기초통계학[18].베이즈 추론 2 - 확률론적 예측 (0) | 2020.04.06 |