안녕하세요. 오늘은 지난 시간의 기초통계학[8].연속확률변수의 분포(https://everyday-image-processing.tistory.com/15)에 이어서 연속확률변수를 조작하는 법에 대해서 알아보겠습니다.
1. 연속확률변수의 조작
이산확률변수의 기댓값과 분산의 성질에서 $Y=aX+b$일 때 $E(Y)=aE(X)+b$와 $Var(Y)=a^{2}Var(X)$임을 알았습니다. 그렇다면 연속확률변수에서 $Y$의 확률 밀도함수는 어떤 것일까요?
이산확률변수에서는 확률변수를 조작하는 경우 확률 분포 표를 그려 해결하였지만 연속확률변수에서는 표를 그릴수가 없습니다. 따라서 미적분학을 통해서 해결해야합니다.
지난 시간의 cdf의 특성을 기억해봅시다.
1. $F_{X}(x)=P(X \le x)$
2. $f_{X}(x)=F_{X}(x)$
성질을 보시면 알겠지만 변형된 연속확률변수의 pdf를 구하기 위해서는 먼저 cdf를 구한다음 미분을 해야합니다.
간단한 예제인 균등 분포를 통해 확인해보겠습니다!
$X \sim {\sf U}(0, 2)$일 때 $f_{X}(x)=\frac{1}{2}$이고 $F_{X}(x)=\frac{x}{2}$인 것을 이제 다들 아실겁니다. 그렇다면 $ Y=X^{2}$일 때 $Y$의 pdf와 cdf는 무엇일까요?
먼저, $Y$의 범위부터 정해야합니다! $Y=X^{2}$이므로 $[0, 4]$의 범위인 것은 쉽게 알 수 있습니다. 이제부터는 기계적으로 구할 수 있습니다.
그 다음으로 정의에 따라서 $Y$의 cdf를 구합니다.
$$F_{Y}(y)=P(Y \le y)=P(X^{2} \le y)=P(X \le \sqrt{y})=F_{X}(\sqrt{y})=\frac{\sqrt{y}}{2}$$
마지막으로 pdf를 구하기 위해 $F_{Y}(y)$를 미분합니다.
$$f_{Y}(y)=\frac{d}{dy}F_{Y}(y)=\frac{1}{\sqrt{4y}}$$
위와 같은 단계로 cdf와 pdf를 구할 수 있습니다.
또는 더 간단한 방법으로 구할 수 있습니다.
$$y=x^{2} \Rightarrow dy=2xdx \Rightarrow dx=\frac{dy}{2\sqrt{y}}$$
$$f_{X}(x)=\frac{dx}{2}=\frac{dy}{4\sqrt{y}}=f_{Y}(y)$$
이러한 방법을 'change of variable'이라고 합니다!
Ex1. $X \sim {\sf exp}(\gamma)$일 때 $x \in [0, \infty]$에서 $f_{X}(x)=\gamma e^{-\gamma x}$임을 알고 있습니다. $Y=X^{2}$의 cdf와 pdf를 구하시오
Answer
$x \in [0, \infty]$이기 때문에 $y \in [0, \infty]$이고 $F_{X}(x)=1-e^{-\gamma x}$입니다.
먼저 cdf를 구합니다.
$$F_{Y}(y)=P(Y \le y)=P(X^{2} \le y)=P(X \le \sqrt{y})=F_{X}(\sqrt{y})=1-e^{-\gamma \sqrt{y}}$$
그다음으로 pdf를 구합니다.
$$f_{Y}(y)=\frac{d}{dy}F_{Y}(y)=\frac{\gamma}{2\sqrt{y}}e^{-\gamma \sqrt{y}}$$
정규 분포의 경우 아쉽게도 공식화된 cdf가 없기 때문에 위의 방법으로는 해결할 수 없습니다.
기초통계학[10].연속확률변수의 기댓값, 분산, 표준편차 그리고 분위수(https://everyday-image-processing.tistory.com/16)
'수학 > 기초통계학' 카테고리의 다른 글
기초통계학[11].중심극한정리와 큰 수의 법칙 (0) | 2020.03.19 |
---|---|
기초통계학[10].연속확률변수의 기댓값, 분산, 표준편차 그리고 분위수 (0) | 2020.03.18 |
기초통계학[8].연속확률변수의 분포 (1) | 2020.03.16 |
기초통계학[7].연속확률변수 (0) | 2020.03.14 |
기초통계학[6].이산확률변수의 분산 (0) | 2020.03.13 |