728x90
반응형
안녕하세요. 지난 포스팅의 기초통계학[32].귀무가설의 유의성 검정 5에서는 스튜던트 $t$ 분포와 스튜던트 $t$ 검정에 대해서 알아보았습니다. 이때, 스튜던트 $t$ 검정은 일표본 스튜던트 $t$ 검정과 이표본 스튜던트 $t$ 검정으로 나뉘는 것을 보았습니다. 그 중에서도 이표본 스튜던트 $t$ 검정에서의 핵심적인 가정은 두 표본의 분산 $\sigma_{x}$과 $\sigma_{y}$가 같다는 것이였습니다. 하지만, 같지 않은 경우도 있겠죠? 오늘은 이 경우에 대한 $t$ 검정인 웰치 $t$ 검정(Welch's $t$-test)과 데이터가 쌍으로 주어질 때 검정하는 대응 표본 $t$ 검정(The paired two-sampled $t$-test)에 대해서 알아보도록 하겠습니다.
1. 웰치 $t$ 검정(Welch's $t$-test)
이표본 스튜던트 $t$ 검정과는 다르게 웰치 $t$ 검정은 두 표본의 분산이 서로 다를 때 사용할 수 있는 유용한 도구입니다. 상황을 예로 들면, "고혈압 환자 그룹 $X$와 정상혈압 환자 그룹 $Y$ 사이의 콜레스테롤의 차이가 존재하는가?"라는 물음에 대해서 통계적인 해석을 부여할 수 있습니다. 이를 정리하면 아래와 같습니다.
- 데이터 : $x_{1}, x_{2}, \dots, x_{n}$과 $y_{1}, y_{2}, \dots, y_{m}$
- 가정 : 두 데이터 그룹이 독립적인 정규 표본입니다. 즉, 각 $i$와 $j$에 대해서 $x_{i} \sim {N(\mu_{x}, \sigma^{2}_{x})}$이고 $y_{j} \sim {N{\mu_{y}, \sigma^{2}_{y}}}$입니다. 이때, $\mu_{x}, \mu_{y}$는 모르는 값이고 서로 다를 수 있습니다. 그리고 $\sigma^{2}_{x}, \sigma^{2}_{y}$ 역시 모르는 값이고 서로 같다고 가정하지 않습니다.
- 귀무가설 $H_{0}$ : $\sigma^{2}_{x} = \sigma^{2}_{y}$. 이때, 귀무가설이 아닌 대립가설로도 쓰일 수 있습니다. 이 경우의 귀무가설은 $\sigma^{2}_{x} \neq \sigma^{2}_{y}$가 됩니다.
- 검정통계량 $t$ : $t = \frac{\bar{x} - \bar{y} - \mu_{0}}{s_{P}}$. 여기서, $s^{2}_{x}, s^{2}_{y}$가 각각 데이터 $x$와 $y$의 분산이라고 가정할 때 $s^{2}_{P}$은 풀링 표본 분산(pooled sample variance)라고 하며 $s^{2}_{P}=\frac{s^{2}_{x}}{n} + \frac{s^{2}_{y}}{m}$으로 정의됩니다.
- 귀무분포 $f(t|H_{0})$ : 확률변수 $T \sim {T(df)}$의 확률밀도 함수입니다. 여기서, 자유도 $df=\frac{(\frac{s^{2}_{x}}{n} + \frac{s^{2}_{y}}{m})^{2}}{\frac{(\frac{s^{2}_{x}}{n})^{2}}{(n-1)} + \frac{(\frac{s^{2}_{y}}{m})^{2}}{(m-1)}}$로 정의됩니다.
- $p$ 값 : 스튜던트 $t$ 검정과 완전히 동일합니다.
2. 대응 표본 $t$ 검정(The paired sample $t$-test)
이번에는 데이터가 쌍으로 주어질 때 $t$ 검정을 수행하는 방법에 대해서 알아보겠습니다.
- 데이터 : 표본 $x_1, x_2, \dots, x_n$와 표본 $y_1, y_2, \dots, y_n$는 서로 동일한 개수의 데이터를 가지고 있어야합니다.
- 가정 : $i$번째 데이터 사이의 차이 $w_i = x_i - y_i$가 알려지지 않은 모수 $\mu, \sigma^{2}$를 가지는 정규분포 $N(\mu, \sigma^{2})$를 따른다고 가정합니다.
- 주의점 : $w_i$에 대해서 일표본 스튜던트 $t$ 검정을 사용합니다.
- 귀무가설 $H_0$ : 특정 $\mu_0$에 대해서 $\mu=\mu_0$이다.
- 대립가설 $H_A$ : $\mu \neq \mu_0$ 또는 $\mu > \mu_0$ 또는 $\mu < \mu_0$
- 검정 통계량 $t$ : $t = \frac{\bar{w} - \mu_0}{s/\sqrt{n}}$. 이때, 표본 분산 $s^{2} = \frac{1}{n-1}\sum_{i=1}^{n}(w_i - \bar{w})^{2}$
- 귀무분포 $f(t|H_0)$ : 확률변수 $T \sim {t(n-1)}$의 확률밀도 함수입니다. 이때, 스튜던트 $t$ 분포는 자유도가 $n-1$입니다.
- $p$ 값 : 일표본 스튜던트 $t$ 검정과 동일합니다.
728x90
반응형
'수학 > 기초통계학' 카테고리의 다른 글
기초통계학[35].신뢰 구간 1 (0) | 2020.08.15 |
---|---|
기초통계학[34].베이즈 추론과 빈도주의 추론의 비교 (0) | 2020.08.06 |
기초통계학[32].귀무가설의 유의성 검정 5 (0) | 2020.07.28 |
기초통계학[31].귀무가설의 유의성 검정 4 (0) | 2020.07.21 |
기초통계학[30].귀무가설의 유의성 검정 3 (0) | 2020.07.17 |