안녕하세요. 지난 포스팅의 기초통계학[32].귀무가설의 유의성 검정 5에서는 스튜던트 $t$ 분포와 스튜던트 $t$ 검정에 대해서 알아보았습니다. 이때, 스튜던트 $t$ 검정은 일표본 스튜던트 $t$ 검정과 이표본 스튜던트 $t$ 검정으로 나뉘는 것을 보았습니다. 그 중에서도 이표본 스튜던트 $t$ 검정에서의 핵심적인 가정은 두 표본의 분산 $\sigma_{x}$과 $\sigma_{y}$가 같다는 것이였습니다. 하지만, 같지 않은 경우도 있겠죠? 오늘은 이 경우에 대한 $t$ 검정인 웰치 $t$ 검정(Welch's $t$-test)과 데이터가 쌍으로 주어질 때 검정하는 대응 표본 $t$ 검정(The paired two-sampled $t$-test)에 대해서 알아보도록 하겠습니다. 1. 웰치 $t$ 검정..
안녕하세요. 지난 포스팅인 기초통계학[31].귀무가설의 유의성 검정 4에서는 $z$ 검정에 대해서 알아보았습니다. 오늘은 스튜던트 $t$ 검정에 대해서 알아보도록 하겠습니다. 하지만 스튜던트 $t$ 검정을 배우기 위해서 알아야하는 스튜던트 $t$ 분포부터 배우고 넘어가도록 하겠습니다. 여기서 $t$ 분포 앞에 붙은 "스튜던트"는 해당 분포를 제시한 윌리엄 고셋의 필명을 따서 지었습니다. 윌리엄 고셋은 양조장에서 일했다고 합니다. 그 이름도 유명한 기네스였습니다!! 양조장에서 맥주를 만들 때 사용되는 "홉"의 이상적인 비율을 알아내기 위해서 윌리엄 고셋이 직접 분포를 만들었습니다. 하지만, 자신의 이름으로 이와 관련된 논문을 학계에 내고자 했으나 기네스 측에서는 이를 받아주지 않았다고 합니다. 다만, ‘연..
안녕하세요. 오늘은 윈도우 10 환경에서 깃을 설치하는 방법에 대해서 알아보겠습니다. 깃(git)은 현재 수많은 개발자들이 활용하고 있는 오픈소스 버전 관리 사이트입니다. 먼저, Git SCM에 접속하면 자신의 환경에 맞는 깃 설치파일을 다운로드 해야합니다. 아래의 사진을 참고하시길 바랍니다. 빨간색 네모 박스가 쳐진 부분을 보면 가장 최근 버전은 2.270 버전이고, 2020년 6월 1일에 릴리즈 되었다는 것을 알 수 있습니다. 그리고 그 하단에는 Windows를 위한 2.27.0 버전이라고 적혀있네요!! 그러면 이 버전을 다운로드하면 될 거 같습니다. 저 박스를 클릭하면 자동으로 설치파일이 다운로드 됩니다. 만약, 자동으로 설치되지 않는다면 아래의 빨간색 박스를 클릭해서 수동으로 설치해주면 됩니다. ..
안녕하세요. 지난 포스팅의 기초통계학[32].귀무가설의 유의성 검정 3에서는 NHST를 설계하는 방법과 임계치, $p$ 값라는 개념에 대해서 설명하였습니다. 여기서 NHST를 설계하는 과정에서 검정 통계량이라는 것을 미리 정한다고 하였습니다. 이때 검정 통계량에 따라서 불리는 이름이 각각 $t$ 검정, $z$ 검정 이라고 하였습니다. 만약 검정 통계량을 표본의 합으로 정의한 다면 $t$ 검정이라고 하고, 표본 평균으로 정의한다면 $z$ 검정이라고 하였습니다. 오늘은 $z$ 검정에 대해서 자세히 알아보도록 하겠습니다. 사실 지난 포스팅의 마지막 즈음에 $z$ 검정을 활용하여 NHST를 설계하고 귀무가설 $H_{0}$를 기각하는 과정을 학습하였습니다. 그러므로 $z$ 검정은 간단하게 복습과 예제를 통해서 알..
안녕하세요. 이전 포스팅에서는 윈도우나 우분투에서 아나콘다를 설치하는 방법에 대해서 알아보았습니다. 그리고 가상환경을 만들고 커널을 연동하는 방법까지 알아보았습니다. 오늘은 별로 어렵지는 않습니다. 아나콘다에서 중요한 명령어 몇 가지를 정리하도록 하겠습니다. "conda --version" conda의 현재 버전을 확인하는 명령어입니다. "conda update conda" conda를 최신 버전으로 업데이트하는 명령어입니다. "conda install 설치할 라이브러리 이름" 라이브러리를 설치하는 명령어입니다. 이때, scikit-learn과 같이 설치할 라이브러리의 이름은 실제 설치할 때의 명령어와 다를 수 있습니다. 그러므로 conda install sklearn으로 먼저 구글에 검색해본 다음에 아..
안녕하세요. 오늘은 윈도우 10에서 우분투 설치하는 방법에 대해서 알아보도록 하겠습니다. 우분투란 리눅스 계열의 OS를 말합니다. 현대에는 굉장히 많은 OS가 있습니다. 윈도우, UNIX, 리눅스, 우분투, 레드햇, 데비안 등등... 이들 중에서 윈도우를 제외하고는 UNIX에서 시작된 OS입니다. UNIX는 굉장히 오래된 OS이지만 UNIX로부터 엄청나게 많은 다른 OS들이 파생되었습니다. 대표적으로 리눅스, 우분투, 레드햇, 데비안 등이 있습니다. 여기서 윈도우 10부터 우분투 설치를 지원하기 시작했기 때문에 평소에 우분투를 자주 사용하는 저로써는 매우 좋은 기능이라고 생각합니다. 그래서 오늘은 제 노트북에 우분투를 설치해보도록 하겠습니다. 오늘 포스팅은 반드시 윈도우 10 최신버전으로 해주시길 바랍니..
안녕하세요. 지난 포스팅의 기초통계학[29].귀무가설의 유의성 검정 2에서는 중요한 NHST를 실제 사례에 적용하기 위한 중요한 개념들을 알아보았습니다. 오늘은 실제로 NHST를 설계하는 방법에 대해서 알아보도록 하겠습니다. 1. NHST 설계하기 NHST를 설계하는 방식은 아래의 과정을 거칩니다. 귀무가설 $H_{0}$를 정합니다. 이 과정에서는 수학적인 언어는 아니더라도 대략적인 귀무가설 $H_{0}$와 대립가설 $H_{A}$를 정합니다. 예를 들면, 귀무가설은 "동전은 공평하다.", 대립가설은 "동전은 공평하지 않다."라고 정할 수 있습니다. $H_{A}$를 꼬리가 하나인 경우로 생각할 것인지(one-tailed), 꼬리가 양쪽으로 2개인 경우로 생각할 것인지(two-tailed) 결정합니다. 예를..