우리가 측정하고자 하는 집단의 전체를 모집단이라고 한다. 모집단은 대한민국 전체 인구가 될 수 있고, 전세계의 인구가 모두가 될 수 있다. 하지만 대한민국 전체 인구를 다 조사하기는 어렵기 대문에 모집단을 대상으로 연구를 진행하기가 어렵다. 따라서 표본을 추출하여 조사를 하고 이를 통해 모집단을 예상한다.
모집단에서 표본을 무작위로 추출하게 되는데, 다양한 경우의 수의 표본을 추출할 수 있다. 평균이 u이고 표준편차가 $\sigma$인 모집단이 있다고 생각해보자. 모집단에서 무작위로 n명을 추출하여 표본1을 설정하고 평균1과 표준편차1을 구할 수 있다. 또한 무작위로 n명을 추출하여 표본2를 설정하고 평균2와 표준편차2를 구할 수 있다. 마찬가지로 무작위로 n명을 추출하여 표본3을 추출하여 평균3과 표준편차3을 구할 수 있다. 이런식으로 모집단에서 무작위로 무수히 많은 표본을 추출하여 평균과 표준편차를 구할 수 있다.
여기서 중심극한정리에 따르면 다음과 같은 사항이 성립된다.
모집단에서 추출한 표본들의 평균[평균1, 평균2, 평균3, ......]의 분포를 살펴 보면 정규분포를 가지게 된다.
그리고 표본 평균[평균1, 평균2, 평균3, ......]들의 평균은 모집단의 평균[u]과 같다.
표본 평균들의 표준편차는 $\frac{\sigma}{\sqrt{n}}$이다.
모집단의 평균이 100, 표준편차가 10인 집단이 있다. 여기서 100명의 표본을 추출하여 표본 집단을 만든다. 그러면 추출한 표본 집단들의 평균들은 정규분포를 이루게 된다. 그리고 표본 집단의 평균은 모집단의 평균과 같이 100이 된다. 그리고 표본 집단의 표준편차는 10/$\sqrt{100}$이므로 1이 된다.
'기초 통계학 공부' 카테고리의 다른 글
Z-score 의미, 공식 (0) | 2024.01.17 |
---|
댓글