Wireframe

모비율의 추정

어떤 선거입후보자의 지지율이나, 정책에 대한 찬성율, 제품의 불량률 등 모집단의 비율에 대해 관심을 둔다면 역시 표본을 뽑아 조사하여 모비율을 추정할 수 있다.

이항 분포를 하는 확률 변수 X에 대해 표본을 뽑아 측정한 표본 비율은 으로 표시한다. (이때 모비율은 로 표시한다.) 즉 n개의 실험에서 성공 횟수가 X회 발생했다면 이 비율을 표본 비율로 보는 것이다. 이때 n이 충분히 크면 (np >= 5 이며 n(1 – p) >= 5) 표본 비율의 분포는 정규 분포에 가까워진다. 따라서 표본 비율의 분포는 다시 표준정규분포로 나타낼 수 있으며, 이때 표준 정규 변수Z는 다음과 같이 표현된다.

그런데 표본비율의 표준오차인 에는 우리가 알지 못하는 모비율이 있기 때문에 이 공식은 사용할 수 없다. 하지만 표본의 크기만 충분히 크다면 모비율 대신 표본비율 를 사용할 수 있다.

예제

어느 선거입후보자에 대한 지지율을 조사하기 위해 500명을 대상으로 표본 조사하였더니, 그 중 지지하겠다는 응답자가 98명이었다. 이 후보에 대한 모비율을 95% 신뢰구간에서 구하라.

표본비율은 98 / 500 = 0.196 이다. 이 때 np, n*(1 – p)는 각 98과 402로 표본 비율을 사용하여 모비율을 추정할 수 있다. 표준 오차는 로 계산된다. 95% 신뢰구간은 0.196 ± 1.96 * 0.018 로 계산할 수 있다.

예제 2

대학생 325명을 대상으로 한 달에 1회 이상 병원에 가는 학생을 조사하였더니 25명이었다. 99% 신뢰수준에서 모비율을 추정하라.

표본 비율은 0.077 이며,(p * n, (1 – p) * n)은 (25, 300) 으로 표본이 충분히 크므로, 표본 비율을 사용하여 추정할 수 있다. 표준 오차는 0.0148로 계산되므로 99% 신뢰구간은 0.0775 ± 2.58 * 0.0148로 [0.0388, 0.1150] 구간이다.

Exit mobile version