모비율의 추정

어떤 선거입후보자의 지지율이나, 정책에 대한 찬성율, 제품의 불량률 등 모집단의 비율에 대해 관심을 둔다면 역시 표본을 뽑아 조사하여 모비율을 추정할 수 있다.

이항 분포를 하는 확률 변수 X에 대해 표본을 뽑아 측정한 표본 비율은 \hat{p} = \frac{X}{n}으로 표시한다. (이때 모비율은 p로 표시한다.) 즉 n개의 실험에서 성공 횟수가 X회 발생했다면 이 비율을 표본 비율로 보는 것이다. 이때 n이 충분히 크면 (np >= 5 이며 n(1 – p) >= 5) 표본 비율의 분포는 정규 분포에 가까워진다. 따라서 표본 비율의 분포는 다시 표준정규분포로 나타낼 수 있으며, 이때 표준 정규 변수Z는 다음과 같이 표현된다.

Z = \frac{\hat{p} - p}{\sqrt{p(1 - p) / n}}

그런데 표본비율의 표준오차인 \sqrt{p(1-p)/ n}에는 우리가 알지 못하는 모비율이 있기 때문에 이 공식은 사용할 수 없다. 하지만 표본의 크기만 충분히 크다면 모비율 대신 표본비율 \hat{p}를 사용할 수 있다.

예제

어느 선거입후보자에 대한 지지율을 조사하기 위해 500명을 대상으로 표본 조사하였더니, 그 중 지지하겠다는 응답자가 98명이었다. 이 후보에 대한 모비율을 95% 신뢰구간에서 구하라.

표본비율은 98 / 500 = 0.196 이다. 이 때 np, n*(1 – p)는 각 98과 402로 표본 비율을 사용하여 모비율을 추정할 수 있다. 표준 오차는 \sqrt{\frac{p (1 - p)}{n}} = 0.01775로 계산된다. 95% 신뢰구간은 0.196 ± 1.96 * 0.018 로 계산할 수 있다.

예제 2

대학생 325명을 대상으로 한 달에 1회 이상 병원에 가는 학생을 조사하였더니 25명이었다. 99% 신뢰수준에서 모비율을 추정하라.

표본 비율은 0.077 이며,(p * n, (1 – p) * n)은 (25, 300) 으로 표본이 충분히 크므로, 표본 비율을 사용하여 추정할 수 있다. 표준 오차는 0.0148로 계산되므로 99% 신뢰구간은 0.0775 ± 2.58 * 0.0148로 [0.0388, 0.1150] 구간이다.

Read more

워드프레스에서 고스트로 이전

워드프레스에서 고스트로 이전

이 글을 쓰면서도 믿기 힘든 사실인데, 블로그라는 걸 처음 시작한지가 20년이 되었습니다. 이글루스에서 처음 시작했다가, SK컴즈가 인수한다고 발표함과 동시에 워드프레스로 플랫폼을 옮겼죠. 워드프레스오 옮긴 이후에는 호스팅 환경을 이리 저리 옮기긴 했지만 거의 18년 가까이 워드프레스를 사용해온 것 같습니다. 그 동안 워드프레스는 블로깅 툴에서 명실상부한 범용CMS로 발전했습니다. 사실 웬만한 홈페이지들은 이제

By sooop
띄어쓰기에 대한 생각

띄어쓰기에 대한 생각

업무 메일을 쓸 때 가장 많이 쓰는 말 중에 하나가 메일 말미에 ‘업무에 참고 부탁 드립니다.‘인데요, 어느 날부터 아웃룩에서 이 ‘부탁 드립니다’가 틀렸다고 맞춤법 지적을 하기 시작했습니다. 맞는 말은 ‘부탁드립니다’라고 붙여 쓰는 거라고. 사실 아래아한글 시절부터 이전의 MS워드까지, 워드프로세서들의 한국어 맞춤법 검사 실력은 거의 있으나 마나 한

By sooop

구글 포토에서 아이클라우드로 탈출한 후기

한 때 구글 포토가 백업 용량을 무제한으로 제공해 주겠다고해서, 구글 포토를 사용해서 사진을 백업해왔습니다. 물론 이 이야기의 결말은 저나 이 글을 읽고 있는 여러분이나 모두 알고 있습니다. 사실 AI에게 학습 시킬 이미지 데이터를 모으기 위한 것일 뿐이라거나 하는 이야기는 그 당시에도 있었습니다만, 에이 그래도 구글인데 용량은 넉넉하게 주겠지…하는 순진한

By sooop

Julia의 함수 사용팁

연산자의 함수적 표기 Julia의 연산자는 기본적으로 함수이며, 함수 호출 표기와 같은 방식으로 호출하는 것이 가능합니다. 또한 그 자체로 함수이기 때문에 filter(), map() 과 같이 함수를 인자로 받는 함수에도 연산자를 그대로 적용하는 것이 가능합니다. 특히 + 연산자는 sum() 함수와 같이 여러 인자를 받아 인자들의 합을 구할 수 있습니다. 2 + 3 # = 5 +(2,

By sooop