모분산의 신뢰구간 추정

공장에서 생산하는 제품에는 품질 기준이 존재하고, 제조 공정에서 생산되는 제품의 규격은 어느 정도 편차가 존재해서 불량품이 일정 비율 발생한다. 표준 정규 분포를 따르는 k 개의 독립적인 확률변수 X 가 있을 때, X의 제곱의 합이 따르는 분포를 카이제곱분포라 한다. 이 때 변수의 개수인 k는 카이제곱분포의 자유도가 된다.

Q = \sum_{i=1}^{n}Z_i\\
{}\\
Q \sim \chi^{2}(n)

모분산의 신뢰구간 구하기

확률변수 X가 정규분포를 따를 때, 크기 n인 표본의 분산과 모분산의 비율은 다음과 같이 자유도가 n – 1 인 카이제곱분포를 따른다고 한다.

\frac{(n-1)S^2}{\sigma^2} \sim \chi^{2}(n - 1)

위 공식에서 \sigma^2의 범위를 유의수준 α에 대해 구하면 다음과 같은 범위를 얻을 수 있다.

P \left [ \frac{(n-1)S^2}{\chi^{2}(n-1, \frac{\alpha}{2})}  < \sigma^{2} < \frac{(n-1)S^2}{\chi^{2}(n-1, 1 - \frac{\alpha}{2})}\right ] = 1 - \alpha

예제를 통해 확인해보자. 어느 과목 수강생의 성적이 정규 분포를 따른다고 할 때, 그 중 15명의 시험 성적을 뽑아본 결과가 아래와 같다. 이 때 95% 신뢰 수준에서 모분산에 대한 신뢰구간을 추정해보자.

[66, 78, 18, 96, 85, 63, 73, 83, 65, 80, 75, 56, 95, 77, 66]

먼저 표본의 분산을 구한다. (표본 분산이므로 n – 1 로 나누어야 한다.) 이 값은 350.209로 산출된다. 이제 카이제곱분포표나 엑셀 함수, 파이썬 등을 사용해서 자유도 14일 때, 0.025, 0.975의 분포값을 찾는다. 이 값들은 각각 5.269, 26.119이다. 이 각각의 값들로 (n - 1) * s^{2}을 나눠주면 [187.716, 871.056] 이라는 범위를 갖는다. 즉 전체 수강생 성적의 분산은 이 구역에 있을 확률이 95%로 추정된다.

파이썬으로 계산할 때에는 아래와 같은 값을 얻는다. 퍼센트 수준을 인자로주고 분포값을 얻는 것이니 cdf의 역함수인 pdf()를 사용해야 한다.

import numpy as np
from scipy import stats as st

xs = np.array([66, 78, 18, 96, 85, 63, 73, 83, 65, 80, 75, 56, 95, 77, 66])
n = len(xs) 
s2 = xs.var(ddof=1)  # 표본분산: 350.209
x_left = st.chi2.ppf(0.025, df=n-1) # 5.629
x_right = st.chi2.ppf(0.975, df=n-1) # 26.119

area = ((n - 1) * s2 / x_left, (n - 1) * s2 / x_right)
print(area)
# (871.0555894140166, 187.71557433626796)

엑셀에서 카이제곱분포값은 CHISQ.INV(0.025, 14), CHISQ.INV.RT(0.025, 14) 를 사용하여 계산할 수 있다.

Read more

워드프레스에서 고스트로 이전

워드프레스에서 고스트로 이전

이 글을 쓰면서도 믿기 힘든 사실인데, 블로그라는 걸 처음 시작한지가 20년이 되었습니다. 이글루스에서 처음 시작했다가, SK컴즈가 인수한다고 발표함과 동시에 워드프레스로 플랫폼을 옮겼죠. 워드프레스오 옮긴 이후에는 호스팅 환경을 이리 저리 옮기긴 했지만 거의 18년 가까이 워드프레스를 사용해온 것 같습니다. 그 동안 워드프레스는 블로깅 툴에서 명실상부한 범용CMS로 발전했습니다. 사실 웬만한 홈페이지들은 이제

By sooop
띄어쓰기에 대한 생각

띄어쓰기에 대한 생각

업무 메일을 쓸 때 가장 많이 쓰는 말 중에 하나가 메일 말미에 ‘업무에 참고 부탁 드립니다.‘인데요, 어느 날부터 아웃룩에서 이 ‘부탁 드립니다’가 틀렸다고 맞춤법 지적을 하기 시작했습니다. 맞는 말은 ‘부탁드립니다’라고 붙여 쓰는 거라고. 사실 아래아한글 시절부터 이전의 MS워드까지, 워드프로세서들의 한국어 맞춤법 검사 실력은 거의 있으나 마나 한

By sooop

구글 포토에서 아이클라우드로 탈출한 후기

한 때 구글 포토가 백업 용량을 무제한으로 제공해 주겠다고해서, 구글 포토를 사용해서 사진을 백업해왔습니다. 물론 이 이야기의 결말은 저나 이 글을 읽고 있는 여러분이나 모두 알고 있습니다. 사실 AI에게 학습 시킬 이미지 데이터를 모으기 위한 것일 뿐이라거나 하는 이야기는 그 당시에도 있었습니다만, 에이 그래도 구글인데 용량은 넉넉하게 주겠지…하는 순진한

By sooop

Julia의 함수 사용팁

연산자의 함수적 표기 Julia의 연산자는 기본적으로 함수이며, 함수 호출 표기와 같은 방식으로 호출하는 것이 가능합니다. 또한 그 자체로 함수이기 때문에 filter(), map() 과 같이 함수를 인자로 받는 함수에도 연산자를 그대로 적용하는 것이 가능합니다. 특히 + 연산자는 sum() 함수와 같이 여러 인자를 받아 인자들의 합을 구할 수 있습니다. 2 + 3 # = 5 +(2,

By sooop