📊 신뢰구간 계산기

임계값 표 (Critical Values)

Z 임계값 (대표본, n ≥ 30)

90% 신뢰수준: Z = 1.645
95% 신뢰수준: Z = 1.96
99% 신뢰수준: Z = 2.576

T 임계값 (소표본)

자유도 (df)	t(90%)	t(95%)	t(99%)

가이드

자세히 알아보기

신뢰구간이란?

신뢰구간(Confidence Interval)은 모집단의 모수(평균, 비율 등)가 특정 구간에 포함될 확률을 나타냅니다. 95% 신뢰수준은 100번 표본추출 시 95번은 모수가 구간 내에 포함된다는 의미이며, 신뢰수준이 높을수록 신뢰구간이 넓어집니다. 오차한계 E = 임계값 × (표준편차 / √n)이며 표본크기가 클수록 오차한계가 감소합니다. n ≥ 30이면 Z분포(정규분포 근사), n < 30이면 T분포(더 보수적, 꼬리가 두꺼움)를 사용합니다.

신뢰구간의 정의와 기본 개념

신뢰구간(Confidence Interval, CI)은 표본 데이터를 바탕으로 모집단의 모수(평균, 비율, 표준편차 등)가 포함될 것으로 예상되는 구간을 의미합니다. 예를 들어 대학생 500명의 평균 키가 170cm이고 표준편차가 10cm일 때, 95% 신뢰구간이 [168.1cm, 171.9cm]라면, "전체 대학생의 평균 키는 95% 확률로 168.1cm에서 171.9cm 사이"라고 해석합니다. 신뢰수준은 보통 90%, 95%, 99%를 사용하며, 95%는 "100번 표본추출을 반복하면 약 95번은 모수가 이 구간에 포함된다"는 의미입니다. 신뢰구간 = [x̄ - E, x̄ + E] 형태이며, 여기서 E(오차한계)는 "임계값 × 표준오차"로 계산됩니다. 표준오차(SE)는 s / √n이므로, 표본크기 n이 클수록 오차한계가 줄어들어 신뢰구간이 좁아집니다.

Z분포와 T분포: 언제 어떤 것을 사용할까?

신뢰구간 계산 시 표본크기에 따라 Z분포 또는 T분포를 선택합니다. Z분포(표준정규분포)는 표본크기가 충분히 큰 경우(일반적으로 n ≥ 30)에 사용하며, 중심극한정리에 의해 표본평균의 분포가 정규분포에 근사하기 때문입니다. Z 임계값은 고정되어 있습니다: 90% = 1.645, 95% = 1.96, 99% = 2.576. T분포는 표본크기가 작을 때(n < 30) 사용하며, 정규분포보다 꼬리가 두꺼워 더 보수적인 추정을 합니다. T분포는 자유도(df = n - 1)에 따라 모양이 달라지며, 자유도가 클수록 정규분포에 가까워집니다. 예를 들어 n=10(df=9)일 때 95% 신뢰수준의 t 임계값은 2.262로 Z의 1.96보다 큽니다.

평균의 신뢰구간 계산 방법과 예제

모평균의 신뢰구간은 다음 공식으로 계산합니다: CI = x̄ ± (임계값 × s / √n). 예제: 어느 고등학교 학생 25명의 수학 점수 평균이 75점, 표준편차가 12점일 때 95% 신뢰구간을 구하면, n=25 < 30이므로 T분포를 사용합니다. 자유도 df = 24, t(95%, df=24) = 2.064입니다. 표준오차 SE = 12 / √25 = 2.4, 오차한계 E = 2.064 × 2.4 = 4.95. 따라서 95% 신뢰구간 = [70.05점, 79.95점]입니다. 신뢰수준을 99%로 높이면 t(99%, df=24) = 2.797, E = 6.71, CI = [68.29점, 81.71점]으로 구간이 넓어집니다. 신뢰수준을 높이면 더 확실하지만 구간이 넓어지는 트레이드오프가 있습니다.

비율의 신뢰구간 계산 (이항분포)

모비율(p)의 신뢰구간은 표본비율(p̂)을 사용하여 계산합니다. 공식: CI = p̂ ± Z × √[p̂(1-p̂) / n]. 예제: 유권자 800명 중 480명이 후보 A를 지지할 때, 표본비율 p̂ = 480/800 = 0.6 (60%)입니다. 95% 신뢰구간을 구하면, Z(95%) = 1.96, 표준오차 SE = √[0.6 × 0.4 / 800] = 0.0173, 오차한계 E = 1.96 × 0.0173 = 0.034 (3.4%). 95% 신뢰구간 = [56.6%, 63.4%]. 비율의 신뢰구간을 사용할 때 정규근사 조건(np̂ ≥ 5이고 n(1-p̂) ≥ 5)을 만족해야 합니다. 표본크기가 작거나 p̂이 0 또는 1에 가까우면 Wilson 점수 구간 또는 정확 이항 신뢰구간을 사용해야 합니다.

표본크기 결정: 원하는 오차한계 달성하기

연구를 설계할 때 "얼마나 많은 표본이 필요한가?"는 중요한 질문입니다. 원하는 오차한계 E와 신뢰수준이 주어졌을 때 필요한 표본크기 공식: n = (Z × σ / E)². 예제: 95% 신뢰수준에서 오차한계를 ±2점 이내로 하고 싶고, 모표준편차가 15점이라면, n = (1.96 × 15 / 2)² = 216.09 → 최소 217명의 표본이 필요합니다. 오차한계를 절반으로 줄이려면 표본크기를 4배로 늘려야 합니다(E와 n은 제곱 반비례). 비율의 경우 최악의 경우(p=0.5)를 가정하여 n = (Z / E)² × 0.25로 계산합니다.

신뢰구간 해석의 흔한 오해와 올바른 이해

95% 신뢰구간 [168cm, 172cm]을 "모평균이 이 구간에 있을 확률이 95%"라고 해석하는 것은 오류입니다. 빈도주의 통계에서 모평균은 고정된 값이므로 확률이 0% 또는 100%입니다. 올바른 해석: "이런 방식으로 100번 표본을 추출하여 신뢰구간을 만들면, 약 95번은 모평균을 포함하는 구간이 만들어진다." 또 다른 오해는 "95% 신뢰구간은 데이터의 95%가 포함되는 구간"이라는 것인데, 이는 예측구간(Prediction Interval)의 정의입니다. 신뢰구간은 모수의 불확실성을, 예측구간은 개별 관측값의 불확실성을 나타냅니다.

자주 묻는 질문

Z분포와 T분포는 언제 사용하나요?

표본크기 n이 30 이상이면 Z분포(정규분포 근사)를, 30 미만이면 T분포(자유도 df = n - 1)를 사용합니다. T분포는 꼬리가 두꺼워 더 보수적인 추정을 합니다.

오차한계는 어떻게 계산되나요?

오차한계 E = 임계값 × (표준편차 / √n)입니다. 표본크기가 클수록 오차한계가 줄어들어 신뢰구간이 좁아집니다.