신뢰구간 계산기
모평균과 모비율의 신뢰구간을 계산합니다. 대표본(n≥30)에는 Z분포, 소표본(n<30)에는 T분포를 사용하여 정확한 구간을 추정합니다.
임계값 표 (Critical Values)
Z 임계값 (대표본, n ≥ 30)
90% 신뢰수준: Z = 1.645
95% 신뢰수준: Z = 1.96
99% 신뢰수준: Z = 2.576
T 임계값 (소표본) (자유도 (df))
| 자유도 (df) | t(90%) | t(95%) | t(99%) |
|---|
신뢰구간이란?
신뢰구간(Confidence Interval)은 모집단의 모수(평균, 비율 등)가 특정 구간에 포함될 확률을 나타냅니다.
신뢰수준
• 95% 신뢰수준: 100번 표본추출 시 95번은 모수가 구간 내에 포함
• 신뢰수준이 높을수록 신뢰구간이 넓어짐
오차한계 (Margin of Error)
• E = 임계값 × (표준편차 / √n)
• 표본크기가 클수록 오차한계 감소
분포 선택
• n ≥ 30: Z분포 (정규분포 근사)
• n < 30: T분포 (더 보수적, 꼬리가 두꺼움)
신뢰수준
• 95% 신뢰수준: 100번 표본추출 시 95번은 모수가 구간 내에 포함
• 신뢰수준이 높을수록 신뢰구간이 넓어짐
오차한계 (Margin of Error)
• E = 임계값 × (표준편차 / √n)
• 표본크기가 클수록 오차한계 감소
분포 선택
• n ≥ 30: Z분포 (정규분포 근사)
• n < 30: T분포 (더 보수적, 꼬리가 두꺼움)
신뢰구간 완벽 가이드: 통계 추정의 핵심 개념 (2025)
신뢰구간의 정의와 기본 개념
신뢰구간(Confidence Interval, CI)은 표본 데이터를 바탕으로 모집단의 모수(평균, 비율, 표준편차 등)가 포함될 것으로 예상되는 구간을 의미합니다. 예를 들어 대학생 500명의 평균 키가 170cm이고 표준편차가 10cm일 때, 95% 신뢰구간이 [168.1cm, 171.9cm]라면, "전체 대학생의 평균 키는 95% 확률로 168.1cm에서 171.9cm 사이"라고 해석합니다. 신뢰수준(Confidence Level)은 보통 90%, 95%, 99%를 사용하며, 95%는 "100번 표본추출을 반복하면 약 95번은 모수가 이 구간에 포함된다"는 의미입니다. 신뢰구간 = [x̄ - E, x̄ + E] 형태이며, 여기서 E(오차한계, Margin of Error)는 "임계값 × 표준오차"로 계산됩니다. 표준오차(SE)는 s / √n이므로, 표본크기 n이 클수록 오차한계가 줄어들어 신뢰구간이 좁아집니다. 신뢰구간은 점추정(단일 값 추정)의 한계를 보완하여 불확실성을 정량화하는 강력한 도구입니다.
Z분포와 T분포: 언제 어떤 것을 사용할까?
신뢰구간 계산 시 표본크기에 따라 Z분포 또는 T분포를 선택합니다. Z분포(표준정규분포)는 표본크기가 충분히 큰 경우(일반적으로 n ≥ 30)에 사용하며, 중심극한정리(Central Limit Theorem)에 의해 표본평균의 분포가 정규분포에 근사하기 때문입니다. Z 임계값은 고정되어 있습니다: 90% 신뢰수준 = 1.645, 95% = 1.96, 99% = 2.576. T분포는 표본크기가 작을 때(n < 30) 사용하며, 정규분포보다 꼬리가 두꺼워(heavy-tailed) 더 보수적인 추정을 합니다. T분포는 자유도(df = n - 1)에 따라 모양이 달라지며, 자유도가 클수록 정규분포에 가까워집니다. 예를 들어 n=10(df=9)일 때 95% 신뢰수준의 t 임계값은 2.262로 Z의 1.96보다 큽니다. 실무에서는 모표준편차 σ를 모를 때(대부분의 경우) 표본표준편차 s를 사용하므로 T분포가 더 적절하지만, n이 크면 Z와 T의 차이가 미미하여 Z를 사용해도 무방합니다.
평균의 신뢰구간 계산 방법과 예제
모평균의 신뢰구간은 다음 공식으로 계산합니다: CI = x̄ ± (임계값 × s / √n). 예제: 어느 고등학교 학생 25명의 수학 점수 평균이 75점, 표준편차가 12점일 때 95% 신뢰구간을 구하면, n=25 < 30이므로 T분포를 사용합니다. 자유도 df = 25 - 1 = 24, t(95%, df=24) = 2.064입니다. 표준오차 SE = 12 / √25 = 2.4, 오차한계 E = 2.064 × 2.4 = 4.95. 따라서 95% 신뢰구간 = [75 - 4.95, 75 + 4.95] = [70.05점, 79.95점]입니다. 해석: "이 학교 전체 학생의 평균 점수는 95% 확률로 70.05점에서 79.95점 사이입니다." 만약 같은 조건에서 신뢰수준을 99%로 높이면, t(99%, df=24) = 2.797, E = 2.797 × 2.4 = 6.71, CI = [68.29점, 81.71점]으로 구간이 넓어집니다. 신뢰수준을 높이면 더 확실하지만 구간이 넓어져 정보가 덜 정밀해지는 트레이드오프가 있습니다.
비율의 신뢰구간 계산 (이항분포)
모비율(p)의 신뢰구간은 표본비율(p̂)을 사용하여 계산합니다. 공식: CI = p̂ ± Z × √[p̂(1-p̂) / n]. 예제: 유권자 800명 중 480명이 후보 A를 지지할 때, 표본비율 p̂ = 480/800 = 0.6 (60%)입니다. 95% 신뢰구간을 구하면, Z(95%) = 1.96, 표준오차 SE = √[0.6 × 0.4 / 800] = √(0.24 / 800) = 0.0173, 오차한계 E = 1.96 × 0.0173 = 0.034 (3.4%). 95% 신뢰구간 = [0.6 - 0.034, 0.6 + 0.034] = [0.566, 0.634] 또는 [56.6%, 63.4%]. 해석: "전체 유권자 중 후보 A 지지율은 95% 확률로 56.6%에서 63.4% 사이입니다." 비율의 신뢰구간을 사용할 때 주의할 점은 정규근사 조건을 만족해야 한다는 것입니다: np̂ ≥ 5이고 n(1-p̂) ≥ 5. 위 예제에서 800×0.6 = 480 ≥ 5, 800×0.4 = 320 ≥ 5이므로 조건을 만족합니다. 표본크기가 작거나 p̂이 0 또는 1에 가까우면 Wilson 점수 구간 또는 정확 이항 신뢰구간을 사용해야 합니다.
표본크기 결정: 원하는 오차한계 달성하기
연구를 설계할 때 "얼마나 많은 표본이 필요한가?"는 중요한 질문입니다. 원하는 오차한계 E와 신뢰수준이 주어졌을 때 필요한 표본크기 공식: n = (Z × σ / E)². 예제: 95% 신뢰수준에서 오차한계를 ±2점 이내로 하고 싶고, 모표준편차가 15점이라면, Z(95%) = 1.96, n = (1.96 × 15 / 2)² = (14.7)² = 216.09 → 최소 217명의 표본이 필요합니다. 만약 오차한계를 절반(±1점)로 줄이고 싶다면, n = (1.96 × 15 / 1)² = 864.36 → 약 865명이 필요합니다. 오차한계를 절반으로 줄이려면 표본크기를 4배로 늘려야 합니다(E와 n은 제곱 반비례). 비율의 경우 최악의 경우(p=0.5, 가장 큰 분산)를 가정하여 n = (Z / E)² × 0.25로 계산합니다. 예: 95% 신뢰수준, 오차한계 ±3%이면, n = (1.96 / 0.03)² × 0.25 = 1067.1 → 약 1068명. 실무에서는 예산, 시간, 접근 가능성을 고려하여 표본크기와 정밀도 사이의 균형을 찾아야 합니다.
신뢰구간 해석의 흔한 오해와 올바른 이해
95% 신뢰구간 [168cm, 172cm]을 "모평균이 이 구간에 있을 확률이 95%"라고 해석하는 것은 오류입니다. 베이지안 통계가 아닌 빈도주의 통계에서 모평균은 고정된 값(알 수 없지만)이므로 확률이 0% 또는 100%입니다. 올바른 해석: "이런 방식으로 100번 표본을 추출하여 신뢰구간을 만들면, 약 95번은 모평균을 포함하는 구간이 만들어진다." 즉, 신뢰구간은 반복 표본추출 시 모수를 포함할 장기적 비율(long-run frequency)을 의미합니다. 또 다른 오해는 "95% 신뢰구간은 데이터의 95%가 포함되는 구간"이라는 것인데, 이는 예측구간(Prediction Interval)의 정의입니다. 신뢰구간은 모수의 불확실성을, 예측구간은 개별 관측값의 불확실성을 나타냅니다. 예측구간은 신뢰구간보다 훨씬 넓습니다(약 √(1 + 1/n)배). 마지막으로, 귀무가설이 신뢰구간에 포함되면 유의수준 α에서 귀무가설을 기각할 수 없으며, 포함되지 않으면 기각합니다(α = 1 - 신뢰수준). 예: 95% CI = [168cm, 172cm]이고 H₀: μ = 165cm라면, 165가 구간 밖이므로 5% 유의수준에서 귀무가설 기각.