📊 信頼区間計算機

臨界値の表 (Critical Values)

Z臨界値(大標本、n ≥ 30)

90%信頼水準: Z = 1.645
95%信頼水準: Z = 1.96
99%信頼水準: Z = 2.576

T臨界値(小標本)

自由度 (df)	t(90%)	t(95%)	t(99%)

ガイド

詳しく見る

信頼区間とは?

信頼区間(Confidence Interval)は、母集団の母数(平均、比率など)が特定の区間に含まれる確率を表します。95%の信頼水準とは、100回標本を抽出したとき95回は母数が区間内に含まれるという意味であり、信頼水準が高いほど信頼区間は広くなります。誤差の限界は E = 臨界値 × (標準偏差 / √n) で求められ、標本サイズが大きいほど誤差の限界は小さくなります。n ≥ 30 の場合はZ分布(正規分布近似)を、n < 30 の場合はT分布(より保守的で裾が厚い)を使用します。

信頼区間の定義と基本概念

信頼区間(Confidence Interval、CI)とは、標本データに基づいて母集団の母数(平均、比率、標準偏差など)が含まれると予想される区間を意味します。例えば、大学生500人の平均身長が170cm、標準偏差が10cmのとき、95%信頼区間が [168.1cm, 171.9cm] であれば、「大学生全体の平均身長は95%の確率で168.1cmから171.9cmの間にある」と解釈します。信頼水準は通常90%、95%、99%を用い、95%は「100回標本抽出を繰り返すと、約95回は母数がこの区間に含まれる」という意味です。信頼区間は [x̄ - E, x̄ + E] の形をとり、ここで E(誤差の限界)は「臨界値 × 標準誤差」で計算されます。標準誤差(SE)は s / √n なので、標本サイズ n が大きいほど誤差の限界が小さくなり、信頼区間は狭くなります。

Z分布とT分布: どちらをいつ使うのか?

信頼区間を計算する際は、標本サイズに応じてZ分布またはT分布を選択します。Z分布(標準正規分布)は標本サイズが十分に大きい場合(一般的に n ≥ 30)に使用します。中心極限定理により、標本平均の分布が正規分布に近似するためです。Z臨界値は固定されています: 90% = 1.645、95% = 1.96、99% = 2.576。T分布は標本サイズが小さいとき(n < 30)に使用し、正規分布より裾が厚いためより保守的な推定を行います。T分布は自由度(df = n - 1)によって形が変わり、自由度が大きいほど正規分布に近づきます。例えば n=10(df=9)のとき、95%信頼水準のt臨界値は2.262で、Zの1.96より大きくなります。

平均の信頼区間の計算方法と例題

母平均の信頼区間は次の公式で計算します: CI = x̄ ± (臨界値 × s / √n)。例題: ある高校の生徒25人の数学の点数の平均が75点、標準偏差が12点のとき95%信頼区間を求めると、n=25 < 30 なのでT分布を使用します。自由度 df = 24、t(95%, df=24) = 2.064 です。標準誤差 SE = 12 / √25 = 2.4、誤差の限界 E = 2.064 × 2.4 = 4.95。したがって95%信頼区間 = [70.05点, 79.95点] です。信頼水準を99%に高めると t(99%, df=24) = 2.797、E = 6.71、CI = [68.29点, 81.71点] と区間が広くなります。信頼水準を高めるとより確実になりますが区間が広がるというトレードオフがあります。

比率の信頼区間の計算(二項分布)

母比率(p)の信頼区間は標本比率(p̂)を用いて計算します。公式: CI = p̂ ± Z × √[p̂(1-p̂) / n]。例題: 有権者800人のうち480人が候補Aを支持するとき、標本比率 p̂ = 480/800 = 0.6(60%)です。95%信頼区間を求めると、Z(95%) = 1.96、標準誤差 SE = √[0.6 × 0.4 / 800] = 0.0173、誤差の限界 E = 1.96 × 0.0173 = 0.034(3.4%)。95%信頼区間 = [56.6%, 63.4%]。比率の信頼区間を使う際は、正規近似の条件(np̂ ≥ 5 かつ n(1-p̂) ≥ 5)を満たす必要があります。標本サイズが小さいか p̂ が0または1に近い場合は、ウィルソンのスコア区間または正確な二項信頼区間を使用する必要があります。

標本サイズの決定: 希望する誤差の限界を達成する

研究を設計する際、「どれだけの標本が必要か?」は重要な問いです。希望する誤差の限界 E と信頼水準が与えられたときに必要な標本サイズの公式: n = (Z × σ / E)²。例題: 95%信頼水準で誤差の限界を ±2点以内にしたく、母標準偏差が15点であれば、n = (1.96 × 15 / 2)² = 216.09 → 最低217人の標本が必要です。誤差の限界を半分にするには標本サイズを4倍に増やす必要があります(E と n は二乗の反比例)。比率の場合は最悪のケース(p=0.5)を想定し、n = (Z / E)² × 0.25 で計算します。

信頼区間の解釈でよくある誤解と正しい理解

95%信頼区間 [168cm, 172cm] を「母平均がこの区間にある確率が95%」と解釈するのは誤りです。頻度論統計では母平均は固定された値なので、確率は0%か100%です。正しい解釈: 「この方法で100回標本を抽出して信頼区間を作ると、約95回は母平均を含む区間ができる」。もう一つの誤解は「95%信頼区間はデータの95%が含まれる区間」というものですが、これは予測区間(Prediction Interval)の定義です。信頼区間は母数の不確実性を、予測区間は個々の観測値の不確実性を表します。

よくある質問

Z分布とT分布はいつ使いますか?

標本サイズ n が30以上ならZ分布(正規分布近似)を、30未満ならT分布(自由度 df = n - 1)を使用します。T分布は裾が厚いためより保守的な推定を行います。

誤差の限界はどのように計算されますか?

誤差の限界は E = 臨界値 × (標準偏差 / √n) です。標本サイズが大きいほど誤差の限界が小さくなり、信頼区間が狭くなります。