信頼区間とは?
信頼区間(Confidence Interval)は、母集団のパラメータ(平均、比率など)が特定の範囲内にあると推定される区間です。例えば95%信頼区間が[48, 52]ということは、同じ方法で100回の標本調査を実施すると約95回は実際の母集団平均が48と52の間に含まれることを意味します。
標本データをもとに母集団平均が位置すると予想される範囲である信頼区間を計算します。統計的推論と意思決定に活用されます。
信頼区間(Confidence Interval)は、母集団のパラメータ(平均、比率など)が特定の範囲内にあると推定される区間です。例えば95%信頼区間が[48, 52]ということは、同じ方法で100回の標本調査を実施すると約95回は実際の母集団平均が48と52の間に含まれることを意味します。
信頼水準は信頼区間が実際のパラメータを含む確率を表します。一般的に90%、95%、99%が使用され、95%が最も広く使われています。信頼水準が高いほど区間の幅は広くなり、低いほど狭くなります。高い信頼水準はより確実ですが精度が低く、低い信頼水準はより精密ですが確実性が低くなります。
標準誤差(Standard Error)は標本平均の標準偏差で、SE = s/√nで計算されます。標本サイズが大きいほど標準誤差は小さくなります。誤差限界(Margin of Error)は信頼区間の半径で、標準誤差にZ値を掛けたものです。信頼区間は標本平均 ± 誤差限界で表現されます。
信頼区間はCI = x̄ ± Z × (s/√n)の公式で計算されます。ここでx̄は標本平均、Zは信頼水準に応じたZ値(95%の場合1.96)、sは標本標準偏差、nは標本サイズです。標本サイズが30未満で母集団が正規分布に従わない場合、Zの代わりにt分布を使用する必要があります。
信頼区間は世論調査、臨床試験、品質管理、マーケティング調査など様々な分野で活用されます。例えば新薬の効果を評価したり、製品の平均寿命を推定したり、有権者の支持率を予測する際に使用されます。信頼区間が狭いほど推定が精密で、広いほど不確実性が大きくなります。
95%信頼区間が[48, 52]だからといって、母集団平均がこの区間にある確率が95%という意味ではありません。母集団平均は固定された値であり、この区間がその値を含むか含まないかです。正確な解釈は「同じ方法で繰り返し調査すると95%の信頼区間が実際の母集団平均を含む」です。