📈 P値計算機

Z、T、カイ二乗、F検定のP値を計算し、統計的有意性を判定します。検出力分析と効果量の計算にも対応。

ガイド

詳しく見る

P値の定義と解釈

P値（P-value）とは、帰無仮説（H₀）が正しいと仮定したときに、実際に観測された統計量またはそれよりも極端な値が得られる確率です。たとえばP値が0.03であれば、「帰無仮説が正しいとき、これほど極端な結果が得られる確率は3%」という意味になります。P値が有意水準α（通常0.05または5%）より小さければ、帰無仮説を棄却して対立仮説を採択します。P=0.03 < 0.05なので「統計的に有意（statistically significant）」と結論づけます。P値が小さいほど帰無仮説に反する強い証拠となります。ただしP値は効果の大きさや重要性を示すものではなく、単に偶然によるものかどうかを判断するだけです。P=0.001とP=0.049はどちらも有意ですが、証拠の強さは異なります。

Z検定とT検定：平均の比較の基本

Z検定は母標準偏差（σ）が既知で標本サイズが大きい場合（n≥30）に使用します。Z = (x̄ - μ₀) / (σ / √n)。例：平均身長が170cm（μ₀）かどうかを検定する際、100人の標本平均が172cm、σ=10cmであれば、Z = (172-170)/(10/√100) = 2/1 = 2.0。両側検定のP値 = 2×P(Z>2.0) ≈ 0.046 < 0.05で有意です。T検定は母標準偏差が未知で標本標準偏差（s）を使う場合、または標本サイズが小さい場合（n<30）に使用します。T = (x̄ - μ₀) / (s / √n)、自由度df=n-1。例：25人の平均75点、s=12、μ₀=70のとき、T = (75-70)/(12/√25) = 5/2.4 = 2.08、df=24。T分布からP値 ≈ 0.048で有意です。

カイ二乗検定：カテゴリカルデータの分析

カイ二乗（χ²）検定は、カテゴリカル変数間の独立性の検定や適合度の検定に使用されます。χ² = Σ(観測度数 - 期待度数)² / 期待度数。例：サイコロを60回振って各目が{12, 8, 11, 9, 10, 10}回出たとすると、期待度数は各10回。χ² = (12-10)²/10 + (8-10)²/10 + ... = 1.0。自由度df=6-1=5、P値 ≈ 0.96 > 0.05なのでサイコロは公正です（有意でない）。カイ二乗検定は独立性の検定（例：性別と製品の好み）、等質性の検定（複数集団の比率比較）、適合度の検定（観測分布が理論分布に従うか）に活用されます。

F検定：分散の比較とANOVA

F検定は2つの集団の分散を比較したり、ANOVA（分散分析）で複数の集団平均を同時に比較したりする際に使用します。F = s₁² / s₂²（大きい分散 / 小さい分散）。例：集団1の分散s₁²=25、集団2の分散s₂²=16であれば、F = 25/16 = 1.56。自由度df₁=n₁-1、df₂=n₂-1。ANOVAは3つ以上の集団平均を比較する際、t検定を繰り返す代わりにF検定で一度に検定します（第1種の過誤の累積を防止）。F値が大きいほど集団間の分散が集団内の分散より大きいことを意味し、集団間の平均差が有意であることを示します。

検出力と効果量：P値を超えて

検出力（Power）とは、対立仮説が正しいときにそれを正しく検出する確率であり、Power = 1 - β（第2種の過誤）です。通常0.8（80%）以上を目標とします。検出力は効果量、標本サイズ、有意水準の影響を受けます。標本サイズが大きいほど、効果量が大きいほど、αが大きいほど検出力は高まります。効果量（Effect Size）は実質的な差の大きさを表します。Cohen's d = (平均1 - 平均2) / 統合標準偏差。d=0.2は小さい効果、d=0.5は中程度の効果、d=0.8は大きい効果です。P値が有意であっても効果量が小さければ、実用的な意味がない場合があります。

P値の誤解と正しい使い方

P値に関するよくある誤解：①「P=0.05は帰無仮説が正しい確率が5%」は誤りです。P値は「H₀が正しいときにデータが得られる確率」であり、「データが与えられたときにH₀が正しい確率」ではありません（ベイズの定理が必要）。②「P<0.05なら効果が大きい」は誤解です。P値は有意性であって効果量ではありません。③「P=0.051は有意でなくP=0.049は有意」のように0.05を絶対的な基準とみなすのは問題です。P値は連続的な証拠として解釈すべきです。正しい使い方：P値とともに信頼区間、効果量、実質的な意味を総合的に評価しましょう。再現性のために事前登録（pre-registration）を行い、P-hackingを避けてください。

よくある質問

P値が小さいと効果が大きいのですか？

いいえ。P値は統計的有意性を示すだけで、効果の大きさを示すものではありません。標本が非常に大きいと小さな効果でも有意になり得るため、P値とともに効果量（Cohen's dなど）と信頼区間も併せて確認する必要があります。

片側検定と両側検定はいつ使いますか？

方向性が明確な仮説（例：「より大きい」）には片側検定を、両方向の差をどちらも考慮する場合には両側検定を使用します。両側検定のP値は片側検定の約2倍になります。