📈 P값 계산기

Z, T, 카이제곱, F 검정의 P값을 계산하고 통계적 유의성을 판단합니다. 검정력 분석과 효과크기 계산 포함.

가이드

자세히 알아보기

P값의 정의와 해석

P값(P-value)은 귀무가설(H₀)이 참이라고 가정할 때, 실제 관찰된 통계량 또는 그보다 더 극단적인 값이 나올 확률입니다. 예를 들어 P값이 0.03이라면 "귀무가설이 참일 때 이렇게 극단적인 결과가 나올 확률이 3%"라는 의미입니다. P값이 유의수준 α(보통 0.05 또는 5%)보다 작으면 귀무가설을 기각하고 대립가설을 채택합니다. P=0.03 < 0.05이므로 "통계적으로 유의하다(statistically significant)"고 결론 내립니다. P값이 작을수록 귀무가설에 반하는 강한 증거입니다. 하지만 P값은 효과의 크기나 중요성을 말하지 않으며, 단지 우연에 의한 것인지 여부만 판단합니다. P=0.001과 P=0.049는 모두 유의하지만 증거의 강도는 다릅니다.

Z검정과 T검정: 평균 비교의 기본

Z검정은 모표준편차(σ)를 알고 표본크기가 큰 경우(n≥30) 사용합니다. Z = (x̄ - μ₀) / (σ / √n). 예: 평균 키가 170cm(μ₀)인지 검정할 때, 100명 표본평균이 172cm, σ=10cm이면, Z = (172-170)/(10/√100) = 2/1 = 2.0. 양측검정 P값 = 2×P(Z>2.0) ≈ 0.046 < 0.05로 유의합니다. T검정은 모표준편차를 모르고 표본표준편차(s)를 사용하거나 표본크기가 작을 때(n<30) 사용합니다. T = (x̄ - μ₀) / (s / √n), 자유도 df=n-1. 예: 25명 평균 75점, s=12, μ₀=70일 때, T = (75-70)/(12/√25) = 5/2.4 = 2.08, df=24. T분포에서 P값 ≈ 0.048로 유의합니다.

카이제곱 검정: 범주형 데이터 분석

카이제곱(χ²) 검정은 범주형 변수 간 독립성 검정이나 적합도 검정에 사용됩니다. χ² = Σ(관찰빈도 - 기대빈도)² / 기대빈도. 예: 주사위를 60번 던져 각 눈이 {12, 8, 11, 9, 10, 10}번 나왔다면, 기대빈도는 각 10번. χ² = (12-10)²/10 + (8-10)²/10 + ... = 1.0. 자유도 df=6-1=5, P값 ≈ 0.96 > 0.05로 주사위는 공정합니다(유의하지 않음). 카이제곱 검정은 독립성 검정(예: 성별과 제품 선호도), 동질성 검정(여러 집단 비율 비교), 적합도 검정(관찰 분포가 이론 분포를 따르는지)에 활용됩니다.

F검정: 분산 비교와 ANOVA

F검정은 두 집단의 분산을 비교하거나, ANOVA(분산분석)에서 여러 집단 평균을 동시에 비교할 때 사용합니다. F = s₁² / s₂² (큰 분산 / 작은 분산). 예: 집단1 분산 s₁²=25, 집단2 분산 s₂²=16이면, F = 25/16 = 1.56. 자유도 df₁=n₁-1, df₂=n₂-1. ANOVA는 셋 이상의 집단 평균을 비교할 때 t검정을 반복하는 대신 F검정으로 한 번에 검정합니다(1종 오류 누적 방지). F값이 크면 집단 간 분산이 집단 내 분산보다 크다는 의미로, 집단 간 평균 차이가 유의합니다.

검정력과 효과크기: P값을 넘어서

검정력(Power)은 대립가설이 참일 때 이를 올바르게 탐지할 확률로, Power = 1 - β(2종 오류)입니다. 보통 0.8 (80%) 이상을 목표로 합니다. 검정력은 효과크기, 표본크기, 유의수준에 영향을 받습니다. 표본크기가 클수록, 효과크기가 클수록, α가 클수록 검정력이 증가합니다. 효과크기(Effect Size)는 실질적 차이의 크기를 나타냅니다. Cohen's d = (평균1 - 평균2) / 통합표준편차. d=0.2는 작은 효과, d=0.5는 중간 효과, d=0.8은 큰 효과입니다. P값이 유의하더라도 효과크기가 작으면 실용적 의미가 없을 수 있습니다.

P값 오해와 올바른 사용

P값에 대한 흔한 오해: ① "P=0.05는 귀무가설이 참일 확률이 5%"는 틀렸습니다. P값은 "H₀이 참일 때 데이터가 나올 확률"이지, "데이터가 주어졌을 때 H₀이 참일 확률"이 아닙니다(베이즈 정리 필요). ② "P<0.05면 효과가 크다"는 오해입니다. P값은 유의성이지 효과크기가 아닙니다. ③ "P=0.051은 유의하지 않고 P=0.049는 유의하다"처럼 0.05를 절대 기준으로 보는 것은 문제입니다. P값은 연속적 증거로 해석해야 합니다. 올바른 사용: P값과 함께 신뢰구간, 효과크기, 실질적 의미를 종합 평가하세요. 재현성을 위해 사전 등록(pre-registration)하고, P-hacking을 피하세요.

자주 묻는 질문

P값이 작으면 효과가 큰가요?

아닙니다. P값은 통계적 유의성을 나타낼 뿐 효과크기를 말하지 않습니다. 표본이 매우 크면 작은 효과도 유의할 수 있으므로, P값과 함께 효과크기(Cohen's d 등)와 신뢰구간을 함께 봐야 합니다.

단측검정과 양측검정은 언제 쓰나요?

방향성이 명확한 가설(예: "더 크다")은 단측검정을, 양방향 차이를 모두 고려하면 양측검정을 사용합니다. 양측검정의 P값이 단측검정의 약 2배입니다.