【初心者向け】仮説検定とは?p値・有意水準・過誤をわかりやすく解説

統計学入門

 「新薬は本当に効果があるのか」「男女で平均賃金に差があるのか」——こうした主張の正しさをデータを使って統計的に考察する方法仮説検定(Hypothesis Testing) です。

この章では、仮説検定の基本的な考え方から、p値・有意水準の正しい解釈、5ステップの検定手順、そして2種類の過誤(偽陽性・偽陰性)まで、図解とともに丁寧に解説します。


11.1 仮説検定とは何か?

 仮説検定とは、「本当に差がある」のかをデータで判断する方法です。コインを10回投げて8回表が出たとき、それは「コインが歪んでいる証拠」でしょうか、それとも「ただの偶然」でしょうか?こうした問いに対して確率的な答えを出すのが仮説検定です。

仮説検定では2つの仮説を立て、データがどちらを支持するかを判断します。

仮説記号内容戦略
帰無仮説H₀「差がない・効果がない」という保守的な主張棄却して H₁ を支持したい
対立仮説H₁「差がある・効果がある」という研究者の主張証明したい内容

仮説検定は「H₀が正しいと仮定したとき、観測データがどのくらいの確率で発生しうるか」を評価します。その確率が十分小さければ、H₀を棄却して「H₁を支持する」と結論づけます。

11.2 帰無仮説と対立仮説の例

研究の問い帰無仮説 H₀対立仮説 H₁
新薬に効果があるか新薬と偽薬の効果は同じ(μ₁=μ₂)新薬の効果の方が大きい(μ₁>μ₂)
コインは公平か表の出る確率は0.5(p=0.5)表の出る確率は0.5ではない(p≠0.5)
男女で平均賃金に差があるか男女の平均賃金は同じ(μ男=μ女)男女の平均賃金は異なる(μ男≠μ女)

対立仮説の向きによって「両側検定」と「片側検定」に分かれます。「差がある(≠)」は両側検定、「大きい(>)や小さい(<)」は片側検定です。

11.3 有意水準 α とは何か?

 有意水準(α)とは、「帰無仮説が本当に正しいのに誤って棄却してしまう確率の上限」です。事前に決めておく閾値であり、 α = 0.05(5%) が使わることが多いです。

有意水準意味使われる場面
α = 0.10(10%)やや緩い基準
→検出力大
見逃しを避けたい場面
例)探索的な研究
α = 0.05(5%)中庸的例)社会科学
α = 0.01(1%)厳しい基準
→誤検出減
誤検出を避けたい場面
例)製造方法の変更(安全性)
「危険」を帰無仮説とする。

11.4 p値とは何か?

 p値(p-value)とは、帰無仮説が真のとき、観測値以上に極端な結果が起こる確率です。p値が小さいほど「H₀のもとではこの結果は珍しい」ことを意味します。

判定条件結論
有意p < αH₀を棄却 → 「有意差あり」(H₁を支持)
非有意p ≥ αH₀を棄却できない(H₀が正しい証明ではない)

⚠️ よくある誤解:「p < 0.05 = 効果が大きい」ではありません。p値は効果の大きさを示しません。標本サイズが大きければ、ごくわずかな差でも有意になります。効果の大きさは「効果量(Cohen’s d など)」で別途評価しましょう。

11.5 仮説検定の流れ

図11-1:仮説検定の5ステップ。Step5では p < α なら H₀を棄却、p ≥ α なら棄却できない(右パネルに重要ポイントを掲載)。

例題:母平均の仮説検定

 あるテストの全国平均得点は60点(μ₀=60)、母標準偏差σ=10点とされています。新しい教育方法でn=25名を指導したところ、標本平均x\bar{x}=65点でした。有意水準5%で「新しい教育方法は得点を上げるか」を検定してください(片側検定)。

ステップ内容
Step 1:仮説設定H₀: μ = 60、H₁: μ > 60(片側)
Step 2:有意水準α = 0.05、棄却域 z > 1.645
Step 3:検定統計量z=65601025=2.50z=\frac{65-60}{\frac{10}{\sqrt{25}}}=2.50
Step 4:p値p = P(Z > 2.50) = 0.0062(約0.6%)
Step 5:結論p = 0.0062 < α = 0.05
H₀を棄却。新しい教育方法は有意に得点を上げると判断

11.6 第一種の過誤と第二種の過誤とは何か?

 仮説検定は確率的な判断であるため、「間違える可能性」があります。間違いには2種類あります。

図11-2:第一種の過誤と第二種の過誤
図11-3:H₀の真偽(実際)と検定の判定結果による4つのケース。右パネルに用語解説とトレードオフを掲載。
過誤の種類状況確率
第一種の過誤H₀が真なのに棄却してしまう(誤検出)= α(有意水準)
第二種の過誤H₀が偽なのに棄却できない(見逃し)= β
検出力H₀が偽のときに正しく棄却できる確率= 1 − β

 α を小さくすると第一種の過誤は減りますが、第二種の過誤(β)が増えるというトレードオフがあります。トレードオフを解消するためには 標本サイズ n を増やす のが最も有効な対策です。

第11章のまとめ

ポイント内容
帰無仮説 H₀棄却したい仮説。対立仮説 H₁ を支持するために設定
有意水準 α通常 0.05(5%)。H₀を誤って棄却する確率の上限
p値H₀が真のとき、観測値以上に極端な結果が生じる確率。小さいほど「珍しい」
判定ルールp < α → H₀棄却(有意差あり)。p ≥ α → 棄却できない
第一種の過誤真の H₀ を誤って棄却(偽陽性)。確率 = α
第二種の過誤偽の H₀ を棄却できない(偽陰性)。確率 = β。検出力 = 1−β

次章では、2つの変数間の関係を数値で表す「相関と回帰」を学びます。


前の章:第10章 区間推定 | 次の章:第12章 相関と回帰

コメント

タイトルとURLをコピーしました