区間推定・信頼区間とは？95%の正しい意味をわかりやすく図解で解説

　前章では、標本から1つの数値でパラメータを推測する「点推定」を学びました。しかし点推定には致命的な弱点があります——「どのくらいズレうるか」という精度情報がないことです。

　そこで登場するのが 区間推定（Interval Estimation） です。「母平均は 48〜56 点の間にある可能性が高い」のように、幅を持たせて推測し、その信頼性を確率で示す手法です。

　この章では、区間推定の仕組み、95%信頼区間の正しい解釈（よくある誤解も解説）、z分布・t分布の使い分け、そして具体的な計算例を図解つきで学びます。

10.1 区間推定とは

　区間推定では、「母数がこの区間に入りそうだ」という 信頼区間（Confidence Interval, CI） を推定します。

信頼係数は 95%（α=0.05） が最も多く使われますが、場面によって90%や99%も使われます。

　ここは非常に誤解されやすいポイントです。まず結論から言いましょう。

正誤	解釈
✅ 正	「同じ手順でサンプリングを十分多く繰り返せば、約95%の信頼区間がμを含む」
❌ 誤	「μがこの区間に入る確率が95%」

　母平均μは固定された定数です。区間を構築するたびに「区間の側が変わる」のであって、μが動くわけではありません。信頼係数95%とは、「この手順の信頼性が95%」を意味します。

　母分散σ²が既知の場合を考えます。標本平均 $\bar{x}$ は正規分布に従います。

従って、母平均μの 信頼水準 (1−α)×100% の信頼区間は次の式で求まります。

信頼水準	z_α/2（両側）	計算式
90%	1.645	$\bar{x}\pm1.645\times\frac{\sigma}{\sqrt{n}}$
95%	1.960	$\mathbf{\bar{x}\pm1.960\times\frac{\sigma}{\sqrt{n}}}$
99%	2.576	$\bar{x}\pm2.576\times\frac{\sigma}{\sqrt{n}}$

標本平均は95%の確率で下記図の青色の区間の値をとる。このとき、95%信頼区間は母平均μを含む。一方、赤色の区間に平均が入る場合は、95%信頼区間はμを含まない。

　あるテストの母標準偏差が σ=10 点、n=25人の標本を取ったところ $\bar{x}=70点$ だったとします。母平均μの95%信頼区間を求めてください。

　この手順を繰り返せば、約95%の区間ではμが信頼区間に含まれます。

　実際の分析では母分散σ²は未知であることがほとんどです。このとき、σを標本標準偏差 s で代替すると、統計量は t分布 に従います。

条件	統計量	分布
母分散既知	$Z=\frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}}$	標準正規分布 N(0,1)
母分散未知	$t=\frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}$	t(n−1)分布（自由度 n−1）

　t分布はz分布よりも 裾が厚く（重く） なります。つまり同じ信頼水準でも、t分布を使った信頼区間の方が広くなります。これは「σを推定する不確実性の分だけ、区間を広げて対応する」という考え方です。

自由度dfが大きくなるほど（標本が増えるほど）、t分布は標準正規分布に近づきます。

　あるサプリメントの効果測定として、n=16名で血圧変化を測定。標本平均 $\bar{x}=-8.5$ 、標本標準偏差 s=4.0 でした。母平均μの95%信頼区間を求めてください（母分散未知）。

　95%信頼区間がすべて負の範囲にあるなので、「サプリメントは血圧を下げる効果がある」と95%の信頼水準で言えます。

信頼区間の幅（精度）は以下の要因に影響されます。

　「精度を上げたいなら標本サイズを増やす」——これが区間推定の基本的な対策です。信頼水準を下げるという選択肢もありますが、その分「外れる確率」が上がります。精度と信頼性のトレードオフを意識しましょう。

ポイント	内容
区間推定	母数を含む「範囲」を確率付きで示す推定法
信頼区間の正しい解釈	「同じ手順で信頼区間を推定した際に95%の区間はμを含む」 → 手順の信頼性
母分散既知	z分布を使用。95%CI: x̄ ± 1.960 × σ/√n
母分散未知	t分布を使用（自由度 df=n−1）。t分布はzより裾が厚い
精度を上げるには	標本サイズ n を増やす（SE = σ/√n が小さくなる）