【初心者向け】点推定とは?不偏性・一致性・有効性をわかりやすく解説

統計学入門

 「全国の平均年収はいくらか」——すべての人を調査するのは現実的ではありません。そこで 標本から得た1つの数値(統計量) でパラメータを推測する手法が 点推定(Point Estimation) です。

 この章では、点推定の基本的な考え方、良い推定量が満たすべき3つの条件(不偏性・一致性・有効性)、そして点推定の限界まで、図解を交えて丁寧に解説します。


9.1 推定とは

 前章で学んだ通り、統計学の目標は 標本から母集団の特性(母数)を推測することです。この推測行為を 推定(Estimation) と呼び、大きく2種類に分かれます。

推定の種類概要
点推定(Point Estimation)1つの数値(点)で母数を推定する「母平均は 52.3 点である」
区間推定(Interval Estimation)母数が入る「範囲」を確率付きで示す「95%の確率で 50〜55 点の間にある」

 点推定はシンプルでわかりやすい一方、「どのくらいズレる可能性があるか」という精度の情報が含まれません。区間推定(次章)ではこの弱点を補います。

9.2 点推定の考え方

 点推定では、標本から計算した 統計量 を使って母数を推測します。代表的な推定量は以下の通りです。

母数(未知)推定量(統計量)
母平均 μ標本平均 x\bar{x}x=Σxin\bar{x} = \frac{\Sigma{x_i}}{n}
母分散 σ²不偏分散 s²s2=Σ(xix)2n1s^2=\frac{\Sigma(x_i-\bar{x})^2}{n-1}
母比率 p標本比率 p^\hat{p}p^=n\hat{p}=\frac{標本中の該当数}{n}

 たとえば10人の身長を測り、その平均が168.5cmだったとすれば、「全国の平均身長の点推定値は168.5cm」となります。しかし、別の10人を選べば異なる値になります。一般に、標本から計算した統計量はサンプリングのたびに異なる値をとり、ばらつきを持ちます。

図9-1:3つの標本からそれぞれ x̄ を計算。

 上図のように、各標本から得た平均 x\bar{x}は少しずつ異なりますが、その期待値は母平均 μ に等しいという性質があります。(不偏性)

9.3 良い推定量の3条件

点推定量には「良し悪し」があります。統計学では良い推定量の条件として以下の3つが挙げられます。

① 不偏性(Unbiasedness)

 推定量の期待値が真の母数と等しいとき、その推定量は 不偏推定量(Unbiased Estimator) といいます。

E[x]=μE[\bar{x}] = \mu(標本平均の期待値は母平均に等しい)

注目すべき点として、標本分散Σ(xix)2n\frac{\Sigma(x_i-\bar{x})^2}{n} は母分散の 偏った推定量(過小推定)になります。一方、(n-1) で割った 不偏分散 s2=Σ(xix)2n1s^2=\frac{\Sigma(x_i-\bar{x})^2}{n-1}は不偏推定量です。これがなぜ n ではなく n-1 で割るかの理由です。

② 一致性(Consistency)

 標本サイズ n を大きくすると推定量が真の値に近づく性質を 一致性 といいます。

n → ∞ のとき、xμ\bar{x} \rightarrow\mu

図9-2:n=5, 30, 100 における標本平均の分布。n が増えるほど分布が μ=50 に収束する(一致性)。どの n でも期待値が μ=50 になっている(不偏性)

 上図は n=5, 30, 100 のそれぞれで2000回シミュレーションした標本平均の分布(ヒストグラム)です。n が大きいほど分布が狭くなり、真の値 μ=50 に集中していることがわかります。これが一致性の視覚的なイメージです。

③ 有効性(Efficiency)

 不偏推定量が複数ある場合、分散が最も小さい(最もばらつきが少ない)推定量を 有効推定量(Efficient Estimator) と呼びます。分散が小さいほど良い推定量と言えます。

条件意味式・基準
不偏性期待値が母数に一致E[θ^]=θE[\hat{\theta}]=\theta
一致性n を増やせば母数に近づくnn\rightarrow\infin のとき、θ^θ\hat{\theta}\rightarrow\theta
有効性同じ n でよりばらつきが小さいVar(θ^)Var(\hat{\theta})が最小

 標本平均 x\bar{x}は母平均 μ の推定量として、この3条件すべてを満たす優れた推定量です。

9.4 点推定の限界と区間推定へ

 点推定は非常に便利ですが、根本的な限界があります。それは 「どのくらい正確か」がわからない点です。

「母平均の推定値は52.3点です」——でも、これは50点かもしれないし、55点かもしれない。どのくらいの誤差があるか、点推定だけではわかりません。

 この問題を解決するのが次章の 区間推定 です。区間推定では、「95%の確率で50〜55点の範囲に母平均がある」というように、確率付きの範囲(信頼区間)として推定結果を表現します。

比較点推定区間推定(次章)
推定結果の形式1つの数値範囲(区間)
精度の情報含まない信頼水準として含む
わかりやすさシンプルやや複雑
実務での使用概算・速報値統計的な意思決定

まとめ

  • 点推定:1つの統計量で母数を推測する手法(例:x\bar{x} で μ を推測)
  • 不偏性:推定量の期待値が真の母数に等しいこと(E[θ^]=θE[\hat{\theta}]=\theta
  • 一致性:n を増やすほど推定量が母数に近づく性質
  • 有効性:不偏推定量の中で分散が最小であること
  • 点推定の限界は精度(誤差の大きさ)が分からない点 → 区間推定(次章)で解決
  • 不偏分散で (n-1) で割るのは、不偏性を確保するためである

次章では 区間推定 を学び、「95%信頼区間」をどうやって計算するかを図解で解説します。


次の記事

第8章:標本と母集団  第10章:区間推定

コメント

タイトルとURLをコピーしました