【統計学入門 第6章】確率分布とは?二項分布・ポアソン分布を図解でわかりやすく解説

統計学入門

 「コインを10回投げたとき、表がちょうど7回出る確率は?」「1時間に来店するお客さんは平均3人だとして、5人来る確率は?」——こうした問いに答えてくれるのが 確率分布 の考え方です。

 この章では、データのばらつきを確率で表す 確率分布 を基礎から学びます。今回は 二項分布ポアソン分布 を、具体例・公式・図解でしっかり理解しましょう。


6.1 確率分布とは何か

 確率分布とは、確率変数が取りうる値ごとに「その値が起こる確率」を対応させた関係のことです。前章の「1つの事象の確率」をさらに発展させ、どんな値がどのくらいの確率で起きるか を分布として把握できるようにしたものです。

 たとえばコインを3回投げたとき、表の枚数 X は 0〜3 のどれかになります。それぞれの確率を並べると次のようになります。

表の枚数 X0123
P(X = k)1/83/83/81/8

 この表全体が「コイン3回投げの確率分布」です。すべての確率を足すと必ず 1(= 100%)になります。

📌 確率変数:取りうるXに対して、それぞれ起こる確率が与えられるとき、変数Xを確率変数という。(例:コインを投げるたびに変わる「表の枚数」)。大文字の X で表すのが慣例。


6.2 二項分布 — コイン投げで理解する「成功回数の分布」

 二項分布(Binomial Distribution)は、「成功か失敗か」の2択で起きる試行をn回繰り返したとき、成功がk回起きる確率を表す分布です。下記条件で確率分布を考えます。

  • 各回の結果は「成功(確率 p)」か「失敗(確率 1−p)」の2択
  • n回の試行は互いに独立(1回の結果が次に影響しない)

二項分布の公式

P(X=k) = B(n,p) = (nk)\begin{pmatrix} n \\ k \end{pmatrix}× pk × (1−p)(n−k)
          ↑ k回成功 (n-k)回失敗
  成功と失敗がどの回で起こるかの場合の数
  n:試行回数
  k:成功回数(0, 1, 2, ..., n)
  p:成功確率
 (nk)\begin{pmatrix} n \\ k \end{pmatrix} = n!k!(nk)!\frac{n!}{k!(n-k)!}

期待値:μ=k=1nkP(k)=npμ= \sum_{k=1}^{n} kP(k)=np
分 散:σ2=k=1n(kμ)2P(k)=np(1p)σ^2 = \sum_{k=1}^{n} (k-μ)^2P(k)=np(1-p)

具体例:不良品率10%の工場ラインで10個中k個が不良品になる確率

n=10(10個検査)、p=0.1(不良品率10%)のとき、不良品数 X の確率分布を計算してみましょう。

P(X=0) = (100)\begin{pmatrix} 10 \\ 0 \end{pmatrix} × 0.10 × 0.910 ≈ 0.349(34.9%)
P(X=1) = (101)\begin{pmatrix} 10 \\ 1 \end{pmatrix} × 0.11 × 0.99  ≈ 0.387(38.7%)
P(X=2) = (102)\begin{pmatrix} 10 \\ 2 \end{pmatrix} × 0.12 × 0.98  ≈ 0.194(19.4%)
P(X=3) = (103)\begin{pmatrix} 10 \\ 3 \end{pmatrix} × 0.13 × 0.97  ≈ 0.057(5.7%)
  …(以下省略)

平均 = 10 × 0.1 = 1.0 個
分散 = 10 × 0.1 × 0.9 = 0.9

 下の図は、n=10 で確率 p を変えたときの二項分布の形を比べたものです。p=0.5 のとき左右対称な山型になり、p が偏るほど分布が一方に傾きます。

二項分布のポイントまとめ

項目内容
適用場面n回の独立な試行での成功回数の確率分布
パラメータn(試行回数)、p(成功確率)
平均np
分散np(1−p)
典型例コイン投げ、不良品検査、アンケートの回答

6.3 ポアソン分布 — 「まれな出来事の件数」を予測する

 ポアソン分布(Poisson Distribution)は、単位時間や単位面積で、平均 λ(ラムダ)回起きる事象が、k 回起きる確率を表す分布です。次のような状況で使います。

  • 事象が起きる確率は非常に小さい(まれな出来事)
  • 試行回数 n は非常に大きい
  • 各事象は独立に起きる

ポアソン分布の公式

  P(X=k)=λkeλk!P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}

 λ:単位あたりの平均発生回数
  k:発生回数(0, 1, 2, ...)
  e:自然対数の底(≈ 2.718)

期待値:μ = λ
分散 :σ² = λ   ← 期待値と分散が一致

具体例:1時間の来店客数が平均3人のカフェ

 λ=3(1時間に平均3人来店)のとき、 k 人来る確率を求めてみます。

P(X=0)=30e30!0.05 (5%)P(X = 0) = \frac{3^0 e^{-3}}{0!}\approx0.05\ (5\%)
P(X=1)=31e31!0.15 (15%)P(X = 1) = \frac{3^1 e^{-3}}{1!}\approx0.15\ (15\%)
P(X=2)=32e32!0.22 (22%)P(X = 2) = \frac{3^2 e^{-3}}{2!}\approx0.22\ (22\%)
P(X=3)=33e33!0.22 (22%)P(X = 3) = \frac{3^3 e^{-3}}{3!}\approx0.22\ (22\%)
P(X=4)=34e34!0.17 (17%)P(X = 4) = \frac{3^4 e^{-3}}{4!}\approx0.17\ (17\%)
  …(以下省略)

期待値 = 分散 = λ = 3

 下の図は、λ の値を変えたときのポアソン分布の形を比べたものです。λ が大きくなるほど分布の山が右にずれ、かつ平らに広がっていきます。(正規分布に近づく。)

ポアソン分布のポイントまとめ

項目内容
適用場面単位あたり平均λ回起こる事象がk回起こる確率分布
パラメータλ(単位あたりの平均発生回数)
期待値λ
分散λ
典型例来客数、コールセンターの着信数、交通事故件数

6.4 二項分布とポアソン分布の使い分け・関係

 二項分布とポアソン分布は、どちらも「何回起きるか」を扱いますが、使いどころが違います。大まかな選び方は次のとおりです。

比較項目二項分布ポアソン分布
試行回数 n有限・明確(例:10回)非常に大きい・不明確(例:1時間の全通行人数)
成功確率 p0.1〜0.9 程度非常に小さい(例:0.001以下)
パラメータn と p の2つλ(= np)の1つ
典型例コイン投げ10回、品質検査1時間の来客数、1日の事故件数

 n が非常に大きく、p が非常に小さいとき(λ = np が一定)、二項分布はポアソン分布に近づくという重要な関係があります。これを「ポアソン近似」と呼び、実務でよく使われます。


この章の用語まとめ

用語意味
確率変数試行のたびに値が変わる数値。大文字 X で表す
確率分布確率変数が取りうる値とその確率の対応関係
二項分布 B(n, p)n回の独立な試行で成功がk回起きる確率分布
ポアソン分布 Po(λ)単位あたり平均λ回の事象がk回起きる確率分布
期待値確率分布上の「確率で重みづけした平均」
二項分布ではnp、ポアソン分布ではλ
ポアソン近似n大・p小のとき二項分布をポアソン分布(λ=np)で近似する手法

 次章では、統計学で最も重要な分布である 正規分布 を学びます。二項分布やポアソン分布が「離散的(とびとびの値)」なのに対し、正規分布は「連続的な値」を扱います。68-95-99.7ルールや標準化、中心極限定理など、推測統計の土台となる概念を理解していきましょう。

コメント

タイトルとURLをコピーしました