「コインを10回投げたとき、表がちょうど7回出る確率は?」「1時間に来店するお客さんは平均3人だとして、5人来る確率は?」——こうした問いに答えてくれるのが 確率分布 の考え方です。
この章では、データのばらつきを確率で表す 確率分布 を基礎から学びます。今回は 二項分布 と ポアソン分布 を、具体例・公式・図解でしっかり理解しましょう。
6.1 確率分布とは何か
確率分布とは、確率変数が取りうる値ごとに「その値が起こる確率」を対応させた関係のことです。前章の「1つの事象の確率」をさらに発展させ、どんな値がどのくらいの確率で起きるか を分布として把握できるようにしたものです。
たとえばコインを3回投げたとき、表の枚数 X は 0〜3 のどれかになります。それぞれの確率を並べると次のようになります。
| 表の枚数 X | 0 | 1 | 2 | 3 |
|---|---|---|---|---|
| P(X = k) | 1/8 | 3/8 | 3/8 | 1/8 |
この表全体が「コイン3回投げの確率分布」です。すべての確率を足すと必ず 1(= 100%)になります。
📌 確率変数:取りうるXに対して、それぞれ起こる確率が与えられるとき、変数Xを確率変数という。(例:コインを投げるたびに変わる「表の枚数」)。大文字の X で表すのが慣例。
6.2 二項分布 — コイン投げで理解する「成功回数の分布」
二項分布(Binomial Distribution)は、「成功か失敗か」の2択で起きる試行をn回繰り返したとき、成功がk回起きる確率を表す分布です。下記条件で確率分布を考えます。
- 各回の結果は「成功(確率 p)」か「失敗(確率 1−p)」の2択
- n回の試行は互いに独立(1回の結果が次に影響しない)
二項分布の公式
P(X=k) = B(n,p) = × pk × (1−p)(n−k)
↑ k回成功 (n-k)回失敗
成功と失敗がどの回で起こるかの場合の数
n:試行回数
k:成功回数(0, 1, 2, ..., n)
p:成功確率
=
期待値:
分 散:
具体例:不良品率10%の工場ラインで10個中k個が不良品になる確率
n=10(10個検査)、p=0.1(不良品率10%)のとき、不良品数 X の確率分布を計算してみましょう。
P(X=0) = × 0.10 × 0.910 ≈ 0.349(34.9%)
P(X=1) = × 0.11 × 0.99 ≈ 0.387(38.7%)
P(X=2) = × 0.12 × 0.98 ≈ 0.194(19.4%)
P(X=3) = × 0.13 × 0.97 ≈ 0.057(5.7%)
…(以下省略)
平均 = 10 × 0.1 = 1.0 個
分散 = 10 × 0.1 × 0.9 = 0.9
下の図は、n=10 で確率 p を変えたときの二項分布の形を比べたものです。p=0.5 のとき左右対称な山型になり、p が偏るほど分布が一方に傾きます。

二項分布のポイントまとめ
| 項目 | 内容 |
|---|---|
| 適用場面 | n回の独立な試行での成功回数の確率分布 |
| パラメータ | n(試行回数)、p(成功確率) |
| 平均 | np |
| 分散 | np(1−p) |
| 典型例 | コイン投げ、不良品検査、アンケートの回答 |
6.3 ポアソン分布 — 「まれな出来事の件数」を予測する
ポアソン分布(Poisson Distribution)は、単位時間や単位面積で、平均 λ(ラムダ)回起きる事象が、k 回起きる確率を表す分布です。次のような状況で使います。
- 事象が起きる確率は非常に小さい(まれな出来事)
- 試行回数 n は非常に大きい
- 各事象は独立に起きる
ポアソン分布の公式
λ:単位あたりの平均発生回数
k:発生回数(0, 1, 2, ...)
e:自然対数の底(≈ 2.718)
期待値:μ = λ
分散 :σ² = λ ← 期待値と分散が一致
具体例:1時間の来店客数が平均3人のカフェ
λ=3(1時間に平均3人来店)のとき、 k 人来る確率を求めてみます。
…(以下省略)
期待値 = 分散 = λ = 3
下の図は、λ の値を変えたときのポアソン分布の形を比べたものです。λ が大きくなるほど分布の山が右にずれ、かつ平らに広がっていきます。(正規分布に近づく。)

ポアソン分布のポイントまとめ
| 項目 | 内容 |
|---|---|
| 適用場面 | 単位あたり平均λ回起こる事象がk回起こる確率分布 |
| パラメータ | λ(単位あたりの平均発生回数) |
| 期待値 | λ |
| 分散 | λ |
| 典型例 | 来客数、コールセンターの着信数、交通事故件数 |
6.4 二項分布とポアソン分布の使い分け・関係
二項分布とポアソン分布は、どちらも「何回起きるか」を扱いますが、使いどころが違います。大まかな選び方は次のとおりです。
| 比較項目 | 二項分布 | ポアソン分布 |
|---|---|---|
| 試行回数 n | 有限・明確(例:10回) | 非常に大きい・不明確(例:1時間の全通行人数) |
| 成功確率 p | 0.1〜0.9 程度 | 非常に小さい(例:0.001以下) |
| パラメータ | n と p の2つ | λ(= np)の1つ |
| 典型例 | コイン投げ10回、品質検査 | 1時間の来客数、1日の事故件数 |
n が非常に大きく、p が非常に小さいとき(λ = np が一定)、二項分布はポアソン分布に近づくという重要な関係があります。これを「ポアソン近似」と呼び、実務でよく使われます。
この章の用語まとめ
| 用語 | 意味 |
|---|---|
| 確率変数 | 試行のたびに値が変わる数値。大文字 X で表す |
| 確率分布 | 確率変数が取りうる値とその確率の対応関係 |
| 二項分布 B(n, p) | n回の独立な試行で成功がk回起きる確率分布 |
| ポアソン分布 Po(λ) | 単位あたり平均λ回の事象がk回起きる確率分布 |
| 期待値 | 確率分布上の「確率で重みづけした平均」 二項分布ではnp、ポアソン分布ではλ |
| ポアソン近似 | n大・p小のとき二項分布をポアソン分布(λ=np)で近似する手法 |
次章では、統計学で最も重要な分布である 正規分布 を学びます。二項分布やポアソン分布が「離散的(とびとびの値)」なのに対し、正規分布は「連続的な値」を扱います。68-95-99.7ルールや標準化、中心極限定理など、推測統計の土台となる概念を理解していきましょう。

コメント