【統計学入門 第1章】統計学ってなんのため?データから「意味」を引き出す技術

統計学入門

対象レベル:ゼロから学ぶ入門者 | 所要時間:約15分


📌 この章で学ぶこと

  • 統計学が「何のための学問か」を理解する
  • 記述統計と推測統計の違いを説明できる
  • このシリーズ全体の学習マップを把握する

1. あなたはすでに毎日「統計」を使っている

 こんな場面を想像してください。

☀️ 天気予報:「明日の降水確率は70%」
→ 過去のデータから「似た気象条件のとき、70回に1回雨が降った」という統計的推測

📊 ニュース:「内閣支持率48%、前月比−3ポイント」
→ 数千人への調査から日本全体の傾向を推測

💊 医療:「この新薬は有効率80%」
→ 臨床試験の標本データから治療効果を推定

🛒 EC:「あなたへのおすすめ商品」
→ 購買履歴の統計パターンから好みを予測

 私たちは毎日「統計」に囲まれています。しかし、その数字が何を意味し、どこまで信頼できるかを正しく読む力を持っている人はどれくらいいるでしょうか?

 統計学を学ぶことは、このような数字を「なんとなく信じる」から「根拠をもって理解する」に変えることです。

2. 統計学とは何か?

 統計学(Statistics)とは、データを収集・整理・分析し、そこから客観的な結論を引き出す学問です。

一言で表すなら——

「不確かな世界の中で、データをもとに合理的な判断をするための道具」

 私たちが知りたいことのほとんどは、完全には調べ尽くせません。日本国民全員に聞くこともできなければ、未来を直接見ることもできません。統計学は、限られたデータから最大限の情報を引き出す技術です。

3. 記述統計と推測統計:2つの大きな柱

 統計学は大きく2種類に分かれます。この違いを理解することが、統計学全体の地図を描く第一歩です。

🔵 記述統計(Descriptive Statistics)

 手元にあるデータをそのまま整理・要約する統計です。

身近な例:
あなたが担任するクラス30人のテスト結果をもとに
 ・平均点を計算する(→ 第3章)
 ・点数のばらつきを確認する(→ 第4章)
 ・棒グラフ・ヒストグラムで視覚化する
これらはすべて「記述統計」です。30人のデータについて語っているだけで、
他のクラスや来年のクラスについては何も言っていません。

🔴 推測統計(Inferential Statistics)

 一部のデータ(標本)から、全体(母集団)を推測する統計です。

身近な例:
全国の高校生の学力を調べたい。でも全員(約300万人)には調査できない。
→ 無作為に選んだ1,000人を調査(標本)
→ その結果から全国平均を「推定」する(→ 第9・10章)
→ 「去年より学力が下がった」という主張を統計的に検証する(→ 第11章)
これが「推測統計」です。
比較項目記述統計推測統計
目的データを整理・要約する標本から母集団を推測する
対象手元のデータそのものデータの背後にある母集団
代表的な手法平均・分散・グラフ推定・仮説検定
クラス30人の平均点を出す全国の平均点を1,000人から推測する
このシリーズでの扱い第1〜4章第8〜11章

4. 統計学はどんな場面で使われている?

 統計学は特定の「理系の専門家」だけのものではありません。現代のあらゆる分野に浸透しています。

🏥 医療・薬学
新薬の臨床試験、疫学調査、がんの発症リスク解析
💹 ビジネス・マーケティング
A/Bテスト、需要予測、顧客セグメンテーション
🤖 AI・機械学習
機械学習の基盤は統計学。回帰・分類・クラスタリング
🗳️ 政治・社会科学
世論調査、選挙予測、社会調査の分析
🏅 スポーツ
選手のパフォーマンス分析、セイバーメトリクス
🔬 自然科学
実験結果の有意差検定、観測データの解析

 「データサイエンス」や「AI」という言葉が溢れる現代、その根底にあるのは統計学です。統計学を学ぶことは、現代を生きるための基礎教養とも言えます。

5. このシリーズの学習マップ

 全12章の構成をあらかじめ把握しておくと、各章で「今どこにいるか」が分かり、学習効率が上がります。

ステップテーマ学ぶ内容
STEP 1第1〜4章記述統計データの整理・代表値・ばらつきの表し方
STEP 2第5〜7章確率・分布確率の基本・二項分布・正規分布
STEP 3第8〜10章推測統計(推定)標本と母集団・点推定・信頼区間
STEP 4第11〜12章推測統計(検定・分析)仮説検定・相関・回帰分析

 各ステップは前のステップを土台にしています。急いで先に進まず、各章をしっかり理解してから次へ進むことをおすすめします。

6. 統計学を学ぶ上での心構え

 最後に、統計学を学ぶ上で大切な3つのことをお伝えします。

① 「なぜこの式が使われるのか」を意識する
公式の丸暗記ではなく、「この状況でこう考えると、この式になる」という流れで理解しましょう。

② 具体的な例で考える
抽象的な定義を見たら、必ず「身近な例に当てはめると?」と考える習慣をつけましょう。

③ 「誤差・不確実性」を友達にする
統計学は「絶対の正解」を出す学問ではありません。「どれくらいの確率で正しいか」を扱う学問です。この曖昧さと付き合う力が、統計的思考の本質です。

📝 章末練習問題

 理解度を確認するために、以下の問題を考えてみましょう。答えはこの記事の最後に掲載しています。

Q1. 次の状況は「記述統計」と「推測統計」のどちらに当てはまるか答えよ。

(a)自社ECサイトの先月1ヶ月間の平均注文単価を計算した。
(b)1,000人へのアンケートから「20代女性の8割がSNSを毎日使用する」と結論づけた。
(c)工場で生産した製品の中から100個を検査し、全ロットの不良品率を推定した。
Q2. 統計学が役に立つ場面を、自分の仕事や日常から1つ挙げ、 「何のデータを集めて」「何を知りたいか」を具体的に説明せよ。
Q3. 「内閣支持率52%」というニュースを見た。このデータについて、 統計的に考えると「信頼性」の観点でどんな疑問が浮かぶか? (ヒント:誰に・何人に・どうやって聞いたか)
▶ Q1の解答を見る
(a)記述統計:先月の自社データを整理・要約しているだけ。
(b)推測統計:1,000人の標本から「20代女性全体」という母集団を推測している。
(c)推測統計:100個の標本から「全ロット」という母集団の不良品率を推定している。

✅ この章のまとめ

  • 統計学とは「データから客観的な結論を引き出す学問」。現代のあらゆる分野で使われている
  • 記述統計:手元のデータをそのまま整理・要約(平均・分散・グラフなど)
  • 推測統計:標本データから母集団全体を推測(推定・仮説検定)
  • このシリーズはSTEP1(記述統計)→ STEP2(確率・分布)→ STEP3(推定)→ STEP4(検定・分析)の順で学習する

➡️ 次の章へ

第2章:データの種類を整理しよう — 量的データと質的データ

統計的分析の第一歩は「手元のデータがどの種類か」を見極めることです。
数値として扱えるデータと、カテゴリとして扱うデータでは、使える分析手法がまったく異なります。

次の章では、データの4つの「尺度水準」まで踏み込み、「どのデータにどの手法が使えるか」を整理します。

引き続き一緒に学んでいきましょう。

コメント

タイトルとURLをコピーしました