AIや機械学習では、データの背後にある確率的性質を理解することが不可欠です。
確率分布は「不確実性を数学的に表現する道具」であり、学習モデルや誤差解析の基盤となります。
確率分布の基礎
確率変数
- ランダムな事象を数値で表現したもの。
- 例:サイコロの出目、株価の変動。
確率分布
- 確率変数がどの値をどの程度の確率でとるかを定めたもの。
- 確率質量関数(PMF):離散値(二項分布など)。
- 確率密度関数(PDF):連続値(正規分布など)。
二項分布(Binomial Distribution)
定義
- 成功確率 \(p\) の試行を \(n\) 回行ったときの成功回数の分布。
特徴
- 成功/失敗のような 二値分類 に対応。
- 平均:\(np\)、分散:\(np(1-p)\)。
応用例
- コイン投げで表が出る回数。
- 機械の不良品発生率。
正規分布(Normal Distribution)
定義
- 平均 \(\mu\)、標準偏差 \(\sigma\) に従う連続分布。
特徴
- 釣鐘型の分布。
- 中心極限定理により、独立変数の和は正規分布に近づく。
- 自然界や社会現象に多く見られる。
応用例
- 身長や体重の分布。
- モデル誤差の分布。
ポアソン分布(Poisson Distribution)
定義
- 一定時間や一定空間での稀な事象の発生回数を表す分布。
- 平均 \(\lambda\) のとき:
特徴
- 平均と分散がともに \(\lambda\)。
- 二項分布の極限として導かれる。
応用例
- コールセンターへの着信回数。
- 地震や交通事故の発生回数。
- 医療での稀な病気の発症率。
まとめ
- 二項分布:成功回数の分布。
- 正規分布:自然界に多い連続分布。
- ポアソン分布:稀な事象の発生回数。
出題チェック
- 二項分布の平均・分散 → \(np, \ np(1-p)\)
- 正規分布の形を決める要素 → 平均 \(\mu\) と標準偏差 \(\sigma\)
- ポアソン分布の用途 → 稀な事象の回数
練習問題(例題)
問題:あるコールセンターで、1時間あたり平均5件の電話が来る。このとき「1時間にちょうど7件の電話が来る確率」を表す分布はどれか?
- 二項分布
- 正規分布
- ポアソン分布
- 一様分布
👉 正解:3