機械学習や意思決定にも使われる「ベイズ統計」の入門書。実際に観測された値を使えるため現実に即している点、既知の確率から未知の確率を推定できる点がベイズ統計の優れているところです。例えば、迷惑メールフィルタにおいて、どのメールが迷惑メールかを統計的(確率的)に判定するところにベイズの定理が使われています。初心者向けにわかりやすく書かれています。下地がなくても2周すれば何とか理解できると思います(たぶん)。


↑気になったらここからポチっと(買ってくれるとお小遣いが入ります)↑
↓気になったらここからポチっと(買ってくれるとお小遣いが入ります)↓
↑気になったらここからポチっと(買ってくれるとお小遣いが入ります)↑
この本を読むとわかること
「ベイズ統計」ってなんだろう?
- 「データが少なくても何とかなる」という従来の統計にはない利点で注目を集めたベイズ統計
- 恣意性を排除できないため、長らく日の目を見なかったが、ワンパターンな統計学では対応できないデータが増えたことから脚光を浴びる
- 経営の意思決定などにも応用可能な裾野の広さ
確率の「4つの基本」を押さえよう
- 同時確率:条件Aと条件Bをともに満たす確率
- 条件付き確率:条件Aが成立するときに条件Bも成立する確率
- 同時確率・条件付確率は長方形のマトリクスで考える
- 乗法定理:同時確率を計算するときに使う確率の掛け算
- 2回目の試行は1回目の結果を引き継ぐイメージ
- 加法定理:同時に成立しない確率は場合分けして個別に求め、加算
「ベイズの定理」を理解しよう
- ベイズの定理:Bが起こった時にAの起こる確率×Bの起こる確率=Aが起こった時にBの起こる確率×Aの起こる確率
- 上の式を変形して、Bが起こった時にAの起こる確率=(Aが起こった時にBの起こる確率×Aの起こる確率)/Bの起こる確率
- Aを仮説・Bをデータとすると、そのデータが得られたときに仮説が成立している確率=(仮説のもとでデータが得られる確率×仮説が成立する確率)/データが得られた確率
- 未知の確率を既知のデータ・エイヤで仮定できる数字で表現できる点が革新的
- 事後確率=(尤度×事前確率)/データが得られた確率 とも表現可能
「ベイズの定理」を応用しよう
- 「ベイズ的意思決定」で解くモンティ・ホール問題
- ABC3枚のカードのどれか1つがアタリの場合で、Aを選択した後にCがハズレあると知らされた場合にAからBに選択を変えたほうが確率的には良い理由
- 直接与えられていない確率を「技巧的」に求めるベイズの定理
- ベイズの定理で読み解く病気の検査の正確性
- 事前確率×尤度=陽性と検知する確率×その病気にかかる確率
- ちゃんと理解しておくべき「1日が曇りの時に2日が雨の確率」と「2日が雨の時に前日の1日が曇りの確率」の違い
「理由不十分の原則」と「ベイズ更新」を理解しよう
- 理由不十分の法則:ベイズの定理において事前確率が分からない場合は「それっぽい値」を当てはめようという柔軟性
- 数学的に厳密でなくても、現実の経験値・感覚値を使えるわかりやすさ(経験を事前確率として数式に入れられること)がメリット
- この非厳密性がベイズの理論が200年近く日の目を見なかった理由
- 複数回の試行において使われる「ベイズ更新」
- 1回目に求めた事後確率=2回目の事前確率
- AIの性能向上にも使われているベイズ更新
- 迷惑メールの検出に使われる「ベイズフィルター」
「ベイズ統計学」を理解しよう
- コインの裏表の確率を1/2という定数ではなく、実際に観測された確率を適用するのがベイズ統計学
- 1回目の試行の事前確率を「それらしい値」として事後確率を計算、2回目の試行の事前確率は1回目の事後確率
- 事後分布は事前分布×尤度に比例
正規分布データをベイズ統計で分析しよう
- ベイズの定理の「尤度」に「正規分布の公式に実際に観測された値を代入したもの」を使うのがポイント
- 従来の統計学では脇役だった確率分布がベイズ統計学では主役に
↓気になったらここからポチっと(買ってくれるとお小遣いが入ります)↓