【読書】 条件付き確率を面積の計算だけで解説しちゃう本

※かじとじむ(当サイト)は、ふだんはネット情報のまとめサイトですが、ときどき管理人が読んだ本をまとめています。読書タグや、ざっくりまとめタグからどうぞ!


小島寛之著「ベイズ統計学入門」を読みました。

完全独習 ベイズ統計学入門
小島 寛之
ダイヤモンド社
2015-11-20


本書は、

  • これまで一般向けの数学解説書を数多く書いてきた著者が、
  • ベイズ統計学が普通の統計学(ネイマン・ピアソン統計学)とどう違うのかを
  • ほぼ面積を使った簡単な計算だけで解説してしまう本です。

おそらく、ベイズ統計学の本としては、
かなり読みやすい本なのではないかと思いました。

===

とはいえ、「そもそもベイズ統計って、何?」
と思う方もいるでしょう。

本書では、ベイズ統計が、世界的に重要になりつつあるということを、
いろいろな事例をまじえつつ書かれていますが、
わたしが一番面白いと思ったのは、以下の問題でした。

===

ある特定のガンの罹患率を0.1パーセント(0.001)とします。このガンに罹患しているかどうかを検査する簡易的な方法があって、このガンに罹患している人は95パーセント(0.95)の確率で陽性と診断される。他方、健康な人が陽性と誤診される確率は2パーセント(0.02)である。さて、この検査で陽性と診断されたとき、あなたがこのガンに罹患している確率はいくつだろうか?(p.33)

なんとなく、最近のコロナ関連のニュースで、
見たことあるような話題ではないかと思います。

あなたは、何パーセントくらいだと思いますか?

直感的には、90パーセントくらいは罹患してそうだと
思うのではないでしょうか。

実際に条件付確率を解いてみると、約4.5パーセント(0.045)になります。

直感的には、90パーセントくらい。
しかし実際は、約4.5パーセント。

これは大きく直感とは異なる結果なのではないかと思います。
(とはいえ、0.1パーセントが4.5パーセントに上昇しているので、
 まったく喜べない結果であることには、違いは無いのですが)

===

上記のような直感に反する結果は、
いまのコロナが流行し始めたころ(2年近く前)、
政府や医療機関などがPCR検査の結果を
なかなか公表しなかった理由なのかなと、
今になって思いました。

コロナの感染率が極端に低い時期に、
陽性率の結果だけを公表してしまった場合、
直感的な解釈をして、パニックになってしまうひとが
一定数いたと思われます。

パニックにならないとしても、
悲観的な想像をした人は多かったのではないでしょうか。

きちんと、条件付確率を計算できる人だけが、
こういった生の情報にはアクセスできるように
なっていたのかなぁ。

===

ベイズ統計で使われる条件付確率が、
現代においていかに重要かは、
上記の問題を解いてみるだけでも、
何となくわかっていただけたと思います。

本書は、この条件付確率の計算を、
長方形の面積を計算するだけで解説してしまいます。

第2部以降では、正規分布や、ベータ分布を解説するので、
長方形の面積計算だけではないのですが、

少なくとも、本書の根幹部分であり、いちばん面白い部分でもある、

P(A) P(黒 | A) : P(B) P(黒 | B)

の導出までは、面積計算で説明されます。

※上記の比が、何を意味しているのかは、
 ぜひ本書を読んでみて、確かめてみてください。

===

本書は、かなり読みやすい本です。

数学が多少苦手でも、掛け算さえできれば、
いちばん面白いところまでは、読み進められるからです。

しかも、今の時事問題を考えることにも役に立ちます。
特に今のような、感染症が蔓延している世の中においては。

なんとなくベイズ統計に興味が出てきたな、
という方は、ぜひ読んでみてください。

かじとじむ のオススメ記事: