少し前から気になっていたベイズ。そういえば…と思い出すたびにググり,いくつかのサイトを見てどういうものなのか知ろうとしていたのだけど,なんのこっちゃよくわからんでいつも終わっていた。まとまった時間がとれたので,それなら本でも読むかということで手にした本が,小島寛之「完全独習 ベイズ統計学入門」である。
昨日の午後から今日の午前にかけて数時間,本に載っている練習問題を解きつつ一通り最後まで読んでみたが,とてもわかりやすい。こと本書の前半部は,身近で具体的な例を使って,数式ではなく図解でベイズ確率(ベイズ統計)の考え方を手順を踏んで説明し,かつ,これでもかというくらいに同じ説明を繰り返してくれるので,1回読んだだけでベイズの考え方を頭にこびりつけることができる。初学者にとってこの4点はとてもありがたい。
この本では,仮説検定(ネイマン・ピアソン統計学に基づくらしい)のプロセスも少し説明されていて,それとベイズで行う推定の違いが明記されている。仮説検定は心理学ではおなじみの統計処理である。なので私は,これまでに何度も何度も説明を聞き,本も何冊か読んでいる。にもかかわらず,よくよく頭に定着してくれない代物なのだが,ベイズ推定との比較の説明を読んで,その2つの考え方の違いに興味を惹かれた。その違いとは,「おおよそ」の解釈の違いである。
本書に記載のあったことを引用しつつ簡単にまとめると,「おおよそBであろう」の解釈は,
ネイマン・ピアソン:「リスクはあるが,Bを結論しよう」
ベイズ:「AもBもありうるが,Bのほうが可能性が十分大きいだろう」
となるらしい。
ちなみに,ネイマン・ピアソンにおけるリスクとは,間違った結論を出すリスクである。このあたり,話がやや複雑になるのだが,AとBがあってBが正しいとき,間違ってAと判断するリスクである。このリスクは有意水準によって数値化される。有意水準が5%であれば,100回のAとBについての判断(検定)のうち,5回はAと間違って結論する可能性があるということである。心理学では有意水準はたいてい5%(たまに1%)を用いるが,なんでその数値なのかは正直よくわからない(慣例的に,という説明しか今まで聞いたことがない)。とはいえ小さなリスクなので,リスクは置いておいてBと結論しよう,というわけである。いずれにしても,データを統計処理しその結果を有意水準と照らし合わせることで,結論は1つに決まる。
一方ベイズはどうかというと,結論は1つに決まるというよりも,決めるといったニュアンスが含まれているように感じられる。この場合,ベイズに基づく統計処理によって出てくるのは,AとB両方の可能性(確率)である。つまりベイズは,どっちにも可能性はこんだけあるよ!という情報を教えてくれるのみである。統計処理においては結論は留保され,どういう結論を導くかは,結論を出す人次第となる。
この2つの考え方の違いから,日々私はどうやって推測しているんだろうと振り返ってみたのだが,ネイマン・ピアソン流の解釈である「リスクはあるがBを結論しよう」タイプだと思う。とはいえ,そもそも仮説を立てていなかったり,有意水準も全く無視,ろくに計算すらしていないので,杜撰な推測か直観で結論が一つに導かれる,かっこつきの「リスクはあるがBを結論しよう」タイプである。むしろ厳密にいえば,デフォルトは「Bを結論しよう」で,リスクがあることを一応認識している場合は,「(リスクはあるが)Bを結論しよう」かもしれない。いずれにしても,一つの結論にいつのまにか決まっている。そう,直観が働くときはたいてい一直線に結論に到達しているのだ。杜撰な推測の場合も,杜撰なので寄り道をほとんどしない。だから一直線に近い。ベイズの「AもBもありうるが」の想定が,私の推測パターンに登場しないわけではない。ただ,登場しても,AとBを別々に考えてそれぞれに対してあり/なしの結論を出すので,ベイズのように,AとBの相対的な比較から「Bのほうが可能性が十分大きいだろう」などと結論することはほとんどない。この,「AもBもありうるが」という前提を想定し結論を少し留保しておくことの意味は大きいように思う。この話を読んだときにふと頭をよぎったのは,相手の気持ちの読み間違いである。相手がとった行動から相手の意図や気持ちを推測するとき,ついつい自分が知っているいろんな情報や直観からこうだ!と結論づけてしまいがちだが,「AもBも(CもDもEも…)ありうるが」ということを想定し,(さらにはそれぞれの可能性について考えをめぐらし,)結論を少し留保しておけば,無駄に悩んだり,後に非建設的なけんかをしたりすることは減るように思える。エスパーかよ,自分の直観が正しいとは限らないじゃん!と頭ではわかっているつもりだが,ついついそのことが抜け落ち,今まで不毛な言い争いをしたことは数知れず,である。ベイズ統計でそんなことを考えることになるとは思わなかった。少なくとも,「AもBも(CもDもEも…)ありうるが」と想定しておけば,余裕をもって相手と向き合うことができるだろう。
ベイズ確率の考え方を理解できたという点で,本書は私には有益な本だった。本書の後半部分は,数式や分布図が登場して前半部よりも難しくなる。そのあたりは理解が中途半端なので,復習しておきたい。