確率の問題って、学校できちんと教わらない場合もあり、ことによると微積よりも難しく感じるかもしれません。
そこで今回は、「高校受験のための中学数学確率講座(シャシャに騙されないために)」と題して、自由掲示板で話題になっていたモンティホール問題をネタに講釈してみようと思います。
そもそも確率とはなんでしょうか?
「部屋を出て最初に出会う人が男である確率は
である。」という場合、
1.出会う人には男である場合と女である場合と2通りある。
2.そのうち、男である場合は1通りである。
ということを意味しています。つまり、

というわけです。
ただ、これを確率として議論する場合、想定されているあらゆる局面において全ての可能性が等確率で現われるとします。
たとえば、男子校の寮の部屋を出て最初に出会う人が男である確率はほぼ1ですよね。
もちろんこの場合、全ての場合の偏在率を計算に入れて確率の議論を進めることもできますが、ここでは扱いません。
大事なのは

という式です。条件が複雑なように思えても、この単純な式で考えれば「場合の数」を数えるだけで解けます。
さて、自由掲示板で設定されていた問題を簡単に再掲します。
(前提)10名のNPCのうち1名だけが正解である。
(アクション1)「私」がある1名のNPCに突進しようとする。
(アクション2)地域で8名のNPCについての報告がなされる。その8名の中に「私」が選んだNPCは入っておらず、また正解も入っていない。
この二つのアクションそれぞれについて、場合の数を考えてみましょう。
まずアクション1において、「私」が正解を選ぶ確率は、言うまでもなく
ですね。
では正解を選ばない確率は?もちろん
です。
これはどういうことかと言うと、
全ての場合の数:10通り
正解の場合の数:1通り
不正解の場合の数:9通り
という意味です。先程の

で確率が求められるのがわかりますね。
では続いてアクション2です。
8名のNPCについての報告がなされるわけですが、
この報告についてどんな場合が考えられるかというと、
1.誰かが正解を報告する。
2.誰も正解を報告しない。
の二種類がありますね。
それともう一つ、重要な要素があります。
1.私が選んだNPCについて報告がなされる。
2.私が選んだNPCについて報告がなされない。
というものです。
「正解」も「私が選んだNPC」も1つです。
では、それが8回の報告に入っているかいないかはどう考えたらいいでしょうか?
この場合は、それぞれの報告に番号を付ければいいのです。
全部で10回の報告番号を付けてみましょう。
「abcdefghij」
これで、10名のNPC全ての報告番号が決まりますね。
そのうち、実際には8名が報告されるわけですから、最後の「ij」は報告されないことになります。
もうわかりましたか?
「正解」に与えられる報告番号の全ての場合の数は10通りです。
そして、それが報告された8名に入らない場合の数は2通りです。
従って、
1.誰かが正解を報告する。 → 
2.誰も正解を報告しない。 → 
だということになります。「私が選んだNPC」についても同様です。
ここから少し難しくなります。
アクション2では、
8名の報告の中に、「正解」があるかないか、「私が選んだNPC」があるかないか、
の別々の条件を組み合わせて考えなければならないのです。
実はここでアクション1の結果がどちらであったかが関係してきます。
アクション1で私が正解を選んでいた場合、
「正解」=「私が選んだNPC」ですから、
「正解」があるかないかと「私が選んだNPC」があるかないかとは独立した別々の条件ではなく、単一の条件だということになります。
したがって、
a:アクション1で私が正解を選び、8名の報告の中に正解がない場合 
b:アクション1で私が正解を選び、8名の報告の中に正解がある場合 
となります。こちらは簡単ですね。
アクション1で私が正解を選ばなかった場合が複雑です。
8名の報告の中に 私も正解もない。
私があり正解がない。
私がなく正解がある。
私も正解もある。
の4パターンを考えないといけません。
これも先程の「番号付け」で考えてみましょう。先程は「正解」にのみ番号を付けましたから10通りでした。更に「私」にも番号を付けるとしたらどうなるでしょうか?
先に「正解」に番号が付いている場合、残った番号は9個しかありませんから、「私」に付く番号は9通りです。この二つの場合の数を複合させるにはかけ算をします。
つまり、「正解」「私」のそれぞれの番号の付け方の場合の数は10*9=90通りです。
この「かけ算」がわかりにくいようでしたら、実際に「正解」と「私」に番号を付けてみるといいでしょう。
正解:a 私:bcdefghij 9通り
正解:b 私:acdefghij 9通り
正解:c 私:abdefghij 9通り
正解:d 私:abcefghij 9通り
正解:e 私:abcdfghij 9通り
正解:f 私:abcdeghij 9通り
正解:g 私:abcdefhij 9通り
正解:h 私:abcdefgij 9通り
正解:i 私:abcdefghj 9通り
正解:j 私:abcdefghi 9通り
9通り*10=90通り
さて、そのうち私と正解とともに報告からはずれる場合の数は何通りでしょう?
上に全ての場合を尽くしましたから、数えればわかりますが、ijとjiの2通りですね。
従って、8名の報告の中に 私も正解もない 確率は
となります。
私があり正解がない場合は、
私がij以外で、正解がiかjのどちらかですから、これも上の表を数えれば 8*2=16通り だとわかります。
私がなく正解がある場合は、それの裏返して同じ数、 16通りです。
では、8名の報告の中に私も正解もどちらも含まれる場合の数は?
数えるのがめんどくさそうですが、これは実は、簡単な引き算で出てきます。四種類の場合の数を全部足すと、全ての場合の数になるわけなので、
90-(2+16+16)=56通り
というわけです。
まとめると、
c:1で私が正解を選ばず、8名の報告の中に私も正解もない。 
d:1で私が正解を選ばず、8名の報告の中に私があり正解がない。 
e:1で私が正解を選ばず、8名の報告の中に私がなく正解がある。 
f:1で私が正解を選ばず、8名の報告の中に私も正解もある。 
となります。
さて、実際の8名の報告の中には私も正解もなかった、ということでしたから、
このa~fのうちの、aとcのみが該当することになります。
a:1で私が正解を選んだ時、8名の報告の中に正解がない場合 
c:1で私が正解を選ばなかった時、8名の報告の中に私も正解もない 
ということでしたから、これを比べると、aの方が確率が高いように見えますね。
ですが、この確率には「アクション1」の確率が入っていません。
そもそも1で私が正解を選ぶ確率は
、選ばない確率は
でしたから、
それをかけ算すると、
a:私が選んだ方が正解 → 
c:私が選んだ方が不正解 → 
となって、残った二つのうち、どちらを選んでも(選び直しても)正解する確率は変わらないのがわかりますね。
これが確率の常識です。
さて、モンティホール問題に移ります。
レスにもあったように、これは見識のある数学者がことごとく間違えるという「事件」になったそうです。
というのも、常識的には、残された選択肢のどちらを選んでも正解する確率は同じに見えるからです。そこにこの問題の「罠」があるのだし、その意味でこの問題は確率研究上の大発見だと言えます。
モンティホール問題にはいくつかの成立要件があります。ここでは説明の都合上必要なものだけ挙げます。
それは、「私が選ばなかった選択肢の中から一つを除いてそれ以外が全て不正解だと示す」ということです。
これは極めて作為的なことであり、当初の書き込みにあったような「たまたまそうなった」というものとは全く異なります。
ここの問題で話すと、
アクション1で私が正解を選んだ → 自動的に a となる。
アクション1で私が不正解を選んだ → 自動的に c となる。
というものなのです。
この場合の確率は
と
ではありません。
なぜならば、bdefの選択肢は「たまたま起きなかった」のではなく、「システムとして起きないようになっている」からです。つまり、bの場合は全てaになるのだし、defの場合は全てcになるのです。
従って、
a:
c:
となり、「自分の選択を変更した方が正解率が高くなる」わけです。
数式を使わない別の説明を最後にしてみましょう。
abcdefghijのうち、正解がaだったとします。
私が 正解のaを選ぶ確率
モンティ後axが残る。
私が不正解のbを選ぶ確率
モンティ後abが残る。
私が不正解のcを選ぶ確率
モンティ後acが残る。
私が不正解のdを選ぶ確率
モンティ後adが残る。
私が不正解のeを選ぶ確率
モンティ後aeが残る。
私が不正解のfを選ぶ確率
モンティ後afが残る。
私が不正解のgを選ぶ確率
モンティ後agが残る。
私が不正解のhを選ぶ確率
モンティ後ahが残る。
私が不正解のiを選ぶ確率
モンティ後aiが残る。
私が不正解のjを選ぶ確率
モンティ後ajが残る。
さて、選択を維持するのと変更するのとどちらが正解率が高いでしょう?
なお、大事なことなので繰り返しますが、これはあくまで、「作為的なモンティがシステム通りに不正解を開示する」と決められている場合にのみ成立します。
たまたまここまで正解が出なかったんだけど、という場合には成立しません。
つまり、たまたま先に突進した8名が全て不正解を引き当てたとしても、その時に私がトモの前にいたか、キューリの前にいたか、カムの前にいたかは、残りの選択肢の正解率に作用しません。これは常識で考えてよいことです。
もちろん、9名の報告全てが不正解だった場合は、迷わず残りの1名に突進していいでしょう。しかし、そこまで正解が報告されない確率は、実は何の報告も聞かずにいきなり突進して正解する確率と同じなんです。(なので、これが「先着1名」という条件だったら、何番目に突進しようが確率は同じ。)