[ベイズ推定の一般公式]がいかに導出されるのかについての(高校生程度の識見でも理解できようとの)「段階的」説明として
(前頁の後半部、それについて筆を割いてきた補足2と振っての部から本題に立ち戻るとして)
本稿ここまでの流れ、にあってのつい先立っての部までにて
[所与の条件を与えられた[データ]が入力された際に特定の結果(確率論における[事象])が機械的に導出されてくるとの手順]
を呈示した ―いわばもの機械的手順、その仕様を事細かに示すとのフローチャート図を付しながらも呈示した― 。
これ以降はそうもした先掲の[処理手順]に基づいて導出されてくる【結果】 (賽の目1から6の出方、そうしたものとなる【事象】 ―離散的な、結果がてんでばらばらにひとつの試行に対して顧慮されるとの原始的確率論における【事象】― こそが[データ]がランダムに投入される(この場合、【ランダムなデータ投入】のプロセスは【サイコロを振る】とのことに置き換えてもいい)ことを想定しての[処理手順]から導出されるまさしくものその【結果】に照応するものとなる) に対する観測を通じていかような確率分析をなしていくのか、その解説を極々基本的なるところからなすこととする。
まずもって述べるが、
[条件付き確率]( Conditional probability )
との確率論における通用化された概念が存在する。
そちら[条件付き確率]は字義通りの意味合いのものとなり、
[特定の条件の下、特定の結果が現出する確率]
のことを指す。そして、通例、初等数学( Primary Mathematics )にては
P(A|B)・・・・[1]
との表記にて「Bという条件の下で」Aが発生する確率 (P(A|B)におけるPはProbabilityの頭文字である) との表記を[お定まりのもの]としてなすものである(:同[条件付き確率]、「ここ最近の」日本の高校の教育でも基礎中の基礎として学習範囲に入っているようであるから、多くの人間が聞き及んでいる概念か、とは思う)。
「基本的なこととはなるのだが(「Primary」「Basic」といった形容詞を付けられもする基本の「き」となるところなのだが)、といった中でも式の意味合いについては続けて細かい解説をなしていく所存である」
と申し述べたうえで示せば、同じくもの[条件付き確率]の代表的な式は下のようなものとなる。
P(A|B)=P(A∩B)/P(B)・・・・[2]
上の[2]の式の意味合いだが、その「皮相的な」意味 ―その指し示すところをきちんと説明せずにもの「皮相的な」意味― としては
[左辺のP(A|B)たる【Bという条件の下でAが起こる確率】は右辺の【AかつBが起こる確率】(P(A∩B)を【Bが起こる確率】(P(B))で割った確率に等しい]
とのものとなる。
では何故、表記のような式が導出されるのか。そこからして説明をなす、P(A∩B)を具にして説明を講じておくことにする(本稿の理念は ―再度もってして述べるが― (段階的に検討いただけもすれば)多くの向きに理解なしていただけるであろうとの確率論を展開することにある)。
については、そう、直情表記のような条件確率の一般公式がなぜもって導出されてくるのかについては英文Wikipedia[ Conditional probability ]の現行記事に
[非常に分かり易い例]
が現行は載せられているのでそちら内容をほぼ踏襲しての方式にての視覚的説明をなすことからはじめる(以下、解説部をご覧いただきたい)。
(最も基本的なるところとしての[条件付き確率の基本式]の意味についての解説として)
きわめて基本的なところである、それがゆえ、事後の(数式らの)説明に根本としてかかわっているとのところとなりもするため、先掲の条件付き確率の基本式の意味合いをここにて多少細かくも解説しておくこととする(その程度のことはお分かりになられているとの向きは何卒、ご放念いただきたい)。
さて、読み手たる貴殿とその友人がそれぞれサイコロを振ったとする。サイコロは貴殿のサイコロをサイコロX1とし、友人のサイコロをサイコロX2としよう。
貴殿及び貴殿友人のサイコロX1・X2を振った際の賽の目方は計36パタンとなることはお分かりのことか、とは思う (二人で各々サイコロを振るとのその1回の[試行]で6×6の目の出方がある)。 につき、その折の賽の目の出方にあってそれら合計の値(サイコロX1とサイコロX2の合計の値)を顧慮すると下のような極めて単純な表が描画できるとのことも ―表に目をお通しいただければ― お分かりいただけることかと思う。
ここでX2(貴殿友人のサイコロX2)の賽の目について
[2が出るケース(Aと便宜的に表してのケース)の確率]
をP(A)としてみよう。
対して、
[X1(貴殿サイコロ)とX2(貴殿友人サイコロ)の目の出方の合計が5以下となっているケース(Bと便宜的に表してのケース)の確率]
をP(B)としてみよう。
先程の表に色分けをして、直上言及のP(B)のケースのありうべき全ての出目における比率問題、すなわち、確率を示せば、下のようになる(賽の目の出方として6×6=総計36の中にて合計の部が5以下となる部に色を付しているわけだが、その確率は図からもお分かりいただけるように10/36=5/18となりもしている)。
ここまできたところで書くが、
[Bという[条件]が確実に満たされる中でAとの事態が具現化している確率] ([BならばAであるとの確率]→[Bである折柄にAであるとの確率])
が[条件付き確率]たるP(A|B)の意味であることを思い出していただきたい。
直上の図をベースにその数式上の意味を解説することとする。
まずもってP(A|B)ではなくにものP(A∩B) ―AかつBの確率― がここで例示している事例についてどういう値を(解答として)とるのかとのことを図に基づいて説明すれば、である。下のような申しようがなせるようになっている。
「先立って挙げもした図をご覧いただくことでお分かりいただけるところとして[事象A](再述すれば、貴殿友人サイコロであるサイコロX2を振って2が出ているとの[事象;イベント])と[事象B](再述すれば、貴殿サイコロであるサイコロX1と貴殿友人サイコロであるX2を足し合せた目の総計が5以下となる[事象;イベント])の双方が満たされている確率的状況、記号論的に表せば、P(A∩B)の確率 ―AかつBの確率― は1/12となっている。図をご覧いただければお分かりいただけもしようところとして色つけして示している[事象B]と貴殿友人のサイコロの出目が2となっての条件Aが「重なりあって起こっている」との箇所は3部屋だけであるとのことで36部屋(6通りの目の出方があるサイコロを二人で一緒に振った場合の36通り)中の3、すなわち、1/12となっている」
図を一目いただければ、瞭然ともしているところとして単純にここでの事例では
[AとBの双方の条件を満たしている可能性]
としてのP(A∩B)は1/12となるわけだが、さてさてもってして対してもの条件付き確率P(A|B)とは ―先程来よりその旨、くどくも述べているとおり―
【確率P(B)にての[条件]が満たされる場合に「なおかつ」P(A)との事象が発生しているとの確率】
を指しもし、そのP(A|B)の確率にあって解答として出てくる値は(P(A∩B)のそれである)1/12とは「ならない」(「何が違うんだ?同じじゃないか」とそこで心得違いしてしまう向きもいるかもしれないなと考えつつも書くところとして単純にはそうはならない)。
同じくものことについてはP(A|B) ―Bという条件が満たされている(Bという事象が発生している)場合にあってAという条件が満たされもする(Aという事象が発生する)確率― というものが
[P(B)との確率で示される事態](Bが生じている確率、繰り返しもするも、X1(貴殿サイコロ)とX2(貴殿友人サイコロ)の目の出方の合計が5以下となっているケースでの確率としての10/36=5/18)
の発生の事前[条件]があらかじめ満たされている中で、かつもってして加えて、
[P(A∩B)との確率で示される事態](AかつBが生じている確率、繰り返しもするも1/12との確率で示される事態)
がどのくらいの割合で発生しているのか考えるが如し確率であり、とどのつまりは同じくものP(A|B)というもの(の値)が
【[P(B)との確率で示される事態]「の中での」[P(A∩B)との確率で示される事態]の発生比率】
を指しているとのことにもなる。
それを数式に引き落とすとP(A∩B)/P(B)となり、の解答としての値は(そしてここでの例ではP(A|B)=P(A∩B)/P(B)=1/12÷10/36=3/10となる ――字面だけでは理解しづらいところかとも当然に思うので下の図をよく見ていただきたい―― )。
(※初学者が条件付き確率の意味を考える際にまずもってけつまづくとのことがあるとすれば、「何故、除算をしているのか」に対する素朴な疑念となるのでなかろうか、と個人的には思う。通例、初歩的確率論では事象発生の同時性が問題になるところで乗算をよくもなす。賽の目を二回投げて1が二回でる可能性ならば1/6×1/6であろう、などといった按配で、である。そこを条件的確率では除算が式に出てきているために初学者は「同時性も問題になりうる局面での条件付きってことでどうして除算なんだ?」と思うこともあろうかと受け取れもする。
そこで基本的なところとして書くが (分かっておられるとの方々、かつ、冷笑的であるとの方々にあっては『当たり前のことを何を延々と書いているのか』『世の中のこともよく分かっちゃいないが、往々にして生意気さだけには恵まれているっていう育ち盛りの坊ちゃん・嬢ちゃん、小僧・小娘らに給金もらってお仕事として基本的なことに対する教えってやつを垂れているなにかのセンセイ気取りか。こいつは?』と内心での棘のある顰蹙(ひんしゅく)を買いそうなことではあると承知の上である中で、そして、(基本的なことを忘れてしまっているか、機会に恵まれず把握していないとの)責任を伴っている立ち位置にある(つもりである)との語るに値する大人に[おのれ及びおのれの児孫が全員殺される予定であるとの畜舎で無様に何も遺せぬとのままで殺されるに任せるつもりか]との状況を訴求するためのものが本稿であり、その本稿の適正さの検証・確認を求めたいのが本稿筆者であると申し添えたいとの中で実にもって基本的なことながら書くが)、 条件確率の基本式 ― P(A|B)=P(A∩B)/P(B)との式 (左辺のP(A|B)たる【Bという条件の下でAで起こる確率】は右辺の【AかつBが起こる可能性】(P(A∩B)を【Bが起こる確率】(P(B))で除したものに等しいとの式) ― が除算で導出されているとのそのことについて自然言語(数式ならぬ日常語)で表せば、それは
[(【既に起こったか,起こることが確定していること】と【これより起こりうること】の)先後関係]
あるいは
[複数の確率(にて表される事象の現出度合い)の内包比率関係]
の問題と置き換えてもらうと分かり易いことかとは思う。
まずもってある事態が(確率的枠組みのありようとして)[先]に、あるいは、[大枠]として既にそうなっているものとして決まっている([先後関係]あるいは[包含関係]が定まっている)と想定する、そう、「擬制的に」(「そうしたものであるかのように」)ででもそう想定する ―[条件付き確率]で物事の同時性が問題になっていると思ってもらっては困る一方で以上のように考えてもらうのは望ましいことかと思う― 。
のあと、そうも「まず先立って」そこにありきの枠組みの中でさらにそちらの事態に応じて付随的に発生する問題となる確率 ―先行する枠組みに完全に規定されきっている、先行顧慮する事態が確実に具現化しているのならばとの中にあって顧慮対象の事態「も」付随してそうも具現化するのであろうとのケースの確率でもいい― の[比率]を考える...。
あの者の骰子の出目がBならば、そして、「そのBとの関係でこうならば、」の状況に限局化してこちらの骰子の出目が「付随して」Aになる確率を考える、全体のあるべき (確率的分析にあって「それであらねばならない」「そうもなっている」と想定する)パターンである「先立っての」条件の確率であるP(B)のさらにその中のP(A)の[比率] (とくれば、それはP(B)とP(A)が同時に具現化しているとの確率であるP(A∩B)ともなる) が問題にされている...とのことを考えていただければ(上にて呈示の図を見ながらでも考えていただければ)ご理解いただけることか、とは思う。
その点、比率問題となれば、そう、それは除算の問題になる。そういうことである (:全体で[1](100パーセント)となる中でのある出来事Bが起こりうるとの確率(P(B))は確率論的小数で表されることになる(40%ならば0.4等等) 。 そうも小数にて示される領域にマスト、なればこそ、絶対そうであらねばならぬとの式で「さらにもって内包包摂される」ように規定されている特定事象の起こる確率(P(A∩B)(たとえば10%分としての0.1等等)とくれば、除しての割合が大前提としてBが起こると想定される中でのAが起こる条件付き確率として定義されるわけである(40%分の領域が先に規定されている中でのその中での10%分の領域の発生が問題にされているとのことであれば、0.1/0.4=1/4がターゲットの出目として問題になるということである ――ここでのサイコロの事例に引き直して見れば、一人でサイコロを振って2の目が出るとの確率は6分の1だが、ここ事例では貴殿と友人が同時にサイコロを振ってそのサイコロの目の和が「確実に」5以下であるとの条件が付いている。従って、2を引き当てている確率は単純に一人でサイコロを振った場合の確率より「高めに」見繕われるとのかたちとなっており(和して5になるのであるから片方が2である目算は強くなる)、それは計算してみると、(一人で振った場合の1/6より実際に目算強くもの)3/10であるとのことになっている。そのように条件付き確率とは【所与の条件が確実に具現化している条件下での確率】を考えるとのことでその値は条件無しの場合に比べてそれなりの変動を見ている―― )。
以上、条件付き確率についてはいわゆるベン図(ないしオイラー図)を用いてその式の意味性を説明するやり方もあるのだが、上のような[単純化させての図]で表象させての説明 ([サイコロを二つ振った場合の出目の組み合わせに【先後関係】(がかってのもの)を持ち出しつつもの説明]でもいい) をなすことの方がよりもって話が早いかとの観点で表記図を用いての説明をなした ――そうした「高校卒業程度の識見を有した世間人並みの向きらを想定しての」説明ありようは先立って述べているように英文Wikipedia[ Conditional probability ]項目記述内容を(そこに見る記述が分かり易いか、と)そのまま多く踏襲させてもらったものともなる―― 。
ここまでは ―理解する意志があるのならば― 図をよく見て、の後、言の葉による説明を検討をなしての中学生、いや、極めて聡ければ、小学校高学年の者でも理解できる話とはなることかとは思う (尚、世の真っ当な向きらに伍していくための知性を獲得する前のそのまた前段階の小学生の頃、筆者なぞは極めて頭が悪かったがゆえにまずもって同じくものこと、理解なせなかったことかとは思う)。 現在は高等学校の数学で条件付き確率のことの[学習]がなさしめられている聞くが、、概念それ自体としては至極単純なものとなるというわけである。
無論、筆者はまだこの極めて残酷な社会・世界に責任をもって挑むことが出来はしない立ち位置にあるとの成長途上の未成年の若年者を想定して本稿をものしているわけではないが(責任を負うべきはこの社会・世界の構築要素として機能させられている大人らである)、 誰にでも分かろうとの説明をなすべくも、『ティーンでも理解出来るであろう』との水準でもってしてのとにかくもってしてのここでの説明をなしているわけである。
さて、【条件付き確率】の式は先述のように
(Bが起こるという条件の下でAが起こる確率はどれくらいかにまつわる式としての)
P(A|B)=P(A∩B)/P(B)・・・・[2]
となるわけだが、 ―式の単純変形の問題として― 上記式を「単純変形」させると、
P(A∩B)=P(B)×P(A|B)・・・・[3]
となる(ただ単純に両辺にP(B)をかけているだけである)。
ここで述べるが、
P(A|B)=P(A∩B)/P(B)・・・・[2]
との上にて呈示の式が成り立つのと全く同じ理由で
(Aが起こるという条件の下でBが起こる確率はどれくらいかにまつわる式としての)
P(B|A)=P(A∩B)/P(A)・・・・[4]
との式もまた導出できるようになっているとのことがある ――話を[P(A|B)]から[P(B|A)]にまつわる式へと移し替えたにすぎない―― 。
につき、直上[4]の式を([2]→[3]と全く同文のやりようで)変形すると、
P(A∩B)=P(A)×P(B|A)・・・・[5]
との式が導出されることになる(何のことはない。これも上の[2]の式から[3]の式への変換と「ほぼ」同文に両辺にP(A)をかけているだけである)。
上の[5]と[3]の式を共通のP(A∩B)を媒介項にただ単につなぎあわせただけのこととして
P(B)×P(A|B)=(P(A∩B)=) P(A)×P(B|A)
との関係性が成り立っている、すなわち、
P(B)×P(A|B)=P(A)×P(B|A)・・・・[6]
との関係性が成り立っている (以上、P(A∩B)を媒介項にして導出されるとの関係性がトーマス・ベイズという18世紀に生きた牧師が編み出したとされる、そして、数学史にその名を燦然と輝くものとして遺している数学者ピエール・ラプラスが精緻化したとされる数学上の魔術、【原因(考えられる仮説)と結果(観測データ)を有機的に入れ替えながら状況分析をなせもする】とのベイズ確率論の根本に関わるところになっているのだが、にまつわっては、これ以降の順を追っての解説をきちんとご検討いただくくことで次第次第にご理解いただけることか、とは思う)。
ここで上の[6]の式をそれぞれに変形することで
P(A|B)=P(B|A)・P(A)/P(B)・・・・[7] ([6]の式の両辺をP(B)で割っただけである)
P(B|A)=P(A|B)・P(B)/P(A)・・・・[8] ([6]の式の両辺をP(A)で割って、かつ、右辺と左辺の表記順序を逆にしただけである)
がそれぞれもってして導出されてくる。
以上の[7](あるいはそちら[7]と同様、[6]の式の単純変形から導出されてくるとの[8])の式が
[ベイズ確率論の根本]
をなすものとなり、一般に
P(A|B)=P(B|A)・P(A)/P(B)
をもってして[ベイズの公式]と呼称する(英文Wikipedia[ Bayes' theorem ]項目や和文ウィキペディア[ベイズの定理]項目にも全く同文の式が掲載されているので確認されてみるとよかろう)。
上の単純な観点で導出されてくる ――しかしもって数式に対する意味説明が「欠」を見ており、窮理、物事を突き詰めて見る真っ当な知性を有している人間にはおよそ読むに堪え得るものではない日本の高等学校の数学教科書(及びそれを補完するにすら不足があるとの相応の参考書類)なぞにはその意味合いや応用可能性が解説されているような性質のものではない―― との単純な式が「何故ゆえに」極めて重要なものとなるのかの細々とした説明はさらに後の段でなすとして、である。取りあえずもの式の皮相的な意味、それを示すこととする。
P(A|B)=P(B|A)・P(A)/P(B)・・・・[7]
との式の額面上の意味について教科書的なる説明(日本の体裁上、不親切極まりないとの教科書に照応するような説明)をなせば、
【Bという[事象] (英語で言うところのEvent、[事象]の意味は先の段で解説したとおりである) が発生する確率的枠組みに収まるとの条件の下でAという事象が発生する確率】 (P(A|B) )
というのは
[【Aという[事象]が発生する確率的枠組みに収まるとの条件の下でBという事象が発生する確率】(P(B|A)) と 【Aが起こる確率】(P(A)) の積を 【Bが起こる確率】(P(B)) で除したもの]
に等しい
とのものとなる (式の指し示す方向性に終局的に何が横たわっているのかの解説はこれよりなすとして何故もってしてそうもした「皮相的意味合いの」式が【式の単純変形】を通じて導出されてくるのかについては[1]および[2]と振っての条件付確率[P(A|B)](の展開式)に対する説明部をお読みいただき、かつ、その後の[2]式に対する「単純変形」のことを顧慮いただければ惑う素地はほぼないことか、とは思う) 。
ここからが本題である。
そう断りもしてから、以上のような皮相・表層的な側面を有している[ベイズの定理]が驚異的な力(と表される効果)を発揮する理由がなんたるかの段階的解説に入ることとする。
まずもって書くが、上の式[7]左辺に見るP(A|B)というのは
[Bという[事象](英語で言うところのEvent、[事象]の意味は先の段で解説したとおりである)が発生する確率的枠組みに収まるとの条件の下でAという事象が発生する確率]
と表現できもするものだが([1]の意味合いについてくどくも繰り返しての話である)、 それは次のようなかたちで表せられるもの「でも」ある。
(大卒レベルの数学知識を持ち合わせていないとの方を対象に高校生でも分かろうとのやりようでの説明をなしているここでの話を理解する気があるとの向きにおかれては以下のような観点が[[ベイズ確率論]の発想法の根源]にあるとのこと、きちんと押さえていただきたい)
(世界を確実にそうであると規定している数式の世界の事柄を ―言葉の問題として― 恣意的に代替的に表現した場合にどうなるのかの話として)
「P(A|B)というのはBという[データ・情報](いいだろうか.ここでは条件付き確率における【[前提条件]たる[事象]】を【データ・情報】と「便宜的に」表しているのだ)が具現化している場合に、Aという[仮説]ないし[原因](ここでは条件付き確率における【[前提条件](たる事象の発生)に伴って必ず起こる[事象]】をここでは[仮説]ないし[原因]と便宜的に表している)が成り立っている確率が(Bという[データ・情報]が具現化しているとのその確率の範囲・枠組み内に)規定されきっているとのことを意味するものともなる....」
すなわち、(AやBとのなんとでも表してもいい数学上の純粋たる記号に対して[仮説]や[データ]との名称を「意図的に」与えてのこととして)
「P(A|B)という式が示す状況はAという[仮説]([ほにゃらら]でもいいが、[仮説]と表する)がそこに「ある」との確率が呈示されるとのありようがBという[データ・情報](が具現化する確率的枠組み)がそこにあるとのことによって確実・完全に規定されきっている状況を示している.....」
との云いようがなせるもの「でも」ある (:単純に確率論における[Event:事象]をどういった言いようでもってして定義するのか、[仮説](と表してのもの)のありようについての[事象]の確率を考えるのか、あるいは、よりもって単純に[サイコロの出目がいくつになるのか]といった意味合いでとらえるのか、の話にすぎない ―※― )。
(※本稿のつい先立っての部にあってP(A|B)の式の説明 ―事象B現出との条件での事象A現出の確率にまつわっての式の説明― を懇切丁寧になしていたわけだが、の際、事象Bが「二人のサイコロの目が計5以下になっている」との中でその条件に拘束されるかたちで事象Aが「サイコロの目が2である」とのケースの条件付き確率の値を ―式の解説にあって― 視覚的に例示した。全く同じくものことをここでの話に当てはめて述べれば、【情報;データ】として既に「二人の者X1とX2が振ったサイコロの目の和が5以下である」とのことが分かっている状況、そして、といった状況下で【仮説】として「二人の内のX1のサイコロの目が(4でも1でもなく)2である」との見方が適正であるとの確率を考えている....そのように【純然たる言葉の問題】として言い換えている(だけである)ととらえてもらってなんら構わない)
よりもって噛み砕きもして換言すれば、P(A|B)とは
「A(という[仮説]あるいは[原因]との呼称をここでは与えてのもの)がB(という[データ・情報]との呼称をここでは与えてのもの)というものに完全に条件付け・規定されきっているとの確率が示されている(⇒Aという仮説ないし原因がそこにあるとの事態がそれに先立つ大前提としてのマストとなるもの、絶対にそうなっているとの前提として控えているBという[データ]と不可分に紐付いている)」
との表現が ―ただの言葉の言い換え上の問題として― なせもするものである(言い様・言い方によってはデータBと確率論的に完全に紐付いている、「Bならば(必ず)A」といった按配でBと紐付いているAは[B存立にまつわるそうであるとの仮説]ではなく[Bにまつわる原因・真因]と形容するに足りるもの「とも」なっている)。
表記のように特定のデータ・情報としてのBが[確率論的枠組み]としてそこに具現化している場合に、特定の仮説Aが想定される場合、そちら仮説Aがデータ・情報Bの行き着く先にある(と言っていいほどに枠組みに完全に規定されている)ことを意味するのが
P(A|B)=P(B|A)・P(A)/P(B)
の[ひとつのとらえかた]であるということである。
対して、同じくもの[7]式における右辺P(B|A)とは ―(Aを[特定の仮説](と紐付いた確率)と上と同様に見立て、また、Bを[特定のデータ](が見受けられる場合の確率)と同様に見立てる、「ただ単純に言葉の問題として」見立てる場合のこととして)― 、次のように言い換えられるものとなる。
「P(B|A)というものにあってはAという[仮説]ないし[原因](と便宜的に呼称するもの)がまずもってそこにて成り立っているとの確率的状況を想定した場合、Bという[データ・情報](と便宜的に呼称するもの)がAたる[仮説]ないし[原因](と表してのもの)にまつわる確率的状況に確実・完全に紐付けられたものとして導出されてくる可能性が呈示されている...」
すなわち、P(B|A)というものに関しては
「【Bという[データ・情報]が具現化するとの確率】が【Aという[仮説]あるいは[原因](と便宜的に呼び慣わしてのもの)が成り立つケースの確率】の確率論的枠組 ―確率成立状況― によって「完全に」規定されきっている場合の確率が呈示されている.」
との云いようがなせるものである(先立っての式[1]の説明にて説明を講じているようにP(B|A)が「AならばB、の確率」を意味することとなっている中にて、である)。
以上表記の上で「念にも念を押してのくどくもなるが、」のところとして、
P(A|B)が
[データB(と便宜的に表してのB)が事象として具現化している場合、その具現化の確率的枠組みに完全に紐付けられてのものとして仮説A(と便宜的に表しもしてのA)が成り立っている場合の確率]
と形容することができるもの「でも」あるのに対して
P(B|A)は
[仮説A(と便宜的に表してのA)が事象として具現化していると想定される場合にデータBが導出・具現化するとの確率がそちら可能性に完全に規定されきっている確率]
と形容することができるものとなっている
とのことがある (この段階ではいかようにも言いまわしを換えられる言葉によって【確としてそこにある数学概念】を引き合いにだしての屁理屈を展開しているように見えるかもしれないが(当たり前の反応かとは思う)、そうではない、直上表記のような言い分がいかに適正に機能するものなのかについての説明も無論、これよりなす)。
よくベイズの一般公式 ―先だってより取り上げている[7]の式、P(A|B)=P(B|A)・P(A)/P(B)― に関しては
【[原因](仮説)から[結果](データ)を推論すること、また、同文のことを「反対方向から「も」やること、その双方向が有機的に結合している式】
と端的に表されることがあるが、それは大きくは(同[7]式の)構成要素たる(P(A|B)及びP(B|A))にまつわる上のような定義上のとらえかたに大きくも拠っていることとなる。
ここで表記の式のAを以下、英単語でのハイポーセシス、Hypothesis[仮説]の略字[H]にて置き換えて表示、また、BをData[デ-タ]の略字[D]に置き換えての話をなそう (これ以降、上の[8]の式P(B|A)=P(A|B)・P(B)/P(A)をP(D|H)=P(H|D)・P(D)/P(H)と表し、上の[7]の式 P(A|B)=P(B|A)・P(A)/P(B)をP(H|D)=P(D|H)・P(H)/P(D)とのかたちで表記することとする)。
さて、以上ここまでの話については「数式それ自体には何ら変更を加えない」程度の[言の葉による定義付け]を加えての皮相的なる話でしかないと思われるかもしれない(とくどくもあってしての推し量りの弁明をなしたい)。
だがもってして、
(上の[8]式P(B|A)=P(A|B)・P(B)/P(A)あらため) P(D|H)=P(D|H)・P(H)/P(D)・・・・[9]
(上の[7]式P(A|B)=P(B|A)・P(A)/P(B)あらため) P(H|D)=P(H|D)・P(D)/P(H)・・・・[10]
によって定義されるベイズの定理、更に述べれば、によって代表されるベイズ確率論が「極めて問題になる」(後の段にて先にて引用なしたところとは別のところから続いて引用するように極めて今日にあって重要視されている)のは上記のような入れ替えなしての定義が成り立つことと表裏をなしている、
[ベイズ更新]
というプロセスを働くように「なっている」からである。
そこにいう[ベイズ更新]がいかようなるものであるのかの説明をする前に先掲の、
P(D|H)=P(H|D)・P(D)/P(H)・・・・・[9]
P(H|D)=P(D|H)・P(H)/P(D)・・・・・[10]
の式らの関係性に着目する。
その点、両式は ―式の皮相的ありようを考えもすれば自明のこととして― AとBのどちらを仮説(H)と便宜的にとらえ、どちらをデータ・情報(D)ととらえるかで式の意味合いがすぐに逆転するとの全く同一の式なのだが (単純に「方程式のaやbといった記号の意味合いが式の定立者の目分量に由来している」といったことと同じである)、 ここでは[7]式改めてのそうもした[10]式のP(D|H)=P(H|D)・P(D)/P(H)をベイズ確率論の根本をなすところとしての話をなしていく。
以上申し述べたうえで、再言するも、
[P(H|D) ――くどいが、特定のデータ(D)がそこにある場合にそれによって特定仮説(ハイポーセシス、H)の確率的枠組みもが完全に規定されきっているとのその確率となる ⇒ すなわち、[結果]([データ]/たとえば先述の[1]式にまつわる例では[サイコロX1とサイコロX2を振って出た目同士の和を足したらば5以下となっていることまでは判明しているとのデータ]の枠組み)の中で[結果成立状況の中での「特定の」ありよう]([仮説]/たとえば先述の[1]式にまつわる例では[X2の方のサイコロが2の出目のものとなっているとの仮説])が確実絶対に導きだされるうえでの確率となる―― ]
および
[P(D|H) ――これまたくどいが、特定仮説(H)がそこにある場合、それによってデータが「規定」されている(データが特定仮説の枠組みの中に収まっている)との確率となる ⇒ すなわち、[仮説]([仮説]/たとえば先述の[1]式の例では[サイコロX1を振って出た目は2となっていると想定されるとの「特定の」枠組みとしての仮説])がまずそこにあると想定される場合にあって副次的なところとしての[結果]([データ]/たとえば先述の[1]式の例では[サイコロX1とサイコロX2を振って出た目同士の和を足したらば5以下となっているとのデータ])が完全確実に規定されて導出されてきもするとの確率となる―― ]
の両要素については
[原因(と便宜的に表しもしての特定の[事象])が仮説(と便宜的に表しもしての特定の[事象])を規定するプロセス]
および
[仮説(と便宜的に表しもしての特定の[事象])が原因(と便宜的に表しもしての特定の[事象])を規定するプロセス]
が相補関係を呈しているとも述べられもするようになっている。
にまつわって、これより
[ベイズの公式] (本稿では一般にそうも表されているところの[7]式あらためての[10]式、P(H|D)=P(D|H)・P(H)/P(D)のかたちで表現しているもの)
を現実世界の諸事象に当てはめての計数的分析がいかようなものなのか、イメージしやすき例を挙げながらもの説明を講じていく。
さて、ここに至る今までの流れでは[サイコロを振ってその結果の出目]を問題とすることで([1]式における問題として)[条件付き確率]の説明をし、また、そこから[ベイズの定理]へと話をつないでいったわけだが(式[7]および[8]および単純にそれらの表現形式を換えての[9]および[10])、以降は
[病気検査の陽性・陰性にまつわる(よくもなされる)確率分析]
を例にしての分解、噛み砕きながらもの簡明を心がけての解説を試みることとする(便宜的に病気陽性・陰性事例を引き合いに出しての方が話が早いと考えたとの理由からである ――病気検査の陰性・陽性結果の信憑性、そう、たとえば、乳癌特定のマンモグラフィー検査の有効性といったことはベイズ理論にまつわる説明に多用されるテーマとなりもする(疑わしきにあっては試みに[ mammography, breast cancer, Bayesian Inference]といったキーワードで検索されてみるとよかろう.それ絡みの英語圏でのベイズ理論の説明文書がオンライン上より多く捕捉されてくるはずである)―― )。
ある人物が病気Xの診断を受けたとしよう。 同人物が受けた診断というものは
[陽性]・[陰性]
との結果のうち、必ずどちらかが返ってくるものとなる (ガンの有無などについてきっぱり・はっきりと特定化がなせてこその医者稼業(および医者稼業に沿うように構築されているガンなどの検査)であるとのありようを考えれば、至極当然のこととして、その二者しか結果は出ないという状況をここでは敢えても「想定」する) 。
ここで述べるが、診断・検査にて問題となる[陽性]か[陰性]か、それはいわばもってしての[結果]である。
そして、[結果](観測がなされての[データ]としてもいい)についてはそれが本当に実情を反映してのものなのか、[原因](ないしは観測される現象にまつわっての[仮説])について次のような例題呈示を(例えば、のこととして)なせるところでもある。
(【例題設定】として)
[結果(ないしデータ)の背面にある「実情」にまつわる[仮説1]としてのH1の特性]
⇒
全数は把握できていないが、診断結果などに照らしあわせて特定の疾病Xの発病状況として[陰性]である人間の比率は全人口にておおよそにして98%、対して、[陽性]である人間の比率は全人口比おおよそにして2%であると「推定」されている (との例題設定をなす。につき、全人口における病気に罹っている率は0.2割、[罹患率]2%との[推定]は揺らぎうるとも例題上、設定する)。
そのような推定がなされている中で特定疾病の罹病有無を判断するための特定検査を実施すると
[実体陽性状況 ―H1の状況― ]
にある場合には99%はその通りの結果(データ;D)が出るが、うち、1%は誤検知がなされて額面上、[陰性]と出てしまう状況にあると ―(後日調査で判明している検査精度の問題から)― 判断できるところとなっている(と例題設定する ――※検査としては[実体として陽性であるのにも関わらず陰性との結果が出ると非常に問題になる]のでそうした結果を出来るだけ避けるための慎重な設計がなされている、だが、後日調査でそれでも1%は誤検知がなされる(病気の取り逃がしが具現化してしまう)と判明している...そういう現実的状況を念頭に置いての例題設定をここでは付している―― )。
[結果(ないしデータ)の背面にある「実情」にまつわる[仮説2]としてのH2の特性]
⇒
(前半部は繰り返しとして)全数は把握できていないが、診断結果などに照らしあわせて特定の疾病Xの発病状況として[陰性]である人間の比率は全人口にておおよそにして98%、対して、[陽性]である人間の比率は全人口比おおよそにして2%であると「推定」されている (との例題設定をなす。につき、その対象に見る[罹患率]2%との[推定]は揺らぎうるとも例題上、設定する)。
そのような推定がなされている中で特定疾病の罹病有無を判断するための同じくもの特定検査を実施すると
[実体陰性状況 ―H2の状況― ]
にある場合には95%はその通りの結果(データ;D)が出るが、うち、5%は誤検知がなされてきてのものである(実体的状況として陰性であるにも関わらず検査結果では額面上、陽性、病気に罹っているとの結果が出てしまう)と ―(後日調査で判明している検査精度の問題から)― 判断できるところとなっている(と例示設定する ――※検査が[陰性兆候が強くとも油断ならない]との観点から(現実には病気に罹っていない、実体陰性状況になるような局面でも)陰性結果・陽性結果が出る割合が高めに95対5になるように検査設計されている...そういう現実的状況を念頭に置いての設定をここでは付している―― )。
上のように具体的数値までを所与のものとして設定しているとの例題事例にあっては
[【捕捉された検査結果というデータ;D】の背面にある(データの確率論的枠組みを厳として動かぬものとして背面から規定している)【「真の状況」たる原因ないし仮説;H1あるいはH2】]
にまつわっての関係性が次のようなかたちで図示できるものとなっている。
以上、整理しての図示がなせるような事例にてここである人物が検査を受けたらば「陽性」との検査結果を得た(と想定してみる)。
そうもした中で[データ]として検査を受けもした人物に呈示されてくるとの結果(検査で診断されてくる陽性か陰性かとの結果)がそちらデータの背面にある現実的状況、[真因;原因(仮説)]と紐付く式で関わっている(確率論上の枠組みとして背景にある[真因]と紐付くとの式で関わっている)とのケース、すなわち、「H(H1あるいはH2)である時に確実絶対にDともなっている」とのケースの確率はP(D|H)は以下呈示のどちらかのケースしかないようになっている(とここでは例題設定している)。
すなわち、 ―問題となるのはそれぞれの可能性としての大小なわけだが―
「陽性との[結果データD]が出ている状況では」
⇒
[[原因1](ないし[仮説1];H1と表記)に結びつくところとして[実体ありよう(真因)として陽性のところ](H1)をその通りのものとしての検査結果 ―[陽性]としてのデータ(D)― が出ている] (すぐにありよう図示して解説するところとしてそちら確率的ありようはP(H1∩D)の一部をなすとのかたちともなる)
[[原因2](ないし[仮説2];H2と表記)に結びつくところとして[実体ありよう(真因)として陰性である](H2)のに[陽性]との検査結果(D)が「誤って」出ている] (すぐにありよう図示して解説するところとしてそちら確率的ありようはP(H2∩D)の一部をなすとのかたちともなる)
「陰性との[結果データ]が出ている状況では」
⇒
[[原因1](ないし[仮説1];H1と表記)に結びつくところとして[実体ありよう(真因)として陽性である](H1)であるのに[陰性]との検査結果(D)が「誤って」出てしまっている] (すぐにありよう図示して解説するところとしてそちら確率的ありようはP(H1∩D)の一部をなすとのかたちともなる)
[[原因2](ないし[仮説2];H2と表記)に結びつくところとして[実体ありよう(真因)として陰性のところ](H2)をその通りのものとしての検査結果 ―[陰性]データ(D)― が出ている] (すぐにありよう図示して解説するところとしてそちら確率的ありようはP(H2∩D)の一部をなすとのかたちともなる)
とのケース「しかない」(ここにて表記の事例では上のケースらで[ありうべき[データ(検査結果;D)]に対しての[ありうべき真因(H)]のすべてのありよう]を網羅している)。
上のように検査結果としてのデータ(D)の背後にあって
[ありうべき真の事態(データの実相にまつわる仮説ないし原因らH1,H2)]
が両立を許さずどちらか一方、択一的にしか存在しえないとの状況にあっては
[データ(検査結果[D])のありうべきすべての出方を示す「可能性」(P(D))]
を考えもして見た場合に、
(便宜的に「データの出方の全部顧慮」の上での「データありよう」を体現しての確率的枠組みP(D) ―総計100%になるとのP(D)― につき)
P(D)=P(D∩H1)+P(D∩H2)・・・・[11]
との式での表記もがなせるようになっている ――くどいが、「必ずH1あるいはH2のどちらかがデータDの実相と紐付くものとして存在しており、」「H1とH2の間に重複がないのならば、」の事例としてである(実際に本事例ではH1とH2のケースに両立がないように「条件設定」している)―― 。
それこそが肝要なことにもなるのだが、何故そうもした式でP(D)が表せられるのか。
については下の図、及び、同図に付しての解説部をきちんと読んでいただくことでご理解いただけるか、と思う。
以上のようにD(データ)としての[検査結果](陽性か陰性か)の確率的特性が[原因](真因としてのH)によって定められるケースが2つしかないとのケースでは
(「観念上の全部事例顧慮」の上での100%化するとのP(D)につき)
P(D)=P(D∩H1)+P(D∩H2)・・・・[11]
との公式が成り立つことが示される(上のP(D)におけるDは全部のありうべきデータを網羅しているとの点でデータの一断面、たとえば、陽性であるD1、陰性であるD2と分けてもの顧慮を「なしていない」ことに留意いただきたい。いわばもってして、(検査結果たるDが陽性D1か陰性D2の二つに分かたれるとのここでの事例では)まとめもしてP(D)=P(D1)+P(D2)となるところのP(D)の話をなしていることを留意いただきたい)。
そして、のようなことは、そう、例えば、原因(ないし真因を想定しての仮説Hypothesis)の数がH1からH100まであろうとも話は同じである(のような場合はP(D∩H1)+P(D∩H2)・・・+P(D∩H100)となる)。
より普遍化すると、
(n個の原因がある場合において)
P(D)=P(D∩H1)+P(D∩H2)(+・・・P(D∩Hn))・・・・[12]
との公式が成り立つようになっている ――同公式成立にまつわる概念図「も」これ以降、続いての段で挙げる―― (については、くどくも再言するが、の際には、H1からHnそれぞれには重なり合いが無いとの想定の下での原因分析(仮説定立)をなす)。
ここで上の[12]の式を先にての[条件付き確率]の式、
P(A∩B)=P(A)× P(B|A)・・・・[5] (AあらためH、BあらためDとしているとのここまでの流れからP(D∩H)=P(H)× P(D|H))
に基づいて変形するとのことをなす ――[5]式あらためのP(D∩H)=P(H)×P(D|H)を[12]式のP(D∩H)に代入するとのことをなす―― (:背景にある[発想方法]の話をなせば、「ベイズ確率論がありうべきだけの仮説(原因)をすべて顧慮したうえでそれらのどれにデータが落ち込むのが(確率論的に)事理に適っているのか考える確率論である」とのことがあってそういう変形をなす)。
すると、下のような式が導出されてくることになる。
P(D)=P(H1)× P(D|H1) + P(H2) × P(D|H2) + P(H3) × P(D|H3) + ・・・ + P(Hn) × P(D|Hn) ・・・・ [13]
以上の式[13]、条件付き確率にまつわる基本的公式([3])に複数の「ありうるだけの」原因ないし仮説(H1)の概念を反映させもしての式をベイズ公式、
P(H|D)=P(D|H)× P(H)/ P(D)・・・・[10]
に代入するとのことをなす(:[10]式のP(D)の部分に[13]式の右辺を代入する)。
そうもした代入(H1からHnの計n個の仮説が相互になんら両立することなく成立している場合の事例、そうもした事例たる[13]式で示されるP(D)のありようを[10]式たるP(H|D)=P(D|H)× P(H)/ P(D)のP(D)に照応させて入れ込むとのかたちでの代入)の結果、
P(Hx|D)=P(D|Hx) × P(Hx) / ( P(H1) × P(D|H1) + P(H2) × P(D|H2) + P(H3) × P(D|H3) + ・・・ + P(Hn) × P(D|Hn) ) ・・・・ [14]
との式が導出されてくる([14]式については左辺および右辺の分数分子の部分にてHではなくHxとの表示をなしているが、それは便宜的にそうしていると理解いただきたい)。
以上の[14]式がベイズ確率論を展開するうえで先立って呈示した基本定理の式[10]と同文に必須の式となる重要な式となる(目立つところでは試みに英文Wikipedia[ Bayesian inference ]項目(の General formulationの部)でも和文ウィキペディア[ベイズ推定]項目でもいい、検討してみればいい。意味合い的には[14]と全く同じくもの式が(分母により簡明に表するためのΣ記号などが用いられながら)呈示されていること、ご確認いただけるであろう)。
これより[14]式に基づいてどういう確率論的分析が現代社会にて行われているのか、部分的に摘示していくが、その前に直上表記[14]式の「意味」をさらに突き詰めもして解説しておく。
たとえば、[14]式にまつわるところとして左辺に(Hxにおけるxをx=1として)H1を置いて、
P(H1|D)=P(D|H1) × P(H1) / (P(H1) × P(D|H1) + P(H2) × P(D|H2) + P(H3) × P(D|H3) + ・・・ + P(Hn) × P(D|Hn))
との式がそこに呈示されていたのならば、ベイズ確率概念に基づいて確率分析をなしたことがある人間にはその意味がすぐに分かりもし、それは
[仮説(ないし特定の事柄が起こる原因)がそれぞれ排他的にH1からHnまでのn個だけ存在すると想定される場合にあって特定のデータ(D)が与えられた際、そちらデータによって(H1からHnらのうち)特に仮説H1が正しいとの可能性が示されているとのその割合]
のことを指す。
については、[H1からHnとのn個だけあるとの特定仮説らの確率論的枠組み]がまずもってそこにあり、その確率的枠組みの中にデータDが導出されてくる確率が包含されきっているとのケースにあって、先立っての先立っての[12]式、
P(D)=P(D∩H1)+P(D∩H2)(+・・・P(D∩Hn))
との式が呈示されるかたちとなっており、そちら[12]式の内容と条件付き確率P(H|D)を求めるための式である[5]式(P(A∩B)=P(A)×P(B|A))を融合させもするべくもの操作をなして、(ここでのベイズ推定の基本公式である)[14]式へと繋がっている時点で
[式の中にて顧慮されている仮説の数がH1からHnあるとのことが「当然に」[折り込み済み]である]
とのことがある (※先立っての[12]式の特殊事例となる[11]式の説明に際して呈示した図および同図に付しての説明とこれより挙げもする[下図](および、に付しての解説)をきちんと検討なせば、同じくものことは理解なせることか、とは思う) 。
そう、といった中で[14]式左辺にてのP(Hx|D)が取り立てて仮説H1にまつわるもの、P(H1|D)であるのだとすれば、その意味は必定、
[仮説(ないし特定の事柄が起こる原因)がH1からHnまで考えられる場合にあって特定のデータ(D)が与えられた際、そちらデータが示す先にて(H1からHnらn個の仮説らのうち)仮説H1こそが正しいものとして存在している確率]
とのものとなる (皮相的なる話をなせば、「式左辺のP(H1|D)とは[DならばH1の確率]を指すものであるから上記のような申し分がなせる」ようにもなっている ――そうもした教科書的な話が成り立つことを説明すべくもの図示もすぐ下になす―― 。また、同文に(それだけ述べる限りは)皮相的ともなる話をなせば、[14]式左辺のP(Hx|D)がP(H2|D),P(H3|D)であるのだとすれば、同じくものことがH1あらためH2あるいはH3に関しても述べられるとのことになる ――たとえば、P(H3|D) = P(D|H3) × P(H3) / P(H1) × P(D|H1) + P(H2) × P(D|H2) + P(H3) × P(D|H3) + ・・・ + P(Hn) × P(D|Hn) との式がそこに呈示されているのならば、これまたベイズ確率概念に基づいて確率分析をなしたことがある人間にはその意味がすぐに分かりもしようとのところとなり、それは[仮説(ないし特定の事柄が起こる原因)がH1からHxまで考えられる場合に特定のデータ(D)が与えられた際、そちら特定データの行き着く先にある真因が仮説H3(とも形容されている事態の確率的具現化状況)に求められる可能性]のことを指す―― )。
【[14]式が何故もってして[n個の仮説が想定顧慮されての中での配分問題を示すものなのか]に関わるところの式変形にまつわる解説図として】
(※ここで述べておくが、
「以上のような式を主として用いるベイズ確率論は決して現実を見ていない数式上のお遊びなどではない」 (先立って言及しているところとして[主観確率]という[事理に通じていないとの第三者]の誤解を招くような言葉が巷間、よく取り沙汰されるようなことがあってもである)。
それが数式上のお遊びにとどまらぬところの最大の理由としてベイズ確率論というものが
[まずもって確率分析をなすことにしたモデル]
を
[現実世界のデータ]
に合致するように絶えず仕切り直していくものとなっていることが重きをもって関わってくることになる。
そう、問題たるところとしてベイズ確率論というものの肝は[追加]でデータ(現実世界で収集された具体的情報だ)が与えられていくにつれ、式の可能性論的枠組みがそれら現実世界のデータに準拠したものに徐々に「更新」されていくように数式として「できあがっている」とのことにある(:例えとしてはどうか、とも思うのだが、式の性質がそも、最初に標的の潜水艦の位置をおおよそながらものかたちで定め、に対して、ソナー(音波探知のための音波)を発して返ってくる反応から徐々に標的位置を厳密化していくような式の格好となっている)。
それがゆえにベイズ確率論というのはその強力無比な威力より、(後にもそれにまつわる言われようについては引用を交えながらも解説するところとして)、現代社会のありとあらゆるところで利用・応用されている。 本稿筆者は「プログラミングのような人間が生きるうえでの優先順位として非本質的と受け取れることでやたらめっぽう細かくもなりがちであるとのことはおよそ好きになれない」との性分の人間なのだが、コンピューター・プログラムを動かすお決まりのライブラリ、出来合いのAPI(アプリケーション・プログラミング・インターフェース)のライブラリといったものにもベイズの式を活かしてのものが含まれているとのことが往々にしてあるのである ――放念していただいて構わないとのほんの若干ながらも専門性が伴っての話をなせば、である。[メールフィルタに見る機能がその典型だが、日常世界にて有効機能しているメールフィルタでさえこれより述べていくような【更新処理】(ベイズ更新)を発生させて「いない」極めて簡略なもの、ナイーブ・ベイズと呼ばれるやりようしかなさぬかたちで定義されている、状況を受けて進化していくといったことに多く乏しいものであるにすぎない(数式からして極めて単純に示せるものである)との[単純ベイズ分類器]の利用に往々にして留まっていもする](基本的事実の問題として現行の英文ウィキペディアのベイジアン・スパム・フィルタリング項目、その冒頭部からして[ナイーブ・ベイジアン・クラシファー(単純ベイズ分類器)がスパムフィルターに主として用いられている]と記載されている通りである)とのことが[ベイズ理論の応用の裾野の深さ・広さ]について傍証するかたちともなる、そのように述べられもするようになってもいる―― 。
他面、そうもした強力なるベイズ確率論に対しては批判がある、同確率論が
[本来そこに厳としてあるべき自然な状況]
をありのままの観察でもって煮詰めていこうとの科学的思考(とされるもの)からの逸脱を招きかねないもの、分析者の主観を確率分析のモデルに反映させようというやりようであるとして問題視する見方があるのもまた事実である。
たとえば、(それを言ってしまえばありとあらゆる[科学的分析]が論者が不誠実な輩であった際にそういう欠陥を帯びてしまうところかと思われもするところなのではあるが)、ある論者が確率論の基礎になる仮説定立に際して極めて問題ある「設定」をなし(後にて解説する尤度(ゆうど)というものについてあざとくもの恣意的な設定をなし)、分立する仮説ら見極めにあって「も」恣意的判断を多く差し挟み、そして、呈示データも恣意的に抽出したものばかり集めれば、ベイズ確率論を用いて欺瞞に対する数値的裏付けを与えることもできるとのことになるとされている(往々にしてそういうやりようを取る者は数値設定にまつわる解説をわざと確信犯的になしていないところか、と思われるが)。
ベイズ確率論に主観確率 ― subjective Bayesian probabilities― としての胡散臭さが伴うとされるのは大なるところとしてそういう事情に因る。
尚、本稿では
[高校生でも数式・数的処理の有り様について分かるようなレベル]
にての事細やかな解説を付し(高校で[学習]する[条件付け確率]とにまつわっての[確率の乗法定理]の概念からのみでいかようにベイズの概念に行き着けるか、ベイズの概念を用いていかような分析がなせるかの事細やかな解説を付し)、 のような中で[ベイズ推定]の基本的モデルを用いもし、によって、おおよそにしてこういう計数的見立てがなせるとの目分量を懇切丁寧に呈示する所存だが、そうもしたやりようでは[算定の対象]として客観的データを用い(何をもってして客観的とするのかの説明も付してのデータを用い)、主観と言われるような推定が作用している部分もブラックボックス化せずにきちんと明示しての話をなす所存である ――客観的な手法 objective methodを指向してのやりようをとる―― 。
などと述べると「小難しいことをくだくだと....」といった予断を招くか、とも思うが、本来的には単純なことに対して単純であるとの説明をこれ以降、注力してなす所存である。
その程度のものでなければ読み手をあまりにも限局化しすぎるか、との認識があってそうもしているのだが、とにかくも、本稿で展開するのは、(じつにもってしてくどくも述べ)、基本的に高校生卒業程度の[知識](および[集積知識を活用する意志の力]としての[知性])を有していれば、何ら惑うものではないだろうとの単純なるモデルである)
ここまできたところで、である。先立って例題として引き合いに出した事例(以下、再度、呈示の病気検査の事例)に基づいてベイズ理論にあっての基本的特性についてさらなる解説をなす。
(事例再述として)ある人物が病気Xの診断を受けた.... 。同人物が受けた診断は[陽性]・[陰性]との結果のうち、必ずどちらかが返ってくるものとなる(診断というものの性質を考えれば、至極当然のこととして、その二者しか結果は出ないという状況をここでは想定する)。
診断にて問題となる[陽性]か[陰性]か、それはいわば[結果]である。そして、[結果]については次のような[原因](仮説)が考えられる。
(【例題設定】として)
[結果(ないしデータ)の背面にある「実情」にまつわる[仮説1]としてのH1の特性]
⇒
全数は把握できていないが、診断結果などに照らしあわせて特定の疾病Xの発病状況として[陰性]である人間の比率は全人口にておおよそにして98%、対して、[陽性]である人間の比率は全人口比おおよそにして2%であると「推定」されている (との例題設定をなす。につき、その対象に見る[罹患率]2%との[推定]は揺らぎうるとも例題上、設定する)。
そのような推定がなされている中で特定疾病の罹病有無を判断するための特定検査を実施すると
[実体陽性状況 ―H1の状況― ]
にある場合には99%はその通りの結果(データ;D)が出るが、うち、1%は誤検知がなされてきてのものであると ―(後日調査で判明している検査精度の問題から)― 判断できるところとなっている(と例題設定する ――※検査としては[実体として陽性であるのにも関わらず陰性との結果が出ると非常に問題になる]のでそうした結果を出来るだけ避けるための慎重な設計がなされている、だが、後日調査でそれでも1%は誤検知がなされると判明している...そういう現実的状況を念頭に置いての例題設定をここでは付している―― )。
[結果(ないしデータ)の背面にある「実情」にまつわる[仮説2]としてのH2の特性]
⇒
(前半部は繰り返しとして)全数は把握できていないが、診断結果などに照らしあわせて特定の疾病Xの発病状況として[陰性]である人間の比率は全人口にておおよそにして98%、対して、[陽性]である人間の比率は全人口比おおよそにして2%であると「推定」されている (との例題設定をなす。につき、その対象に見る[罹患率]2%との[推定]は揺らぎうるとも例題上、設定する)。
そのような推定がなされている中で特定疾病の罹病有無を判断するための同じくもの特定検査を実施すると
[実体陰性状況 ―H2の状況― ]
にある場合には95%はその通りの結果(データ;D)が出るが、うち、5%は誤検知がなされてきてのものであると ―(後日調査で判明している検査精度の問題から)― 判断できるところとなっている(と例示設定する ――※検査が[陰性兆候が強くとも油断ならない]との観点から(実体陰性状況になるような局面では)陰性結果・陽性結果が出る割合が高めに95対5になるように検査設計されている...そういう現実的状況を念頭に置いての設定をここでは付している―― )。
※同事例については[偽陽性](実体は陰性なのにデータとしては陽性が出ている)・[偽陰性](実体は陽性なのにデータとして陰性が出ている)にまつわる解説に関わる図を先立って挙げているところとなる
説明の便宜のために持ち出しはじめた中、ここに再述したところの上のような事例の場合にあって、たとえば、検査にて[陽性]との結果を得たとしよう。とすると、その[陽性]が(悲観すべきものとしての)[真陽性] ―検査結果としてのデータの通りに実体も陽性であるとのこと― となっている可能性はいかほどばかりか。
もっぱらベイズ確率論に依拠しての視点からそちら問題を見てみる (これまた以降の確率論に対するつなぎとしてなす話として、である)。
まず先立っての[14]式、
P(Hx|D)=P(D|Hx) × P(Hx) / (P(H1) × P(D|H1) + P(H2) × P(D|H2) + P(H3) × P(D|H3) + ・・・ + P(Hn) × P(D|Hn))
から見れば、[真陽性](実体として疾病に罹患している状況)に起因する可能性がいかほどまでかは次のようなかたちで示せることとなる。
H1を[実体としての陽性の状況](表層的なデータの背後にある真因でもいい)として先立ちもして定義してきたとの話の性質上、P(H1|検査結果[陽性]データ)、すなわち、
[陽性のデータ(D)が検査より得られたならば、それが実体としての陽性の状況をも示しているとの「条件付き」確率]
は次のかたちにて示せることとなる。
(H関連要素(物事の背面を突いての仮説あるいは真因にまつわる要素)がH1およびH2しかないとの表記事例にあって単純に[14]式より導き出せるところとして)
P(H1|検査結果[陽性]データ) = P(検査結果[陽性]データ|H1) × P(H1) / ( P(H1) × P(検査結果[陽性]データ|H1) + P(H2) × P(検査結果[陽性]データ|H2) )
上式における、
P(検査結果[陽性]データ|H1)
および
P(検査結果[陽性]データ|H2)
すなわち、
[H1(実体としての[陽性]たる真因)との状況にある中で検査結果データとして「も」陽性と出てしまっているとの確率] (真陽性、真に陽性なり、トゥルー・ポジティブの可能性)
および
[H2(実体としての[陰性]たる真因)との状況にある中で検査結果データとして「は」陽性と出ているとの確率] (偽陽性、実は陽性ならざるなり、フォールス・ポジティブの可能性)
は所与、そう、あらかじめ与えられもしているデータから、
[不変なるもの](さらに後述しもすることとなるところのLikelihood[尤度]と呼ばれるもの)
としてあらかじめ定義できるものとなっているし、ベイズ確率論ではそのようなものでなければならないとのものである (そうではないと話は基本的なベイズ確率論の適用対象にはならない) 。
その点もってしてデータの背面にありもする、
[ありうべき真相としての原因] (ないしは[実体を衝きもしていうると想定される仮説ハイポーセシス])
としてのH1およびH2ら、それらH1およびH2らがデータ(検査結果としてのD)に先んじて存在しているとのもの「でない」とすれば、それらの計数的特質があらかじめ不変なるものとして算定されている(設定されている)との場合「でない」とすれば ――たとえば、ここでの事例では「実体として陽性である(H1)のに間違って陰性であるとのデータ(D)が出ている可能性は~%である」といった風に具体的に事前に計数的ありようを定めての例題設定をなしているわけではあるが、そういった場合「でない」とすれば―― 、そちら[ありうべき真相としての原因](ないしは[実体を衝きもしていうる仮説]たるH1やH2など)の成立度合いにまつわっての確率を分析するとの議論を展開することは、そも、できない、ポシブル・インポシブルの問題としてできもしないとのことになる (:いいだろうか、[ベイズ確率論の本質に関わる最も基本的なる一般論]の問題として[H1やH2が一体全体、データ(D)に先んじて存在しているとのものとしてどれくらいの確からしさ・尤(もっと)もらしさを帯びているものなのか)についてあらかじめもってして想定・算定していないと、P(D|H)の値が算定・想定されていないと、 ―最終的にはそうもして計数的算定がなされてのH1やH2が本当に当該の事例での取得データに対応する真因としてそこに存在している可能性が取り合うに足りるものとなるのかが議論の終着点となるわけであるも― 確率上の分析そのものがそも、成り立たないことになる ―※― )。
(※同じくものことに関してはこれよりおいおいもってしてより微に入っての解説をなす所存だが、D(データ)に先んじてのH1やH2のありようが計数的に定義されて「いない」と(データの背面にあってそれらと紐付くものとしての成立しやすさ度合いが問題になる)[原因]や[仮説]は確率論的分析は、そも、数学上の分析の対象にはなりえない ――事前にその値が目算でもいい、不変不動に定められている必要があるとのまさしくものここで述べもしているP(D|H1)、そう、先立って詳説してきたところの条件付き確率の公式の通りに述べての[H1ならばDである確率]([Hypothesis1仮説1が実体としてそこにある場合にあって「それによって規定されるかたちでの」想定されるところのDataデータの出方の確率])「ではなく」、 確率分析にあってその計数的変動度合いが終局的に問題にされるとのP(H1|D)、すなわち、これまた先立って意味合いを詳説してきたところの条件付き確率の公式の通りに述べての[DならばH1である確率]([観察実体としてDataデータが得られている折に「それによって規定されている」(観察データが向かう先に確実絶対に存在している)H1の存立可能性])にまつわっての確率論的分析は、そも、数学上の分析の対象にはなりえない、としてもいい―― )
ベイズ確率論(の応用)について聞き及んだことがなかった、だがもってして、計数的論理的なる思考能力はある程度、有しているとの聡い向きであるのならば、またもってして、そうした向きがベイズ確率論におけるベイズ推定というものではHがH1からHnといくつもあるとのP(H|D)の「相対的」成立度合い(いくつものHにおけるDと確実絶対に紐付けられた成立の相対的成立度合い)が問題視されているとの一事さえ押さえることができているのならば(ここまでの手前の不十分な説明を通してでも押さえることができているのであれば)、不十分は不十分なりにものこの段階までにて敢えてねちっこくも言及してきたことら ―殊に先立ってのベイズ推定にまつわっての一般公式( General formulation of Bayesian Inference )として有名な[14]式の意味合いについて言及してきたこと― からこの身、筆者が直上の段の記述にて何を述べんとしているのか大体はご想像いただけることかとも考えもするのだが、ただ、通常一般の向きら (の中でも本稿筆者が語るに値すると見る向きは[殺されると知れた状況であるのならば現実に抗う意思の力を有した向き][家畜に過ぎぬとのありように抗う向き]である(残念ながら、本稿はもうすぐ殺されるとの目算が成り立ってしまう状況で無為なる好奇心に応えるためにものしているのではなく生きる覚悟と意思を問うためにものしているつもりであるとのものである)) にはここまで説明したことだけではいまだもってして話の機微がご理解いただけないことか、とも思う(であるのでこれよりもってしてさらに細々と説明をなしていく所存でもある)。 そうも述べつつも書くが、とにかくもって、P(D|H)、すなわち、[HならばDの確率]としての[Hypothesis1仮説1が実体としてそこにある場合にあって「それによって規定されるかたちでの」想定されるところのDataデータの出方の可能性 ―後にもその意味合いを解説するが[尤度(ゆうど)]というもの― ]は「ベイズ確率論にあっては」計数的にあらかじめ定義されて不変なるものとなっている必要があるし、ここでの病気陽性・陰性にまつわる事例設定もそれに適合するようになしていること、ご理解いただきたい (問題は[実体を衝く原因]や[真相を衝く仮説](H)にまつわる目算があまりにも曖昧模糊としている、不確実極まりないとのときなのだが、といった場合でも、いや、といった場合にあってこそその真価を発揮するところとしてベイズ確率論(におけるベイズ推定)ではデータが大量に与えられており、かつ、[想定される原因あるいは仮説の候補](例えばH1からH100の100つの「計数的に定義された」原因的状況ないし仮説の候補)が必要十分なだけ呈示されているのであれば、それら原因(ないし仮説)の内、どれが最も現実的状況(データの導出され度合い)に近似的に近しいのものなのかの見極めがなせるようになっている(同じくものことについては先立っての[14]式の意味合いを煮詰めるとのかたちでこれよりさらに細々とした解説を加えていく))。
(ベイズ確率論では[尤度ゆうど]との呼称が一般になされるP(D|H)の値があらかじめ算定されている必要があるとのことを取りあえずも申し述べたうえで) ここでの事例、上にて[原因1][原因2]とのかたちで原因を規定している(不確実性をより前面に押し出したければ[仮説1][仮説2]と表してもいいがここでは原因と規定している)とのここでの事例では尤度たるP(D|H)が
(「H1 ―実体は陽性― という[原因]がそこにある場合にてデータが[陽性]となっている」ものである)
⇒
P(検査結果[陽性]データ|H1;実体としての陽性)=99/100
(「H2 ―実体は陰性― という[原因]がそこにある場合にてデータが[陽性]となっている」ものである)
⇒
P(検査結果[陽性]データ|H2;実体としての陰性)=5/100
となるように厳密に規定している (何故、上記のような値がここでの例題設定で出てきもするのかについては、である。上に見る条件付き確率、P(検査結果[陽性]データ|H1;実体としての陽性)が[実体として陽性であるとの状況(原因)に確実に紐付く中で検査で陽性結果がデータとして出ている可能性]を意味していること、ご理解いただいたうえで、下の再掲なしての表を参照されれば、惑うところはないことか、とは思う)。
以上、記した上で続けるが、ここでの例題設定ではP(H1)およびP(H2)は ―それらが意味するのが[H1およびH2が成り立つ確率]であるところ― それぞれに
P(H1)=2/100
P(H2)=98/100
となる(ように先立ってより例題設定している。その点、初期の状況における罹患率の[推定]の問題としてH1およびH2が成り立つ比率を(全国民における想定されるところの)H2[実体陰性]状況は98%、(全国民における想定されるところの)H1[実体陽性]状況は2%とのかたちでの例題設定をなしている ―お忘れの向きは上の記述内容を参照のこと― )。
上の
P(検査結果[陽性]データ|H1)=99/100
P(検査結果[陽性]データ|H2)=5/100
P(H1)=2/100
P(H2)=98/100
をデータがまずもって与えられたときに、である。ベイズ推定にあっての一般公式([14式])をそのまま活用しての本事例にあってのH1成立可能性判断の式 ― P(H1|検査結果[陽性]データ) = P(陽性|H1) × P(H1) / ( P(H1) × P(陽性|H1) + P(H2) × P(陽性|H2) )、すなわち、[検査結果[陽性]データがそこにある場合、それに確実に紐付く(それを絶対的に規定する)ものとしてのH1(実体陽性)の状況が背後に成立しもしている確率]にまつわっての式― に呈示の値らを代入すると、
P(H1|検査結果[陽性]データ) = (2/100×99/100) / ((2/100×99/100) + (98/100×5/100)) = 0.28779......(小数点6桁以下切り捨て.パーセント表記では28.779%)
との結果が導出されてくることになる。
上記式から示されることは
[全数は把握できていないが、従前診断結果などに照らしあわせて特定の疾病Xにおける[陰性]である人間の比率は全人口にておおよそにして現行データでは98%、対して[陽性]である人間は全人口比おおよそにして2%であると「推定」されていもする。そのような中で特定検査にて[陽性]であるとの結果を呈示されるとの場合は95%そのとおりのものとなっていると[検査精度の問題](検査固有の限界性の問題)として後日事後調査より判明しているが、換言すれば、それは陽性ではない[実体陰性状況]であるのに関わらず[陽性]との検査結果(データ)が導出されるとの偽陽性率(パーセンテージ・オブ・フォールス・ポジティブ)が5%となっているとのことである。 他面、[陰性]であるとの検査結果が出された際には99%はその通りだが(実体も陰性状況にある)、1%は本当は陽性となっているのに陰性との検査結果が出てしまっている(と後日事後調査より厳密に判明している)。換言すれば、偽陰性率が1%となっているとのことである]
以上のような状況下で仮に検査で[陽性]との結果が出ると[実体的陽性状況]にそのような検査結果が由来している可能性は、、、、、
[(たかだかもってしての)28.779%]
にとどまる
とのありようである(※)。
(※表記のような事例(病気検査の事例)についてはベイズ確率論の効果効用を訴求するためによくも取り上げられるものでもある。
すなわち、
「[検査結果[陰性]状況にあっての誤検知率]が(きちんと科学的に経験則化されている疾病検査キット精度などの問題として)5%ならば、そして、そうした検査で(全人口のうち、2%がそれに罹(かか)っているとの病気の罹患有無について)陽性と出れば、極めて高い割合(9割越えといった高い割合)で病気に冒されているのであろう」
などとの誤解が往々にしてなされ、そのため、[検査結果に対する過剰過分なる信頼](に基づく悲観)がまかりとおっている....、しかし、そういう風潮が正しくはないことを計数的にベイズ確率論(における分析)は教えてくれる(本件事例では精度95パーセントと判明している検査を受けて陽性と診断されても病気にかかっている確率は30%未満にすぎないとの計算上の実態がそこにあることが計算で分かる)、突き詰めて見れば、物事を一面的に見て予断に囚われるのは望ましくはないとのことをベイズ確率論は計数的に教えてくれる....などとの説明がよくもなされるようなところでもある ――※その点、[現実としての罹病陽性状況]に対して「圧倒的多数を占める」実状としての罹病陰性状況 (人口のうちの98パーセントが罹病陰性と初期状況では想定されているような圧倒的多数性が問題になる状況) であって「も」[陽性]と診断されるケースが5%「も」あるために陽性結果が出てもその結果については(偽陽性と通ずる[実体陰性](本例示事例ではH2)の比率の多さゆえに)強くもの希釈化力学の影響下にあることになる....そうもしたことが本事例では述べられるようになっている。 そして、同じくもの病因検査にまつわる事例はベイズ確率論 (スパムメール・フィルターから(原始的)人工知能の類推エンジンに至るまで活用されているとの確率的分類法) の効率性を示すものとして、(先立っても申し述べたが)、[乳癌におけるマンモグラフィー検査を引き合いにしての事例]といったかたちで極めてよく引き合いに出されるものである。 因みに、[実体的状況]と[取得情報]の離隔の問題、そう、真陽性・偽陽性、真陰性・偽陰性に起因する同じくもの問題は[第一種過誤および第二種過誤(の問題)]という呼称で統計的かつ科学的思考法を旨としている向きには[「半ば」常識的なるものの見方]となっている(大学では経済学部、多くの理系人と己を規定している向きらに似非科学と見られやすき経済学を学ぶための学部に([効用]を重視して)属していた筆者ですらその程度のことは大学の時点で聞き及んでいた)―― )
ここまできたところで話をさらに進めるが、「一般的に用いられる用語の問題として」ベイズ確率論では
[P(H|D) ―何度も何度も述べるが、特定のデータ(D)が[結果]としてそこにある場合にてそれによって特定の原因(特定仮説(H))に対応する確率的枠組みが規定されているとするケースP(H|D) (たとえば、[検査で陽性との結果(データ)が出た場合、それが実体としての陽性状況(真因たるH1)を確実に規定する方向を示している(DならばH1であることを示している)との確率]との直前紹介事例もこちらP(H|D)に該当する)― ]
をもってしてその変動具合をまさしくもの分析対象とすべくもの、
Posterior probability[事後確率]
との概念で便宜的にとらえるとの数学上の慣行慣例が定まっている (何故、[「事後」確率]なのかと述べれば、[データ]が現物として「新しく」出てきた(e.g.「検査対象が病気Xに罹患している(病気Xの陽性になっている)とのデータが「新しく」出てきた」等等)とのそれ「以後」の確率を考えるからである)。
他面、ベイズ確率論では
[P(H) ―特定の仮説が成り立つ可能性と「あらかじめ想定されている」確率― ]
をもってして
Prior probability[事前確率]
との概念で便宜的にとらえるとの数学上の慣行慣例が定まっている (何故、[「事前」確率]なのかと述べれば、ベイズ確率論ではいくつかの仮説ら、例えば、H1からH2らが成り立つ可能性(P(H)やP(H2))を可変的なもの、状況(データの追加取得)に応じて変動していく初期状態にあってのもの、あるいは後に修正されていく「前もってして」のものであるとの観点でとらえているからである ―(e.g.先程の病因検査の事例ではそもそも病気にかかっている・かかっていないとの確率(P(H1)およびP(H2))は大枠としての罹病率、陽性2%・陰性98%と呈示していたわけだが、といった罹病率は[まずもっての全数に対する予測]にすぎず、データとしての標本の新規具現化ありように基づいて全数に対して予測が変動していく事前確率として規定している)― 。については後にてイメージしやすくしもしての例示紹介をなす)。
そして、
[P(D|H) ―特定仮説(H)がデータに先立つものとしてそこにある場合にあってそちら仮説によっていろいろなデータの出方「それ自体」が計数的に「規定」されるうえでの確率(仮説H「ならば」データDの出方は~となろうとの確率)― ]
を「値不変なる」(初期状態の設定に完全に依存して変動要因とはならない)、
Likelihood[尤度]
との概念で便宜的にとらえると数学上の慣行・慣例が定まっている (何故、P(D|H)たるP(Data|Hypothesis)、[特定仮説がその確率的枠組みを規定しているとのその先に特定のデータがあるとの確率]が[尤度(ゆうど)]というものとして定義され、かつ、その値が不変であるか、と言えば、である。[尤度]というもの、[尤(もっと)もらしさの度合い]を意味する(英語でのライクリフゥドもそうした意味の語となる)という[尤度]というものが[ある仮説の枠組みが現実的データに先んじて、そちらデータ「の出方・表出」の枠組みを規定するかたちで存在している確率](P(D|H);[HならばDの確率])として[(仮説内における)データの尤(もっと)もらしさ]にまつわるものとなっているからである ――先立っても申し述べたが、ベイズ確率論については[主観確率]を問題視するものであるとの拒絶反応がよくも呈され、実際に(これまた先述のように)同確率論は Pathological Science[病的科学](何もないところにデータを捏造して科学的ありようを偽装する[疑似科学]よりはましだが、根拠やデータらを過剰評価してのその側面より不健全で信を置けぬことに変わりはないとの[病的科学])の手段にそれ(主観確率)がゆえに用いられることがある。 にまつわっては先述の事前確率の初期設定にあって主観が関わるようになっていることがあることが大なるところとして影響しているのだが、同じくもの主観確率というものに対する拒絶反応についてはここでいう[尤度]、それが検討対象の仮説毎にある程度のいい加減さを許容する式で設定付けされるとのことも「科学に主観を導入するものだ」と毛嫌いされている理由となっている(そうした毛嫌いの問題を回避するために良心的たりたいとのベイズ論者は事前確率の「初期」設定と、また、尤度の設定にまつわる理由付けをきちんと明示し、かつ、公平客観的なデータを投入し続けてどの仮説が最終的に生き残るのか、すなわち、どのような尤度設定をなしている仮説が確率論的に最終的に生き残るのかに対して中立で公平な目分量を呈示するとのやりようをとる必要がある)。 以上、この段階では難解にも響くかも知れないことを申し述べた上でさらに断っておくが、「後に仮説毎にそれが設定付けられての[尤度]が何なのかについてイメージしやすくしもしての解説も細々となす所存である」。また、先程の病因検査の事例を引き合いにすれば、である。 [特定の検査結果のデータとしての具現化が実体としての原因(と同義のものを指してのH1あるいはH2)と確実に紐付けられている確率 ; Hである折にあってのDの確率](P(D|H))としての[実体[陽性]状況(H1)にある中ではその通りの[陽性]の検査結果(データ;D)が99%として出てくるとの確率的状況]および[実体的[陽性]状況(H1)にある中でも[陰性]との検査結果(データ;D)導出が1%ながらも出てきてしまう(と経験則に基づいて判明していると事例設定しての)確率的状況]をもってしてH1における尤度と見るとのかたちと例題設定している(事後調査で判明していると例題設定しての硬直的検査精度の問題が[尤度]となっている)―― 。 さらに解説しておけば、固有の性質として[尤度]が(分析者の視点で定められているというのに)不変であるとのことだが、各仮説の中身、そう、それらがどういう確率論的状況をデータ(具現化データ)に対して定義・予測するものなのかの枠組みがころころと変わってしまえば、その確率論的軽重の判断対象とする仮説らは(最終的に棄却されるか棄却されないかは別として)仮説として要をなさなくなる、それがゆえに[尤度]は当然に不変なるものと想定されることになるのである。尚、H1からHnとn個の仮説を設定しての確率分析をなすうえで不適切な尤度設定をなしている仮説は(計数的に)淘汰されるとのことでベイズ確率論が真っ当に展開される限りは尤度設定の硬直性は(先述のように毛嫌いされるところではあるのだが)前提として問題視されていない ―先程の事例では([尤度]的意味合いを帯びての)[検査精度]が定まっての状況は二つしか設定していない、しかも、それに対しては([硬直的検査]であって)[生き残りが問題になる「暫定的」仮説]との位置づけを与えていないわけではあるが、現実の分析にあっては少し異なる意味合いを求め、呈示する― )。
以上のように概念ありようについてさしあたりの解説を付しもした、
[事後確率](P(H|D))
[事前確率](P(H))
[尤度](P(D|H))
がベイズ確率論の根幹をなすものである。