グラフィカルモデルの確率変数と事象

確率変数(または変量)は、確率分布=確率測度=確率空間=ランダム要素 だと解釈できる。

例題で「泥棒が入る事象」「地震が起きる事象」などと言っている。この「事象」は国語辞典的な「事態・事件」の意味。因果グラフのノードなので、「泥棒が入る確率変数」「地震が起きる確率変数」と呼ぶべき(って、もともとが相応しくない言い方だけど)。

例題:

B→A←E

「泥棒が入る確率変数」= Burglary = B、「地震が起きる確率変数」= Earthquake = E、「アラームが鳴る」 = Alarm = A とすると。

出現する確率空間を、

  • E = (E, PE)
  • B = (B, PB)
  • A = (A, PA)

として、E, B, A \stackrel{\sim}{=} 2 = {0, 1}。

  • PEE→[0, 1]
  • PBB→[0, 1]
  • PAA→[0, 1]

「泥棒が入る事象」とは、Pow(B)の要素のこと、のはずだが、いつのまにやら 事象=確率変数 として使われている。

フォングの記法で、

  • [A|B]:B→A
  • [A|E]:E→A

条件化マルコフ核と解釈して、

  • P([A|B]) = P!A|B
  • P([A|E]) = P!A|E

念のため、条件化オペレータ〈コンビネータ〉はビックリマークを付ける。

積分形式で書くと:

  • P!A|B(δa|b)
  • P!A|E(δa|e)

具体的には、

  • P!A|B({a0}|b0)
  • P!A|B({a1}|b0)
  • P!A|B({a0}|b1)
  • P!A|B({a1}|b1)

確率モデルの指標を書くなら:

signature BEA {
 sort B, E, A
 operation [A|B]:B→A
 operation [A|E]:E→A
}

キーワードをそれらしくすれば、

signature BEA {
 variate B, E, A
 influence [A|B]:B→A
 influence [A|E]:E→A
}

モデルインスタンスは、

instance P of BEA {
   P(B) in Infl(FinSet) := 確率表(特別なマルコフ行列)
   P(E) in Infl(FinSet) := 確率表(特別なマルコフ行列)
   P(A) in Infl(FinSet) := 確率表(特別なマルコフ行列)
   P([A|B]):P(B)→P(A) in Infl(FinSet) := マルコフ行列
   P([A|E]):P(E)→P(A) in Infl(FinSet) := マルコフ行列
}

別記・略記の規則:

  • P(B) =: PB
  • P(E) =: PE
  • P(A) =: PA
  • P([A|B]) =: PA|B
  • P([A|E]) =: PA|E

別記・略記の規則と、周辺化コンビネータ (-)!-、条件化コンビネータ (-)!-|-コンビネータ記号が整合している。その意味では巧みな記法。

指標のモデルインスタンス単一の大きな同時分布 P と解釈しても、個別に与えられた確率分布や条件化マルコフ核の集まりと解釈しても、周辺化、条件下、反転のコンビネータ〈オペレータ〉で行き来できる。

大事なこと

確率モデル〈統計モデル〉を、「指標とモデル」の意味のモデルと解釈する。モデルを考えるときは、その指標とターゲット圏がないとナンセンス。ナンセンスなことはしない!

積極的に指標を考える。指標射や指標演算も考える。モデルのあいだの射、ターゲット圏の取り替えから誘導されるモデル変換、グロタンディーク構成も考える。

ターゲット圏は、確率カップリングの圏、確率的影響〈stochastic influence〉の圏(対象はランダム要素)など。確率カップリングの圏と確率的影響の圏は、「有向カップリング → 条件化マルコフ核」という関手により同型。逆関手は、「影響 → 域ランダム要素による対角同時化」で与えられる。関手名は CondtInfl, JointCouple、互いに逆。