仮説空間再度 - (新) 檜山正幸のキマイラ飼育記メモ編

数学的には、集合Aから集合Bへの写像fがあり、f:A→B、（少なくとも）Bには確率分布が載っていて、Bの確率分布は使える状況。このとき、Bに対する呼び名は：

概念空間〈concept〉
仮説空間〈hypothesis〉
パターン空間〈pattern〉
クラス空間〈class〉
行動空間〈activity〉
決定空間〈decision〉
結果空間〈result〉（診断など）
パラメータ空間〈parameter space〉（パラメータ推定のとき）
（確率変数の）値の空間〈value | outcome〉
{ラベル | インデックス | パラメータ | 番号}空間

Aに対する呼び名は：

インスタンス空間
データ空間
標本空間
状態空間
観測空間
特徴空間〈feature〉
入力空間

fは

観測{量}?
確率変数（＝決定性関数）
変量
統計量
推定量
識別関数
認識関数
分類
測定、推測
戦略
診断
決定関数
予測〈prediction〉

B→A の向きの確率写像〈拡散写像 | マルコフ核〉が「Aの確率分布」と呼ばれている。Bで条件付け〈conditioning〉されている。

インスタンスの{条件付き}?確率{分布}?
データの{条件付き}?確率{分布}?
標本の{条件付き}?確率{分布}?
状態の{条件付き}?確率{分布}?
観測の{条件付き}?確率{分布}?

バエズは、この値側で条件付けされたデータ側の確率分布を「仮説」と呼んでいる。なぜなら、真実とは保証されない人為的な{条件付き}?確率分布だから。

そうすると、「仮説」のさすモノは：

Bの要素
Bのなかで、確率分布のサポートに入る要素（有効な仮説）
B→A の向きの人為的確率写像
fが入るべき関数空間の要素

[追記]
講義動画 https://www.youtube.com/watch?v=dYMCwxgl3vk の 9:40 で、「仮説：事例〈インスタンス〉をラベルする関数」と書いてある。事例とは特性空間〈feature space〉の要素で実際に与えられたモノのこと、ラベルは値の空間の要素のことだから、仮説は特性空間からラベル空間への写像。したがって、仮説空間は関数空間だろう。

https://arxiv.org/pdf/1312.1445.pdf "Bayesian Machine Learning via Category Theory" のp.15の最後の行に"hypothesis space"、次のページに I:D→H とあり、推測Iの値の空間を仮説空間と言っている。もっとも、値の空間を関数空間にして、推測を学習と呼び替えると、学習:学習データ→関数空間となる。1階の推論＝データの識別、2階の推論＝学習＝推論の出力ということだろう。

https://arxiv.org/pdf/1402.3067.pdf "A BAYESIAN CHARACTERIZATION OF RELATIVE ENTROPY" のp.2中段で出てくる'hypothesis'は確率写像〈拡散写像 | マルコフ核〉の意味になっている。
[/追記]