学習と予測と推定

https://toukeigaku-jouhou.info/2018/02/17/difference-between-estimator-and-estimate/ から:

標本から得た統計量をもとに、母集団のパラメータを推定するとき、標本の統計量のことを、推定量といいます。 推定量は確率変数です。 実際にデータを観測した得られた数字をつかって計算したものが、推定値です。

例によって“すごい定義”だ。

ここでいう「標本」は確率変数 「台空間→観測値空間 確定性写像」 のことで、台空間上の確率測度が前送りされて観測値空間上の確率測度 ν を定義する。その前送り測度 ν が、パラメトリックモデル P:Θ→ProbMeas(観測値空間) (の像)に入っているとして、θ0∈Θ で、(理想としては) P(θ0) = ν となるθ0を求めることが、行為としての推定

定量は関数で、観測値〈サンプリング結果〉空間をXとして、e:X→Θ のこと(eが推定量)。「eは確率変数である」と言っているのは「eは確定性関数である」ことだから、単なる確定性関数 e:X→Θ 。実際の確定性要素 x∈X に対して e(x)∈Θ は確定する。e(x)が推定値で、関数値。つまり、推定量と推定値の違いは、関数と関数値の違いに過ぎない。

予測〈prediction〉または遂行〈preform〉とは、与えられた観測値から何らかの結果値〈result〉を計算する行為。予測または遂行を行う確定性関数予測子または遂行子と呼ぶ。

観測値空間をX、結果値空間をYとすると、予測子は集合 [X,!Y] に入る。[X,!Y] は、XからYへの確定性関数〈シャープチャンネル〉の集合。予測子のパラメトリックモデルを F:Δ→[X,!Y] とすると、予測子の学習は、Δに入るパラメータの推定とも言える。

一方で、Δのパラメータ推定で得られたδ0に対応する F0 = Fδ0 による値の計算=予測=遂行も、観測値空間の点から何かの値を得るので推定と言えなくもない

こうなると、学習行為=推定、学習の成果物で予測子の実行=推定 となり、たぶん混乱が生じる。

やっぱりダメだな。こんなことではダメだ。