統計の用語と記法

注意事項

  1. 同時分布=2階以上の分布≒多次元分布 だが、次元概念は曖昧(主観的)だから、階数で定義する。(0, n) (n ≧ 2)の階数を持つマルコフ・テンソルを同時分布と呼ぶ。「同時」に意味はない。
  2. 同時化は、ベイズペアに対する演算で、二項演算と考えることができる。圏論コンビネータ
  3. 周辺化は、アレンジメントの二部構造に基づく演算。
  4. フォング記法の解説。
  5. 伝統的変数名記法の解説。変数名にプロファイル情報を入れる。
  6. 伝統的関数測度混同記法の解説。関数に点を入れてもいいし、部分集合〈事象〉を入れてもいい。関数を測度とも解釈し、測度を関数とも解釈する。
  7. 周辺分布は、周辺化の値と、単純分布=1階分布≒1次元分布 の曖昧語。
  8. アレンジメントの足の数と、部分け〈partitioning〉の部〈partition〉の数が混同する。
  9. bipartite = two-part partitioned, multipartite = n-partite = n-part partitioned
  10. k部n足分布(アレンジメント)を考える。

伝統的な用語・記法の混乱要因

  1. 測度と{質量 | 密度}?関数を区別しない。かなりヒドイ。
  2. 単純分布、条件付き分布〈マルコフ核〉、同時分布に同じ名前のオーバーロードする。かなりヒドイ。ただし、フォングの方法で合理化可能。
  3. シングルトン省略をする。(*, x) → x と省略。
  4. 集合(絵ではワイヤー)と集合のリスト(絵ではケーブル)を区別しない。
  5. DontCare値を扱わないでなんとなくごまかす。
  6. アレンジメントの足の部分け〈partitioning〉を明示しない。

マルコフ・テンソルの事例とDontCare記号

DontCare記号は未定義を意味する'⊥'とは違う。未知物を表す'?'とも違う。任意の値を入れていいプレースホルダー。アンダースコア'_'を使う。DontCare記号=アンダースコアは、マルコフ・テンソルの反転でゼロ除算が出てきたときに使う。

DontCare記号=アンダースコアを含むマルコフ・テンソルは、ある程度の不定性を持つマルコフ・テンソルを示す。すべてのスコーレム関数を表すのに使える。空集合に対するヒルベルト記号の定義とも似ている。

マルコフ・テンソルの例

名称 プロファイル階数 プロファイル
製造機械不良率 (1, 1) {1, 2, 3} → 良?
病気検査の精度 (1, 1) 病気? → {陰性, 陽性}
ガラポン (1, 1) {H, T} → {R, G, B}
ピン2本、ガラポン (2, 1) {H, T}, {H, T} → {R, G, B}
通信路 (1, 1) Send → Recieve
拡散 (n, n) k1, ..., kn → k1, ..., kn
バスケット選手の身長 (1, 1) バスケット選手? → {l, m, h}
カラスは黒い (1, 1) カラス? → 黒?
病気の症状 (1, 3) 病気種 → 熱?, 咳?, 発疹?
健康 (2, 1) 血圧, 喫煙? → 健康?

混同・混乱

よくある混同・混乱

  1. 構文的表現と意味的実体
  2. 要素と集合
  3. 射と写像(射=写像 と思いこんでいる)
  4. 要素と単元集合
  5. 要素と長さ1のリスト
  6. 空集合と単元集合(入力や出力が「ない」ときなど)

特定状況

  1. 多圏の基本対象(AtomObj(M))と多対象(PolyObj(M) = List(AtomObj(M)))と、忘却した後の圏の対象(Obj(U(M)))

圏の記号法 圏の部分系

C|p で、対象をpに制限した充満部分圏。C|q で、射をpに制限し広大部分系、圏になるとは限らない。圏になれば、広大部分圏。

例:

  1. Set|fin
  2. Set|nem
  3. Set|single
  4. Set|inj
  5. Set|surj
  6. Set|bij
  7. Set|iso
  8. Set|id

集合に対する条件

  1. nem 非空
  2. fin 有限
  3. nat 自然数の始切片〈initial segment〉
  4. pnat 正自然数の始切片〈initial segment〉

一般化テンソルに対する条件

  1. mrkv = consv = tot 保存的=非消失的
  2. sharp シャープ=非拡散的
  3. rank(m, n) ランクが (m, n)
  4. to(A) Aへの射
  5. from(A) Aからの射

可測空間に対する条件

  1. disc 離散
  2. pol=std ポーランド=標準ボレル
  3. fin 有限
  4. cg 可算生成

否定的接頭辞の用法へのリンク

上が新しい。

語学的問題 曖昧多義語

曖昧多義語の例:

確率変数

  1. 単なる可測写像
  2. 確率空間からの可測写像
  3. 確率空間のあいだの測度保存写像
  4. 特に、同時確率分布の射影写像
  5. 確率空間、または確率空間の台集合を変域とする変数
  6. 確率測度

標本空間

  1. 可測空間
  2. 可測写像の域
  3. 可測写像の余域
  4. 確率空間の台集合
  5. 確率空間
  6. 確率的圏の対象

確率的圏

  1. リィモナドのクライスリ圏(特定の圏)
  2. ジリィ型モナドのクライスリ圏(圏の種別)
  3. ジリィ型モナドのクライスリ圏の部分圏(圏の種別)
  4. マルコフ圏(圏の種別)
  5. マルコフ圏の特定の事例(特定の圏)

次元

  1. 位相空間多様体の幾何的次元
  2. 物理量の次元 例:次元解析、加速度の次元は L T-2
  3. ベクトル空間の基底の基数
  4. 寸法〈長さ〉、または寸法のリスト
  5. 直積対象の因子対象、または因子対象の列

階数

  1. 線形写像の階数=線形写像の像空間の次元
  2. 行列の階数=行列が表す線形写像の階数
  3. テンソルの階数=多行列のプロファイルのリストの長さのペア
  4. テンソルの階数=多行列のプロファイルのリストの長さのペアのどちらか
  5. テンソルの階数=多行列のプロファイルのリストの長さのペアの和

テンソル

  1. 多行列〈polymatrix〉
  2. 多線形写像〈polylinear map〉
  3. テンソル積空間の要素
  4. 多次元配列
  5. テンソル
  6. テンソル

テンソル

  1. ベクトル空間の圏のモノイド積
  2. 加群の圏のモノイド積
  3. 一般的モノイド積

名前の使い方

  1. 固有名:他でもないそのモノだけを指す名前
  2. 種別名:いくつかの個体達に共通する性質の名前。その性質により個体が分類される。
  3. 役割名:構造物や組織体の構成素/構成員の役割の名前

実際には、これらの名前の用法が頻繁に入れ替えられる。

  1. 固有名 → 役割名: 構造物/組織体内の構成素/構成員の固有名を、一般的な役割名に流用することがある。
  2. 固有名 → 種別名: “個体/構造物/組織体の集まり”の典型的特定メンバーの固有名が、総称的な種別名に流用することがある。
  3. 種別名 → 固有名: 種別名で識別される“個体/構造物/組織体の集まり”〈類〉を個体とみなして、種別名を固有名に流用することもある。
  4. 役割名 → 固有名: 構造物/組織体をひとつに固定した場合は、役割名が、その構造物/組織体内の個体の固有名として使える。

事例:

  1. 固有名 → 役割名: 1, 0
  2. 固有名 → 種別名: 任意次元の球面、円板
  3. 種別名 → 固有名: 集合、圏、バラエティの名前はほぼすべて
  4. 役割名 → 固有名: 単位元、最大元

識別の例

定理

  1. 保存性定理: 保存性は、del割り当ての自然性である。
  2. シャープ性定理: シャープ性は、copy割り当ての自然性である。
  3. デカルト性定理: 準マルコフ圏の保存部分圏は半デカルト圏になる。したがって、マルコフ圏になる。
  4. デカルト性定理: マルコフ圏のシャープ部分圏はデカルト圏になる。
  5. 隠れた要因定理: マルコフ圏のコモノイド・スタンピング・コモナドの余クライスリ圏はマルコフ圏になる。
  6. 条件化可能定理: マルコフ核の圏は条件化可能である。
  7. 反転可能定理(直接): マルコフ核の圏は反転可能である。
  8. 反転可能定理(関節): 条件化可能マルコフ圏は反転可能マルコフ圏である。
  9. ASE定理: 分布ωに関するASE関係は、copyで書ける。ASE関係はホムセット上の同値関係であり、圏の合同である。
  10. クロムウェル代替定理: 任意の確率空間はクロムウェル確率空間で代替してよい。
  11. レレバンス定理: マルコフ圏CのRelev(C)はダガーデカルト圏になる。
  12. サポート定理: 半環準同型 possible:PB があり、possibleにより、モナド準同型が作れる。

μ-ASE の定義、以下は同値。


f \sim_\mu g \mbox { on } {\bf Stoc}(X, Y)\\
\forall A, B.
{\displaystyle
\int_{x\in A} f(x)(B)\mu(dx) = \int_{x\in A} g(x)(B)\mu(dx) }\\
\forall A, B.
{\displaystyle
\sum_{x\in A} f(B|x)\mu(dx) = \sum_{x\in A} g(B|x)\mu(dx) }\\
\forall A, y.
{\displaystyle
\sum_{x\in A} f(dy|x)\mu(dx) = \sum_{x\in A} g(dy|x)\mu(dx) }\\
\forall x, y.
f(dy|x)\mu(dx) = g(dy|x)\mu(dx) \\
\forall x,y.
f(\{y\}|x)\mu(\{x\}) = g(\{y\}|x)\mu(\{x\}) \\

統一的用語法

  • 標本空間 : 対象、可測空間、サンプリングとは無関係、スカラーや単位区間が標本空間になるとは限らない。
  • 事象 : シグマ代数の要素、シャープ述語の外延
  • {スカラー値}?変量 : 標本空間からスカラーへの純関数
  • 述語 : 標本空間から“スカラーの単位区間”への純関数
  • 分布 : 単位対象からの保存的射〈マルコフ核〉、別の圏では部分集合/要素にもなる。
  • 測度 : 背景ジリィモナドの値の要素、測度と分布は同一視可能
  • 変量の評価値 : 期待値、存在命題、所属命題
  • 方体測度 : 独立な測度、射影達が独立組、方体{的}?部分集合、タプル
  • 正方体測度 : IIDな測度、射影達がIID、正方体{的}?部分集合、定項リスト
  • シャープ : 分散〈dispersion〉・分岐〈branching〉が起きない。
  • アンシャープ : 分散〈dispersion〉・分岐〈branching〉が起きるかも知れない。(「分散が起きる」ではない。)
  • 保存的: 消失〈vanishing〉・紛失〈lost〉が起きない。
  • 非保存的: 消失〈vanishing〉・紛失〈lost〉が起きるかもしれない。(「消失が起きる」ではない。)

統制原理

形式的結合、みっつ
  1. 形式的線形結合
  2. 形式的劣凸結合
  3. 形式的凸結合
射の性質、ふたつ
  1. シャープ性〈シャープネス〉=非分散性
  2. 保存性=非消失性

シャープかつ保存的ならデカルト的〈cartesian〉=古典的〈classical〉という。

アレンジメントの性質、ふたつ
  • 条件化可能性
  • 方体性〈cubicality〉=独立性〈independence〉

正方体〈regular cube〉的なアレンジメントは、IID列に対応する。

モナドとクライスリ圏

モナド

→係数半環 ↓形式的結合 P B N
線形結合 Lin FinPow Bag
劣凸結合 SubConv FinPow Maybe
凸結合 Conv NEFinPow Id

クライス圏

→係数半環 ↓形式的結合 P B N
線形結合 Kl(Lin) NDfb Kl(Bag)
劣凸結合 Kl(SubConv) NDfb Par
凸結合 Stocdiscfb NDfb,tot Set

略号

  • Lin = Linear
  • Conv = Convex
  • SubConv = SubConvex = Subconvex
  • Fin = Finite
  • Pow = Power
  • NE = NonEmpty
  • Stoc = Stochastic
  • disc = discrete
  • fb = finite{ly}? branching
  • tot = total

評価=付値=valuation と積分

P B N
変量 P-変量=連続評価 B-変量=真偽評価 N-変量=離散評価
述語 P-述語 ファジー述語 B-述語 ブール述語 N-述語 ブール述語
測度=ポインター 確率分布 部分集合 要素
積分=妥当性 期待値 存在命題 球値=evaluation=所属関数値
  • 外延=(測度 | 部分集合)
  • 内包=(密度関数 | 質量関数 | 述語関数 )
  • (外延 |= 内包) が積分

モナドとモナド準同型

  1. List(A)
  2. Pow(A) B係数
  3. FPow(A) 有限台、B係数
  4. Bag(A) 有限台、N係数、経験データ
  5. DMeas(A) 有限台、P係数
  6. ProbDMeas(A) 有限台、J係数、保存的=マルコフ

モナド準同型

  1. List(A) → Bag(A) 順序の忘却、パリク写像
  2. Bag(A) = Meas(A)
  3. Bag(A) → Conv(A) = ProbMeas(A) データの分布化 経験分布
  4. Conv(A) → Pow(A) サポート

可能性論〈possibility theory〉

確率論 可能性論
probability possibility
マルコフ的 ブール的
程度・比率 真偽
半環P 半環B
区間J B
モナド LConv モナド Pow
モナド Conv モナド NEPow
準マルコフ圏 Kl(LConv) 準マルコフ圏 Kl(Pow) = ND
マルコフ圏 Kl(Conv) = DFStoc マルコフ圏 Kl(NEPow) = NDtot
劣マルコフ核 非決定性写像
マルコフ核 全域非決定性写像、可能性核
劣確率分布 部分集合
確率分布 非空部分集合
確率空間 相対集合、コア付き集合
確率保存射 コア保存射
ほとんど等しい〈ASE〉 ほとんど等しい
クロムウェル確率空間 フルコア相対集合
シャープである シャープである
独立な分布 矩形集合〈方体集合〉
マルコフ核の同時化 可能性核のグラフ化
同時分布の条件化 直積内コアからの射の構成
同時分布の周辺化 直積内コアの射影像