記述の圏と語彙構造

記述の圏と語彙文脈ツリー

$`\newcommand{\mrm}[1]{\mathrm{#1} }
\newcommand{\u}[1]{\underline{#1} }
\newcommand{\cat}[1]{\mathcal{#1} }
%`$語彙目録〈lexicon〉を対象として、記述〈description〉を射とする圏 を $`{\bf Desc}`$ とする。

圏 $`{\bf Desc}`$ の作り方(大雑把):

  1. キー〈ID〉の集合 $`K`$ を決める。これは無構造平坦な集合で何でもいい。
  2. 対象として $`\mrm{Powfin}(K)`$ を含む、反包含的〈opinclusive〉なDC圏を作る。
  3. 指標 $`\Sigma`$ を決めて、この指標を生成元にして拡張する。
  4. 関係の圏 $`{\bf Rel}`$ の充満部分圏と同型な圏を含むようにする。

複数の圏を混ぜ合わせてカクテル圏〈cocktail category〉が必要かも知れない。

あるいは、対象を、$`K`$ への単射を備えた有限集合として、$`i_A:\u{A} \to K`$ を記号の乱用で、$`i_A:A \to K`$ と書いて、その上に直和と融合和と融合積を定義する。指標 $`\Sigma`$ から作った記述の圏を $`{\bf Desc}[K](\Sigma)`$ とする。指標 $`\Sigma`$ は固定するとして、記述の圏を $`\cat{D}`$ とする。

記述の圏とは別に、ツリー $`T`$ を考えて、そのリーフ頂点集合を $`\mrm{Leaf}(T)`$ とする。ツリー $`T`$ を語彙文脈ツリー〈lexical context tree〉と呼ぶ。語彙文脈ツリーは、階層化された名前空間を提供する。リーフ頂点は、完全修飾名〈fully qualified name〉に対応する。単射写像 $`\mrm{ident}:\mrm{Leaf}(T) \to K`$ を決めておく。

キーの集合 $`K`$ を“接点”として2つの構造がある。

  1. $`\mrm{keySet}: |\cat{D}| \to \mrm{Powfin}(K)`$ 記述の圏
  2. $`\mrm{ident}: \mrm{Leaf}(T) \to K`$ 語彙文脈ツリー

これら2つはまったく無関係に選べる。

KLCD圏と伝統的出版物構造

Kはキー付き、Lは束、CDはコピー・破棄。適当なキー集合上に作られた束構造を持つCD圏が記述のKLCD圏となる。指標と自由KLCD圏を $`(\Sigma, \cat{D})`$ と書く。

自由圏 $`(\Sigma, \cat{D})`$ の射を語彙アウトライン〈lexical outline〉と呼ぶ。語彙アウトラインはストリング図で表現される。ストリング図のノードにテキストコンテンツを対応させたものをモデルと呼ぶ。

$`P`$ を順序付きツリーとする。$`d \in_1 \cat{D}`$ として、ストリング図とみた $`d`$ に出現するノードの集合を $`\mrm{Node}(d)`$ とする。写像 $`a:\mrm{Node}(d) \to \mrm{Leaf}(P)`$ を詰め込み〈packing〉と呼ぶ。

その他

次の関係をもっと正確に:

  1. 資源構造〈格納構造〉
  2. 伝統的出版物構造、順序付きツリー構造
  3. 語彙記述構造、記述の圏で計算できる。
  4. 語彙文脈ツリー
  5. ドミニオン/インスティチューション構造