記述の圏と語彙文脈ツリー
$`\newcommand{\mrm}[1]{\mathrm{#1} }
\newcommand{\u}[1]{\underline{#1} }
\newcommand{\cat}[1]{\mathcal{#1} }
%`$語彙目録〈lexicon〉を対象として、記述〈description〉を射とする圏 を $`{\bf Desc}`$ とする。
圏 $`{\bf Desc}`$ の作り方(大雑把):
- キー〈ID〉の集合 $`K`$ を決める。これは無構造平坦な集合で何でもいい。
- 対象として $`\mrm{Powfin}(K)`$ を含む、反包含的〈opinclusive〉なDC圏を作る。
- 指標 $`\Sigma`$ を決めて、この指標を生成元にして拡張する。
- 関係の圏 $`{\bf Rel}`$ の充満部分圏と同型な圏を含むようにする。
複数の圏を混ぜ合わせてカクテル圏〈cocktail category〉が必要かも知れない。
あるいは、対象を、$`K`$ への単射を備えた有限集合として、$`i_A:\u{A} \to K`$ を記号の乱用で、$`i_A:A \to K`$ と書いて、その上に直和と融合和と融合積を定義する。指標 $`\Sigma`$ から作った記述の圏を $`{\bf Desc}[K](\Sigma)`$ とする。指標 $`\Sigma`$ は固定するとして、記述の圏を $`\cat{D}`$ とする。
記述の圏とは別に、ツリー $`T`$ を考えて、そのリーフ頂点集合を $`\mrm{Leaf}(T)`$ とする。ツリー $`T`$ を語彙文脈ツリー〈lexical context tree〉と呼ぶ。語彙文脈ツリーは、階層化された名前空間を提供する。リーフ頂点は、完全修飾名〈fully qualified name〉に対応する。単射写像 $`\mrm{ident}:\mrm{Leaf}(T) \to K`$ を決めておく。
キーの集合 $`K`$ を“接点”として2つの構造がある。
- $`\mrm{keySet}: |\cat{D}| \to \mrm{Powfin}(K)`$ 記述の圏
- $`\mrm{ident}: \mrm{Leaf}(T) \to K`$ 語彙文脈ツリー
これら2つはまったく無関係に選べる。
KLCD圏と伝統的出版物構造
Kはキー付き、Lは束、CDはコピー・破棄。適当なキー集合上に作られた束構造を持つCD圏が記述のKLCD圏となる。指標と自由KLCD圏を $`(\Sigma, \cat{D})`$ と書く。
自由圏 $`(\Sigma, \cat{D})`$ の射を語彙アウトライン〈lexical outline〉と呼ぶ。語彙アウトラインはストリング図で表現される。ストリング図のノードにテキストコンテンツを対応させたものをモデルと呼ぶ。
$`P`$ を順序付きツリーとする。$`d \in_1 \cat{D}`$ として、ストリング図とみた $`d`$ に出現するノードの集合を $`\mrm{Node}(d)`$ とする。写像 $`a:\mrm{Node}(d) \to \mrm{Leaf}(P)`$ を詰め込み〈packing〉と呼ぶ。
その他
次の関係をもっと正確に:
- 資源構造〈格納構造〉
- 伝統的出版物構造、順序付きツリー構造
- 語彙記述構造、記述の圏で計算できる。
- 語彙文脈ツリー
- ドミニオン/インスティチューション構造