さらに概念を整理

  • トークン空間
    • ラベル空間
    • タグ空間(接頭辞許容)
    • ターム空間
      • テキストターム空間
      • シンボルターム空間
    • 型名空間(接頭辞許容)
    • 引用キー空間

構造を持つ文字列の空間として:

  • ID空間
  • フレーズ空間
  • パス空間
  • フラグメントID空間

情報担体としてアイテムがある。

  • アイテム空間: 文書フォレスト構造を持つ。ツリーが出版物に対応する。文書ツリーに付随データがあってもよい。

アイテムには:

  • 型が付く。が、マルチファセットで複数のボキャブラリーで型付けしてよい。
  • 型に内容モデルが含まれるかも知れない。
  • タグが付く。
  • タームが出現する。タームはタグで修飾されるかも知れない。
  • 引用キーが出現する。

色々なマップテーブル〈多関係〉がある。

  • ラベル → アイテム 目次的
  • パス → アイテム 目次
  • ターム → アイテム範囲 索引的
  • アイテム → 型名 型付け/マルチファセット
  • 引用キー → 書誌空間 参考文献リスト
  • 引用キーの出現 → 書誌空間 参考文献リスト

ほとんどすべてのモノにタギングできる。

  • ラベル=アイテムにタギング
  • タームにタギング
  • 型名にタギング
  • タグにタギング(メタタギング)

タームのタギングは、タームが定義出現したアイテムの継承的タギングを使う。タームは、タグ達と定義出現のアイテムの型で文脈付けられる。

トークン空間は、構造(自己関係)を持つ。同義同値関係、略記省略関係、依存関係、伴意関係など。推移的閉包を求めるのがアルゴリズム的に問題。

トークン・アイテム空間とマップテーブルに使う演算は:

  • 反射的閉包
  • 対称的閉包
  • 推移的閉包
  • 正規化
  • 転置
  • 結合〈ジョイン〉
  • 射影、抽出
  • タグ付き合併(直和)
  • 融合〈fusion | コファイバー和〉
  • 直積