ハイパー文書

ハイパー文書の定式化には次が必要

  • 文書空間: おおよそ文書型/データ型に相当する。外延的/構造的に定義する。
  • 文書: おおよそ文書空間の要素。特定の文書型/データ型を持つ。
  • 文書コレクション: 同じ文書空間に所属する文書の集まり。文書空間の部分集合と言ってよい。文書コレクションは部分文書空間と同義。
  • 文書レルム: 文書コレクション上に関係の族が入った構造。
  • ハイパー文書: 文書レルムとほぼ同義、外部参照〈リンク〉が入ってもよい。

Dが文書空間で、d∈D (実は記号の乱用)のとき、Sub(d)⊆ D が決まる。原子アクセッサ記号Σに対して、

  • a:Sub(d)×Σ* → Sub(d)

が決まり。これが文書の代数構造となる。

文書レルムの関係は、関連、属性、遷移などを表現し、そのソフトウェア的解釈は関係タイプで規定する。リンクは関係と同義語で、関係タイプを決めることにより次のリンクを定義できる。

  • 目次リンク
  • 索引リンク
  • ナビゲーションリンク
  • 構造リンク(親子関係や、属性を表すリンク)
  • 出現リンク(タームの出現)
  • タギングリンク(タグ付けされたことを表すリンク)

問題は、関係の演算がなす代数構造。結合、転置、テンソル積、ブール演算などがある。さらに、関係のあいだに包含順序があるので、包含順序により2-圏となる。

次の操作は文書レルムで定義できる。

  • 検索
  • 遷移
  • トランスクルード
  • テンプレート処理
  • メタ記述(RDFのような)