文書と文書マップと文書処理圏

文書」を「文書指向データベースの文書」の意味で使う。「文書」と「半構造データ」は同義語。文字列 "hello" も文書となる。

文書マップの「マップ」は、「ハッシュマップ」の「マップ」。マップの構成素には「キーと値〈key and value〉」を使う。抽象的なデータ型だが、JavaScript/TypeScript言語内で考える。すると; 文書マップはJSオブジェクトであり、キーは任意の文字列、値は、

  1. テキスト=文字列、またはテキスト型のサブタイプの値
  2. JSON値、またはJSON型のサブタイプの値
  3. 関数

関数は任意の関数ではなくて、文書処理関数〈document processing function | document processor〉。

文書マップは、とある圏の射になる。対象は型付きの名前〈ラベル〉の集合だから0-指標、0-指標の別名がコンテキストとかジャッジメントだから、ここでは用語「コンテキスト」を使う。文書処理関数は、オペラッドと思える。文書マップはオペラッドの集まりだからクローンになる。

文書フォーマットと処理 - (新) 檜山正幸のキマイラ飼育記 メモ編文書処理圏という言葉をだしたが、文書処理圏の射が文書マップ。

文書マップを射とする文書処理圏はかなりリッチで複雑な構造を持つ。この構造を利用して文書処理を行うが、まずは構造を把握しないと。

文書処理圏 $`{\bf Doc}`$ とは:

  • a category in which we can do the document processing.