「木簡・くずし字解読システム-MOJIZO-」の利用イメージ(図:東京大学のプレスリリースより)
「木簡・くずし字解読システム-MOJIZO-」の利用イメージ(図:東京大学のプレスリリースより)
[画像のクリックで拡大表示]

 東京大学と奈良文化財研究所は2016年3月25日、出土木簡や古文書、古記録、編纂物に書かれた文字を読み解くためのOCR機能「木簡・くずし字解読システム-MOJIZO-」を公開した(MOJIZOのWebサイト)。過去に収集した字形データをもとに、文字が読めなくても似た文字を探し出すことができる。

 ユーザーが解析したい文字画像をアップロードすると、古代から近代初頭までの典型的な字形3万字の中から近似するものを一覧表示する。これまで専門家に頼るほかなかった史料上の難読文字の解読を、誰もが一定の類推をすることが可能になる。無料で利用できる。

 東京大学史料編纂所は「電子くずし字字典データベース」を、奈文研は「木簡画像データベース・木簡字典」を開発・公開している。両データベースはコンセプトや機能で共有する部分が大きいことから、2009年10月から連携検索機能を提供している。双方合計で30万件超の字形データと付随するメタデータを蓄積している。