はじめに

文字の情報を調べるための Slack アプリを作ったので、どこから情報を持ってきたか書いておこうと思います。

ちなみに、作ったのはこんな感じのアプリです(一般公開はしてません)。

Adobe-Japan1

Adobe-Japan1 は GitHub のリポジトリ があり、そこにいろいろな情報があります。

わかりやすいもので言えば Adobe-Japan1-7_ordering.txt には CID、カテゴリ、サブカテゴリ、グリフ名がタブ区切りで記載されています。

他にも aj17-kanji.txt には漢字に関する情報がたくさん書いてあります。

CMap リソース

CID と Unicode を結びつける CMap リソースも GitHub のリポジトリ で公開されています。

例えば Adobe-Japan1-7 と互換性のある UniJIS2004-UTF32-H など Adobe-Japan1 に限らず様々な CMap リソースが公開されています。

書式が CSV や TSV のような単純な形式ではないためぱっと見ややこしそうに見えます。ファイル仕様 も公開されているので読み解いてみるのも面白いかもしれません。

Glyphs 関連

Glyphs3 も発表され、人気も上がってるように見える Glyphs にも Adobe-Japan1 の情報が含まれています。

/Applications/Glyphs.app/Contents/PlugIns/OTF.glyphsFileFormat/Contents/Resources/MapFileAdobe-Japan1.txt に CID と Glyphs 上のグリフ名(nicename)等との対応が書かれています。

また、それぞれのグリフの詳細は /Applications/Glyphs.app/Contents/Frameworks/GlyphsCore.framework/Versions/A/Resources/GlyphData.xml から辿れます。

ちなみに、この GlyphData.xml は自分でカスタマイズして、自由な設定に変更 することができます。

Unicode Character Name

Unicode が割り当てられている文字はには名前がついています。これは Unicode® Character Name Index を使用すると調べられます。

おわりに

文字のことを知りたくなったら参考にしてみてください。