ブログ

地方公共団体(自治体)情報システム標準化:文字同定の手順

こんにちは、カルチスタッフです。

前回の投稿から間が空いてしまいましたが、前回に引き続き、地方公共団体(自治体)情報システム標準化についてお話ししていきたいと思います。

今回は、手書き文字の文字を同定する手順について説明します。

例として、手書きで書かれた文字が、IPAmjm.ttfに収録されているどの文字と一致するのか、ということを調べていきます。

IPAmjm.ttf、行政事務標準文字、IPAmj明朝、文字情報基盤などについてはコチラの記事で詳しく説明しています。

◆目的

IPAmjm.ttfに収録されている文字(漢字)には、【MJ文字図形名】という一意のコードが割り振られていますので、その番号を特定することを目標に作業を進めます。

◆使用ツール

同定作業には【一般社団法人デジタル広域推進機構】から提供されているツール【deluxe文字選択DWPI明朝】を使用します。

また、包摂の判断基準として、2024年5月にデジタル庁が公表した【文字包摂ガイドライン】を使用します。

◆手順

一文字目は、この文字を同定します。

まず、【deluxe文字選択DWPI明朝】を用いて該当文字、似ている文字があるかどうか検索していきます。

よみがな、部首、画数で検索できます。

似ている文字が多いので順番に根気よく探していきます。

赤い四角で囲んだあたりに似ている文字があります。

最初の文字をクリックすると次のような画面が表示されます。

IVSをクリックします。

異体字が表示されるので、この中から手書き文字に近いグリフがあるかどうかを探していきます。

該当するグリフが見つかりました。

Unicodeは、9089_E011A

MJ文字図形名は、MJ026194となります。

なお、この例ではしんにょうの形が異なっていますが、これは書体によるデザイン差として同じ文字と判断し ます。下は、同じ【辺】という文字ですが、書体によって形が異なる例です。

次にこの文字を同定してみます。

先ほどと同様に【deluxe文字選択DWPI明朝】で該当文字、似ている文字があるかどうか検索します。

IVSをクリックして異体字を探しますが、見つかりませんでした。

手書き文字では【嗽】の字の中央部分、【束】という字が【朿】になっています。

手書き文字が、【嗽】と同じだと判断できるかどうか、【文字包摂ガイドライン】を確認していきます。

 【文字包摂ガイドライン】では下記20項目の基準を定め、2つの文字が包摂可能かどうかを定義しています。

文字包摂ガイドライン【5.包摂可能な基準について】より抜粋。

確認した結果、手書き文字と【嗽】は、形は近いけれど、画数が異なることや、【文字包摂ガイドライン】の中の基準に該当する項目がないことから、包摂関係には当たらないと判断しました。よって、この文字はIPAmjm.ttfの中に“該当するグリフ無し“ということになり、同定はできないという結果になります。

次はこの文字を同定してみます。

この文字は、ほぼ【瀧】という字と同じように見えますが、赤丸部分が特徴的です。

このパーツが、さんずいの三画目と同じであると断定しても良いかどうか、【文字包摂ガイドライン】で確認します。

【5-14 筆おさえの有無】と言う項目に当てはまると思われるため、この文字は【瀧】と同一だと判断できました。

結果として、

Unicodeは、7027

MJ文字図形名は、MJ016177となります。

同様に、下記の文字に関しても、それぞれ【文字包摂ガイドライン】の【5-5 交差有無】、【5-6 点か線か】に該当すると思われるため、文字を同定することが出来ます。

これまでの5文字の同定結果をまとめてみました。

文字の同定の判断は、基準が曖昧なことが多く、非常に判断が難しいです。

ガイドラインは示されているものの全てが網羅されているわけではなく、専門家であっても議論が深いところだと思います。

弊社で同定を行う際には、出来るだけ客観的に説明できるよう心がけております。

文字同定・外字同定についてお困りのことがありましたらお気軽にお問い合わせください。

関連記事

カルチ発行書籍

  1. 登録されている記事はございません。
ページ上部へ戻る