9.52024
地方公共団体(自治体)情報システム標準化と文字同定・外字同定
デジタル庁が、【地方公共団体で使用している情報システムの文字の標準化】を推進しています。
このプロジェクトは、簡単に言うと、今まで地方公共団体毎に使用していた「外字」をまとめよう、というものです。
なぜ「外字」をまとめる必要があるのか?プロジェクト実現のためにはどのような作業が必要なのか?と言うことを簡単にお話ししていきたいと思います。
◆外字とは?
フォントファイルの中には外字領域というエリアがあり、そこにはユーザーが自由に文字を設定することが出来るようになっています。外字領域に登録できる文字のコードはUnicode:0xE000~0xF8FFです。
例えば、地方公共団体が出力する印刷物に、システムにインストールされているフォントの中には含まれない文字(人名・地名など)を使用したい場合、必要に応じて都度、外字領域に文字を登録することになります。
外字を登録したフォントはシステム毎に管理されるため、外字を作成したシステムと、表示させたいシステムが異なる場合は、それぞれに同じフォントファイルをインストールする必要があります。
◆地方公共団体毎に異なる外字を登録することで起こる問題
例えば、A市で使用しているフォントファイルと、B市で使用しているフォントファイルが以下のように異なる場合を考えてみます。システム間での文字のやりとりは、文字コードを利用して行われています。
A市で使用しているフォントファイル:
B町で使用しているフォントファイル:
この状態で、A市がB町に
の文字コードである「Unicode:0xE000」を送信すると、
受信したB町のシステムでは
の文字が表示されてしまいます。
またA市が
の文字コードである「Unicode:0xE002」を送信した場合、
B町のフォントファイルには0xE002に文字が登録されていないため、文字を表示することが出来ません。
◆文字の標準化による問題解決
このような問題を解決するため、デジタル庁では、日本中の地方公共団体で現在使用されている外字を集め、全ての文字にコードをつけて、地方公共団体間で使う文字を統一しようという事業を進めています。これが【地方公共団体で使用している情報システムの文字の標準化】の概要です。
例えば、A市で使用されている外字とB市で使用されている外字を整理してコードをつけるとこのようになります。
A市とB市が共にこのルールに則ったフォントを使用していれば、送信元と受信先で違う文字が表示されてしまうことはありません。
上の図の例のように、デジタル庁が調査・作成した、日本中の地方公共団体で使われている文字を整理し、コードを付け直した文字セットを「行政事務標準文字」と呼んでいます。
◆行政事務標準文字とは
行政事務標準文字は、2011年に策定された文字情報基盤【MJ】を拡張した文字セットを指します。
文字情報基盤【MJ】は、住民基本台帳ネットワークシステム統一文字、戸籍統一文字を内包した文字セットです。実装フォントはIPAmj明朝.ttfであり、収録文字数は58862字です。このフォントは文字情報技術促進協議会のHPからダウンロードすることが出来ます。
文字情報技術促進協議会HPより(文字情報基盤整備事業事業概要 | 一般社団法人 文字情報技術促進協議会 (moji.or.jp))文字情報基盤のイメージ図
行政事務標準文字は、文字情報基盤文字に、戸籍で使用されている戸籍統一文字以外の文字(漢字・変体仮名9,175字、ひらがなカタカナ英数字1339字)を追加した約7万字の文字セットです。
デジタル庁HPより(地方公共団体情報システムにおける文字要件の運用に関する検討会(第8回)|デジタル庁 (digital.go.jp))行政事務標準文字の文字セット
一般社団法人デジタル広域推進機構より、追加文字が収録されたフォント【DWPI明朝】および【DWPI明朝追加文字属性辞書(暫定版)】が公開されています。
現在のところ、行政事務標準文字全体で約7万字の文字セットとなっています。
フォントファイルの仕様により、1フォントファイルに収録できる文字セットは約65000文字までに限られるため、1フォントファイルで運用できるよう、上図に示される、約4万字が収録された基本フォントファイルが作成される見込みです。
◆文字の標準化のために必要な作業
【地方公共団体で使用している情報システムの文字の標準化】を実現するためには、各地方公共団体で使用している外字ファイルの文字が、行政事務標準文字内のどの文字に該当するのかということを同定する必要があります。
同定作業は、外字の文字数分、下記のような約7万字のリストの中から当該文字を探し出す作業を繰り返します。ある程度は機械的に分類することが出来ても、最終的には人の目で同定することになります。
【一般社団法人デジタル広域推進機構】からツール【deluxe文字選択DWPI明朝】も提供されています。
このツールでは読み、部首から、文字を検索することが出来ます。
変体仮名も読みから検索することが出来ます。
地方公共団体により登録されている外字の数は異なりますが、外字ファイルに登録されている文字数が多い場合には大変な作業です。
弊社では長年外字製作に携わっている経験を生かし、文字同定を効率的に行うことが可能です。
文字同定についてお困りのことがありましたらお気軽にお問い合わせください。
カルチスタッフ