ブログ

2.<アラビア⽂字の特徴>

こんにちは、カルチスタッフです。

前回はアラビア⽂字の「基本の⽂字」をご紹介しました。
「基本の⽂字」には⼦⾳字・⺟⾳記号などの種類があることがわかったと思います。
今回は、アラビア⽂字の特徴である「双⽅向処理」「変形⽂字」「結合⽂字」について説明します。

■双⽅向処理■
まずアラビア⽂字の表記⽅向について⾒てみましょう。アラビア⽂字で「アラビア語」という単語はこのように表記します。20180709blog01

この単語をUnicode に分けてみるとこのようになります。
⼊⼒順は、0x0627 から、0x0644、0x0633・・・と続きますが、表⽰結果は0x0627 に対応する⽂字が最右に表⽰され、左隣に0x0644、0x0633・・・と続きます。
これがアラビア語の表記⽅向です。
実際の表⽰ではそれぞれの⽂字が「変形⽂字」になり、⼊⼒の単独のグリフとは形が異なりますが、⼤体の雰囲気はわかると思います。20180709blog02次に、アラビア⽂字と数字が混在する⽂字列を⾒てみましょう。
アラビア⽂字と数字で表記⽅向が異なります。20180709blog03このように、アラビア語と英数字が混在する⽂章の場合、⼊⼒のUnicode から表記⽅向を判定する処理が必要です。このことを双⽅向処理と⾔います。

■変形⽂字■
アラビア⽂字の⼦⾳字は、単語中の⽂字の位置によって、字形が変化します。
【独⽴】・【語頭】・【語中】・【語尾】の4つの字形をもつ⼦⾳字と、【独⽴】・【語尾】の2つの字形をもつ⼦⾳字があります。20180709blog04

■結合⽂字■
ヒンディー⽂字と同じように、アラビア⽂字にも、2つの⽂字が結合して1⽂字のように表される「結合⽂字」があります。「結合⽂字」は、「⼦⾳字同⼠の結合⽂字」と「⼦⾳字と⺟⾳字の結合⽂字」の2つに分けられます。「⼦⾳字の結合⽂字」の代表的な例に「ラームアリフ」と呼ばれる⽂字があります。「ラーム」と「アリフ」が結合して「ラームアリフ」と呼ばれる1⽂字に変化します。20180709blog05上ハムザ付きアリフ、下ハムザ付きアリフ、マッダ付きアリフとラームを組み合わせた「⼦⾳字同⼠の結合⽂字」もあります。20180709blog06また、⺟⾳記号は、⼦⾳の上や下に重なって表⽰されます。
下の図の⾚い四⾓部分が「⼦⾳字と⺟⾳記号の結合⽂字」です。(⾚丸が⺟⾳記号)20180709blog07今回は、アラビア⽂字の特徴である「双⽅向処理」「変形⽂字」「結合⽂字」について説明しました。
次回からは、⼊⼒Unicode から表⽰⽂字を決定するまでの流れを説明したいと思います。

カルチスタッフ

関連記事

カルチ発行書籍

  1. KEISコードブック_表紙
    2016年1月15日にKEISコードブックを発売しました。
ページ上部へ戻る