10.102017
4.<ヒンディー語の文字結合のしくみ2>
こんにちは、カルチスタッフです。
前回に引き続き、どのような仕組みでヒンディー語の⽂字が結合するのかを⾒ていきましょう。
⼿順は次の4つです。
(1)ヒンディー語の単語を⾳節で区切る
(2)変形しやすいように⽂字を並べ替える
(3)フォントファイルに収録されている情報に基づいて⽂字を変形する
(4)フォントファイルに収録されている情報に基づいて記号の位置を調整する
今回は、
(2)変形しやすいように⽂字を並べ替える
について説明したいと思います。
並べ替えは、⾳節の中だけで起こります。
⾳節について詳しく知りたい⽅は3.<ヒンディー語の⽂字結合のしくみ1>を復習してください。
■並べ替えのための【種別】をつける■
上・前・ベース・下・後の【種別】をつけて、⽂字を分類していきます。
① ⺟⾳記号・記号の【種別】
⺟⾳記号・記号の【種別】は⽂字に対して1:1 で決まっています。
⺟⾳記号・記号に【種別】「ベース」はありません。
⺟⾳記号・記号はかならずベースとなる⼦⾳字・⺟⾳字にくっついて結合⽂字になります。
その際、ベースの⽂字の前につくのか、上につくのか、といった位置に対応しているため わかりやすいと思います。
(a) 前(b)上(c)下(d)後*ここでは、1.<ヒンディー語の基本の⽂字>で紹介した<代表的な⺟⾳記号>と、<その他の記号>のうちの⿐⾳化記号・促⾳化記号を対象としています。それ以外の記号は例外として説明は省略します。
② ⼦⾳字の【種別】
⼦⾳字の【種別】は、⺟⾳記号・記号に⽐べて少し複雑です。
⼦⾳字は、⾳節の中の⼦⾳字の位置によって【種別】が変わってきます。
⼦⾳字に【種別】「後」はありません。
(a)⾳節に⼦⾳字が1つしかない場合、その⼦⾳字の種別は「ベース」になる。
(b)⾳節の先頭の⼦⾳字が (0x0930)の場合、 の種別は「上」になる。
(c)⾳節の⼀番最後の⼦⾳字が (0x0930)の場合、 の種別は「下」になる。
(d)(c)以外で、⼀番最後の⼦⾳字の種別は「ベース」にる。
(e)それ以外の⼦⾳字の種別は「前」になる。
1つずつ⾒ていきましょう。
(a)⾳節に⼦⾳字が1つしかない場合、その⼦⾳字の種別は「ベース」になる。(b)⾳節の先頭の⼦⾳字が (0x0930)の場合、 の種別は「上」になる。(c)⾳節の⼀番最後の⼦⾳字が (0x0930)の場合、 の種別は「下」になる。(d)(c)以外で、⼀番最後の⼦⾳字の種別は「ベース」にる。(e)それ以外の⼦⾳字の種別は「前」になる。
■並べ替えの順番■
【種別】に従って並べ替えを⾏います。
図で表すとこのようになります。
⼦⾳字の次にハラントがある場合は、⼦⾳字と⼀緒に移動します。下の図をみてください。ヒンディー語の⽂字を⼊⼒するときは、⼦⾳字の次に⺟⾳記号を⼊⼒しますが、【⺟⾳記号:前】と、【⼦⾳字】が組み合わさった結合⽂字は、⺟⾳記号が先に表⽰されています。
⽂字の並べ替えをすることによって、このような結合⽂字が表⽰できることがわかると思います。
■⽂字を並べ替えてみよう■
ヒンディー語で「冬」は、このように記述します。この単語がどのような⽂字から構成されているかをみてみましょう。このような5⽂字が、組み合わさって単語になっています。
この5⽂字を⾳節に分けるとどうなるかを⾒てみましょう。2⾳節に分かれました。
次は⽂字を並べ替えます。並べ替えは⾳節ごとに⾏います。
1⾳節⽬は、1⽂字しかないため、並べ替える必要はありません。
2⾳節⽬の4⽂字を並べ替えてみます。
まず、それぞれの⽂字に並べ替えのための種別をつけます。・先頭の⼦⾳字が (0x0930)なので先頭の⼦⾳字 の【種別】は「上」
・次の⼦⾳字 が⾳節内で最後の⼦⾳字です。最後の⼦⾳字が (0x0930)ではないので、 の【種別】は「ベース」
・⺟⾳記号の【種別】は「後」
つぎに種別に従って並べ変えます。結合⽂字と並べ替え後の⽂字の関係を⾒てみるとこのようになります。並べ替えを⾏うことで、⼊⼒した⽂字列が、結合⽂字の形に近づいたことがわかってきたと思います。この例では、最後の⼦⾳字とハラントがレーパフォームに変形して結合⽂字の⼀部を構成します。(レーパフォームについては2.<ヒンディー語の結合⽂字>を参考にしてください)
次は、いよいよ⽂字の変形について説明したいと思います。
カルチスタッフ