9.92019
4.<ベンガル語の⽂字結合のしくみ2>
こんにちは、カルチスタッフです。
前回に引き続き、どのような仕組みでベンガル語の⽂字が結合するのかを⾒ていきましょう。
⼿順は次の4つです。
(1)ベンガル語の単語を⾳節で区切る
(2)変形しやすいように⽂字を並べ替える
(3)フォントファイルに収録されている情報に基づいて⽂字を変形する
(4)フォントファイルに収録されている情報に基づいて記号の位置を調整する
今回は、
(2)変形しやすいように⽂字を並べ替える
について説明したいと思います。
並べ替えは、⾳節の中だけで起こります。
⾳節について詳しく知りたい⽅は3.<ベンガル語の⽂字結合のしくみ1>を復習してください。
■並べ替えのための【種別】をつける■
上・前・ベース・下・後の【種別】をつけて、⽂字を分類していきます。
① ⺟⾳記号・記号の【種別】
⺟⾳記号・記号の【種別】は⽂字に対して1:1 で決まっています。
⺟⾳記号・記号に【種別】「ベース」はありません。
⺟⾳記号・記号はかならずベースとなる⼦⾳字・⺟⾳字にくっついて結合⽂字になります。
その際、ベースの⽂字の前につくのか、上につくのか、といった位置に対応しているためわかりやすいと思います。
(a) 前(b)上(c)下(d)後*ここでは、1.<ベンガル語の基本の⽂字>で紹介した<代表的な⺟⾳記号><その他の記号>のうちの⼀部を抜粋して紹介しています。
② ⼦⾳字の【種別】
⼦⾳字の【種別】は、⺟⾳記号・記号に⽐べて少し複雑です。
⼦⾳字は、⾳節の中の⼦⾳字の位置によって【種別】が変わってきます。
まず、前提条件として、⾳節内に必ず「ベース」が1 つ必要になります。
⾳節内に⼦⾳字が1 つしかない場合、その⼦⾳字の【種別】は「ベース」です。
また、下記に⽰す、「上」「下」「後」の種別をつけた時点で、【種別】がついていない⼦⾳字が⾳節内に1 つしかない場合、その⼦⾳字の【種別】は「ベース」です。
以上を踏まえた上で、【種別】「上」「下」「後」「前」の付け⽅を⾒ていきましょう。
(a)⾳節の先頭の⼦⾳字が(0x09B0)か、(0x09F0)の場合、 の種別は「上」になる。
(b)⾳節の⼀番最後の⼦⾳字が(0x09AF)の場合、の種別は「後」になる。
(c)(b)以外で、⾳節の最後の⼦⾳字が(0x09B0)か、(0x09F0) か、(0x09AC)の場合、 の種別は「下」になる。
(d)(b)(c)以外で、⾳節の⼀番最後の⼦⾳字の種別は「ベース」になる。
(e)それ以外の⼦⾳字の種別は「前」になる。
1つずつ⾒ていきましょう。
(a) ⾳節の先頭の⼦⾳字が(0x09B0)か、(0x09F0)の場合、 の種別は「上」になる。(b) ⾳節の⼀番最後の⼦⾳字が(0x09AF)の場合、の種別は「後」になる。(c) (b)以外で、⾳節の最後の⼦⾳字が(0x09B0)か、(0x09F0) か、(0x09AC)の場合、 の種別は「下」になる。(d)(b)(c)以外で、⾳節の⼀番最後の⼦⾳字の種別は「ベース」になる。(e)それ以外の⼦⾳字の種別は「前」になる。
■並べ替えの順番■
【種別】に従って並べ替えを⾏います。
図で表すとこのようになります。
⼦⾳字の次にハラントがある場合は、基本的に⼦⾳字と⼀緒に移動します。
ただし、ベースの直後にハラントがある場合、ハラントは最後の⼦⾳字の直後の位置に移動します。下の図をみてください。ベンガル語の⽂字を⼊⼒するときは、⼦⾳字の次に⺟⾳記号を⼊⼒しますが、【⺟⾳記号:前】と、【⼦⾳字】が組み合わさった結合⽂字は、⺟⾳記号が先に表⽰されています。
⽂字の並べ替えをすることによって、このような結合⽂字が表⽰できることがわかると思います。
■⽂字を並べ替えてみよう■
ベンガル語で「⼊場」は、このように記述します。この単語がどのような⽂字から構成されているかをみてみましょう。このような5⽂字が、組み合わさって単語になっています。
この5⽂字を⾳節に分けるとどうなるかを⾒てみましょう。2⾳節に分かれました。
次は⽂字を並べ替えます。並べ替えは⾳節ごとに⾏います。
1⾳節⽬は、1⽂字しかないため、並べ替える必要はありません。
2⾳節⽬の4⽂字を並べ替えてみます。
まず、それぞれの⽂字に並べ替えのための種別をつけます。・先頭の⼦⾳字が(0x09B0)なので先頭の⼦⾳字の【種別】は「上」となる。
・この時点で、【種別】がついていない⼦⾳字は1 つしか残っていないため、の【種別】は「ベース」となる。
・⺟⾳記号の【種別】は「前」となる。
つぎに種別に従って並べ変えます。
ハラントは⼦⾳字と⼀緒に移動します。結合⽂字と並べ替え後の⽂字の関係を⾒てみるとこのようになります。並べ替えを⾏うことで、⼊⼒した⽂字列が、結合⽂字の形に近づいたことがわかってきたと思います。この例では、最後の⼦⾳字とハラントがレーパフォームに変形して結合⽂字の⼀部を構成します。(レーパフォームについては2.<ベンガル語の結合⽂字>を参考にしてください)
次は、いよいよ⽂字の変形について説明したいと思います。
カルチスタッフ