9.22019
3.<ベンガル語の⽂字結合のしくみ1>
こんにちは、カルチスタッフです。
前回はベンガル語の結合⽂字の代表的な例について説明しました。
それでは実際に、パソコン上でベンガル語の単語を表⽰させる場合に、どのような仕組みで⽂字が結合するのかを⾒ていきましょう。
⼿順は次の4つです。
(1)ベンガル語の単語を⾳節で区切る
(2)変形しやすいように⽂字を並べ替える
(3)フォントファイルに収録されている情報に基づいて⽂字を変形する
(4)フォントファイルに収録されている情報に基づいて記号の位置を調整する
今回は、
(1)ベンガル語の単語を⾳節で区切る
について説明したいと思います。
■⾳節とは何か?■
ベンガル語の⽂字の結合は⾳節ごとに起こります。そのため、単語をまず⾳節でわけることが必要です。⾳節とは、発⾳時に⼀⾳で表現される単位のことです。例として、⽇本語の「やきゅう」という単語がいくつの⾳節から構成されているのかを⾒てみましょう。このように⽇本語の場合「やきゅう」という単語は、4⽂字・3⾳節から構成されています。
⽇本語には、「⾳節の終わりは必ず⺟⾳になる」というルールがあります。同様に、ベンガル語にも⾳節の区切りに決まりがあります。
■ベンガル語の⾳節のルール■
ベンガル語の⾳節のルールで、最も基本的なものを2つ紹介します。
以下のルールに当てはまらない場合は⾳節を分けます。
【ルール1】
⽂字が、⼦⾳字→⺟⾳記号→その他の記号(以下、記号と表記する)、の順番で並んでいる場合は同じ⾳節とする。
⼦⾳字→⺟⾳記号、⼦⾳字→記号の順番で⽂字が続く場合は、1⾳節です。⺟⾳記号→⼦⾳字、記号→⼦⾳字の順番で⽂字が続く場合は、⾳節が分かれます。【ルール2】
⼦⾳字と⼦⾳字の間に【ハラント】記号がある場合、3⽂字は同じ⾳節とする
⼦⾳字→ハラント→⼦⾳字の順番で⽂字が続く場合は1⾳節です。⼦⾳字→⼦⾳字の順番で⽂字が続く場合は、⾳節が分かれます。
■単語を⾳節でわけてみよう■
ベンガル語で「こんばんは」は、このように記述します。この単語がどのような⽂字から構成されているかをみてみましょう。このような10 ⽂字が、⾳節ごとに結合⽂字をつくり、表⽰されています。
この10 ⽂字を⾳節に分けるとどうなるかを⾒てみましょう。
① 1文字目と2文字目の間は【ルール1】に当てはまるので同じ音節② 2文字目と3文字目の間は【ルール1・2】に当てはまらないので音節が分かれる③ 3文字目と4文字目の間は【ルール1・2】に当てはまらないので音節が分かれる④ 4文字目と5文字目の間は【ルール1・2】に当てはまらないので音節が分かれる⑤ 5文字目~9文字目の間は【ルール2】に当てはまるので同じ音節⑥ 9文字目~10文字目は【ルール1】に当てはまるので同じ音節このように、という単語は、4つの⾳節から構成されていることがわかりました。
結合⽂字と⾳節の関係をまとめてみるとこのようになります。① 1⾳節⽬は、⼦⾳字と⺟⾳記号の結合⽂字
② 2⾳節⽬は、基本の⽂字
③ 3⾳節⽬は、基本の⽂字
④ 4⾳節⽬は、3つの⼦⾳字と、⺟⾳記号の結合⽂字
⾳節で分けると、1つの単語でも結合⽂字が多⽤されていることがわかります。
ここでは代表的な⾳節のルールについて説明しました。
次は、⽂字の並べ替えについて説明したいと思います。
カルチスタッフ