オリヤー文字 (Unicodeのブロック)

オリヤー文字(オリヤーもじ、英語: Oriya)は、Unicodeの27個目のブロック

オリヤー文字 (Unicodeのブロック)
Oriya
範囲 U+0B00..U+0B7F
(128 個の符号位置)
基本多言語面
用字 オリヤー文字
主な言語・文字体系
割当済 90 個の符号位置
未使用 38 個の保留
Unicodeのバージョン履歴
1.0.0 77 (+77)
1.1 78 (+1)
4.0 80 (+2)
5.1 83 (+3)
6.0 89 (+6)
13.0 90 (+1)
テンプレートを表示

解説

編集

インド東部のオリッサ州などで話されているオリヤー語を表記するためのオリヤー文字を収録している。

オリヤー文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/(現在のオリヤー語では[ɔ])を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられることがあるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。

また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるヴィラーマという記号を子音字の下に付加したりする。

書字方向ラテン文字キリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。

子音字は有声音無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。

符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。

加えて、アラビア文字タイ文字などと同様に独自の数字体系(オリヤー数字)を有している。

Unicodeのバージョン1.0においても「オリヤー文字(Oriya)」というブロック名で制定されていた。[1]なお、2012年からこの文字と言語の「オリヤー(Oriya)」という名前は、インドでは正式には「オディア(Odia)」と綴られているが、この綴りの変更は、安定性の保証によって制約されている Unicode ブロックまたは文字名には影響しない。[2]

収録文字

編集

ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
各種記号
U+0B01 ORIYA SIGN CANDRABINDU チャンドラビンドゥ。

母音字や母音記号に付き、母音を鼻母音で発音することを表す。

U+0B02 ORIYA SIGN ANUSVARA アヌスヴァーラ

直後に音節が後続する子音字に付き、直後の子音と同じ調音点鼻音が挿入されることを表す。日本語における「」に相当する。

U+0B03 ORIYA SIGN VISARGA ヴィサルガ

音節末に[h]を伴うことを表す。

独立母音字
U+0B05 ORIYA LETTER A 短母音[ɔ]を表す。 a
U+0B06 ORIYA LETTER AA 長母音[aː]を表す。 ā
U+0B07 ORIYA LETTER I 短母音[i]を表す。 i
U+0B08 ORIYA LETTER II 長母音[iː]を表す。 ī
U+0B09 ORIYA LETTER U 母音[u]を表す。 u
U+0B0A ORIYA LETTER UU 長母音[uː]を表す。 ū
U+0B0B ORIYA LETTER VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。

現在のオリヤー語では[ru]と発音される。

[3]
U+0B0C ORIYA LETTER VOCALIC L 音節主音化した短母音としてのL(IPA:[l̩])を表す。

現在のオリヤー語では[lu]と発音される。

[4]
U+0B0D (予約済) ê
U+0B0E (予約済) ĕ
U+0B0F ORIYA LETTER E 長母音[eː]を表す。 e
U+0B10 ORIYA LETTER AI 二重母音[ɔɪ]を表す。 ai
U+0B11 (予約済) ô
U+0B12 (予約済) ŏ
U+0B13 ORIYA LETTER O 母音[ɔ]を表す。 o
U+0B14 ORIYA LETTER AU 二重母音[ɔʊ]を表す。 au
子音字
U+0B15 ORIYA LETTER KA 子音[k]を表す。 k
U+0B16 ORIYA LETTER KHA 子音[kʰ]を表す。 kh
U+0B17 ORIYA LETTER GA 子音[ɡ]を表す。 g
U+0B18 ORIYA LETTER GHA 子音[ɡʱ]を表す。 gh
U+0B19 ORIYA LETTER NGA 子音[ŋ]を表す。
U+0B1A ORIYA LETTER CA 子音[c]を表す。 c
U+0B1B ORIYA LETTER CHA 子音[cʰ]を表す。 ch
U+0B1C ORIYA LETTER JA 子音[ɟ]を表す。 j
U+0B1D ORIYA LETTER JHA 子音[ɟʱ]を表す。 jh
U+0B1E ORIYA LETTER NYA 子音[ɲ]を表す。 ñ
U+0B1F ORIYA LETTER TTA 子音[ʈ]を表す。
U+0B20 ORIYA LETTER TTHA 子音[ʈʰ]を表す。 ṭh
U+0B21 ORIYA LETTER DDA 子音[ɖ]を表す。
U+0B22 ORIYA LETTER DDHA 子音[ɖʱ]を表す。 ḍh
U+0B23 ORIYA LETTER NNA 子音[ɳ]を表す。
U+0B24 ORIYA LETTER TA 子音[t]を表す。 t
U+0B25 ORIYA LETTER THA 子音[tʰ]を表す。 th
U+0B26 ORIYA LETTER DA 子音[d]を表す。 d
U+0B27 ORIYA LETTER DHA 子音[dʱ]を表す。 dh
U+0B28 ORIYA LETTER NA 子音[n]を表す。 n
U+0B29 (予約済)
U+0B2A ORIYA LETTER PA 子音[p]を表す。 p
U+0B2B ORIYA LETTER PHA 子音[pʰ]を表す。 ph
U+0B2C ORIYA LETTER BA 子音[b]を表す。 b
U+0B2D ORIYA LETTER BHA 子音[bʱ]を表す。 bh
U+0B2E ORIYA LETTER MA 子音[m]を表す。 m
U+0B2F ORIYA LETTER YA 子音[d͡ʒ]を表す。

元々は[j]を表していた。

y
U+0B30 ORIYA LETTER RA 子音[r]を表す。 r
U+0B31 (予約済) ṟ / r̆[5]
U+0B32 ORIYA LETTER LA 子音[l]を表す。 l
U+0B33 ORIYA LETTER LLA 子音[ɭ]を表す。
U+0B34 (予約済)
U+0B35 ORIYA LETTER VA 子音[w]を表す。但し通常のオリヤー語では/b/と/v/を区別しない。

この文字は字母baから派生した文字で、主にサンスクリット語からの外来語の表記に用いられる。[6]

v
U+0B36 ORIYA LETTER SHA 子音[s]を表す。

元々は後部歯茎音の[ʃ]を表していた。

ś
U+0B37 ORIYA LETTER SSA 子音[s]を表す。

元々は反り舌音の[ʂ]を表していた。

U+0B38 ORIYA LETTER SA 子音[s]を表す。 s
U+0B39 ORIYA LETTER HA 子音[h]を表す。 h
各種記号
U+0B3C ORIYA SIGN NUKTA ヌクター。子音字を拡張して新たな発音を表す際に用いられる。[2]
U+0B3D ORIYA SIGN AVAGRAHA アヴァグラハ。連音サンディ)によって語頭の母音 a が消えたことを表す。
従属母音記号
U+0B3E ORIYA VOWEL SIGN AA 長母音[aː]を表す。 ā
U+0B3F ି ORIYA VOWEL SIGN I 短母音[i]を表す。 i
U+0B40 ORIYA VOWEL SIGN II 長母音[iː]を表す。 ī
U+0B41 ORIYA VOWEL SIGN U 母音[u]を表す。 u
U+0B42 ORIYA VOWEL SIGN UU 長母音[uː]を表す。 ū
U+0B43 ORIYA VOWEL SIGN VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。

現在のオリヤー語では[ru]と発音される。

[3]
U+0B44 ORIYA VOWEL SIGN VOCALIC RR 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。

現在のオリヤー語では[ruː]と発音される。

r̥̄[7]
U+0B45 (予約済) ê
U+0B46 (予約済) ĕ
U+0B47 ORIYA VOWEL SIGN E 長母音[eː]を表す。

文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。[2]

e
U+0B48 ORIYA VOWEL SIGN AI 二重母音[ɔɪ]を表す。

文字の左側と上側の2箇所にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。[2]

ai
U+0B49 (予約済) ô
U+0B4A (予約済)
2要素からなる従属母音記号
U+0B4B ORIYA VOWEL SIGN O 母音[ɔ]を表す。 o
U+0B4C ORIYA VOWEL SIGN AU 二重母音[ɔʊ]を表す。 au
ヴィラーマ
U+0B4D GUJARATI SIGN VIRAMA ヴィラーマ(殺母音記号)。母音/-a/を発音せず子音のみが読まれることを表す。

レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にヴィラーマ記号が子音字の下に書かれることもある。

各種記号
U+0B55 ORIYA SIGN OVERLINE インドで話されるクヴィ語英語版で長母音を表すのに用いられる。[2][8]
U+0B56 ORIYA AI LENGTH MARK
U+0B57 ORIYA AU LENGTH MARK
追加の子音字
U+0B5C ଡ଼ ORIYA LETTER RRA 子音[ɽ]を表す。
U+0B5D ଢ଼ ORIYA LETTER RHA 子音[ɽʱ]を表す。 ṛh
U+0B5E (予約済) f
U+0B5F ORIYA LETTER YYA 子音[j]を表す。
サンスクリット語用の追加母音字
U+0B60 ORIYA LETTER VOCALIC RR 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。

現在のオリヤー語では[ruː]と発音される。

r̥̄[7]
U+0B61 ORIYA LETTER VOCALIC LL 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。

現在のオリヤー語では[luː]と発音される。

l̥̄[9]
従属母音記号
U+0B62 ORIYA VOWEL SIGN VOCALIC L 音節主音化した短母音としてのL(IPA:[l̩])を表す。

現在のオリヤー語では[lu]と発音される。

[4]
U+0B63 ORIYA VOWEL SIGN VOCALIC LL 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。

現在のオリヤー語では[luː]と発音される。

l̥̄[9]
予約済
U+0B64 (予約済) .
U+0B65 (予約済)
数字
U+0B66 ORIYA DIGIT ZERO オリヤー文字における数字の0 0
U+0B67 ORIYA DIGIT ONE オリヤー文字における数字の1 1
U+0B68 ORIYA DIGIT TWO オリヤー文字における数字の2 2
U+0B69 ORIYA DIGIT THREE オリヤー文字における数字の3 3
U+0B6A ORIYA DIGIT FOUR オリヤー文字における数字の4 4
U+0B6B ORIYA DIGIT FIVE オリヤー文字における数字の5 5
U+0B6C ORIYA DIGIT SIX オリヤー文字における数字の6 6
U+0B6D ORIYA DIGIT SEVEN オリヤー文字における数字の7 7
U+0B6E ORIYA DIGIT EIGHT オリヤー文字における数字の8 8
U+0B6F ORIYA DIGIT NINE オリヤー文字における数字の9 9
記号
U+0B70 ORIYA ISSHAR 神の名前を表す。
追加の子音字
U+0B71 ORIYA LETTER WA 子音[w]を表す。

主にペルシャ語アラビア語英語からの借用語に用いられる。[6]

w
翻字用記号
U+0B72 ORIYA FRACTION ONE QUARTER 数値としての4分の1を表す。
U+0B73 ORIYA FRACTION ONE HALF 数値としての2分の1を表す。
U+0B74 ORIYA FRACTION THREE QUARTERS 数値としての4分の3を表す。
U+0B75 ORIYA FRACTION ONE SIXTEENTH 数値としての16分の1を表す。
U+0B76 ORIYA FRACTION ONE EIGHTH 数値としての8分の1を表す。
U+0B77 ORIYA FRACTION THREE SIXTEENTHS 数値としての16分の3を表す。

小分類

編集

このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「2要素からなる従属母音記号」(Two-part dependent vowel signs)、「ヴィラーマ」(Virama)、「追加の子音字」(Additional consonants)、「サンスクリット語用の追加母音字」(Additional vowels for Sanskrit)、「予約済」(Reserved)、「数字」(Digits)、「記号」(Sign)、「分数記号」(Fraction signs)の12個となっている。[2]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

各種記号(Various signs

編集

この小分類にはオリヤー文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字(Independent vowels

編集

この小分類にはオリヤー文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字(Consonants

編集

この小分類にはオリヤー文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。

従属母音記号(Dependent vowel signs

編集

この小分類にはオリヤー文字のうち、子音字に結合する母音記号が収録されている。文字によっては子音字の左側に結合されるため文字の符号上の順序とレンダー上の順序が入れ替わる場合があり、また、組み合わせる先の子音字によっては特殊な合字を形成することがある。

2要素からなる従属母音記号(Two-part dependent vowel signs

編集

これらの母音記号には、子音の両側にグリフ部分があり、論理的な順序で子音に続くため、ほとんどの処理では 1 つの単位として扱われる。[2]

ヴィラーマ(Virama

編集

この小分類にはオリヤー文字のうち、ヴィラーマ(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。但し、文字によっては半子音字形を持たずただ単にヴィラーマが子音字の下に付く場合もある。

追加の子音字(Additional consonants

編集

この小分類にはオリヤー文字のうち、元々のブラーフミー文字にない拡張子音字が収録されている。

ヌクタ付きの2つの子音は、CompositionExclusions.txt にリストされている。つまり、正規化中に再構成されない。NFC 形式は、分解されたシーケンスと同じである。[2]

サンスクリット語用の追加母音字(Additional vowels for Sanskrit

編集

この小分類にはオリヤー文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。

予約済(Reserved

編集

この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点Generic punctuation for scripts of India)」に相当する。

なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。[2]

数字(Digits

編集

この小分類にはオリヤー文字で用いられる固有の数字が収録されている。

記号(Sign

編集

この小分類にはオリヤー文字のうち、神の名を記す際などに用いられる記号1つのみが収録されている。

分数記号(Fraction signs

編集

この小分類にはオリヤー文字において分数を表記するための記号が収録されている。[10]

文字コード

編集
オリヤー文字(Oriya)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0B0x
U+0B1x
U+0B2x
U+0B3x ି
U+0B4x
U+0B5x
U+0B6x
U+0B7x
注釈
1.^バージョン15.1時点


履歴

編集

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
1.0.0 U+0B01..0B03,0B05..0B0C,0B0F..0B10,

0B13..0B28,0B2A..0B30,0B32..0B33, 0B36..0B39,0B3C..0B43,0B47..0B48, 0B4B..0B4D,0B57,0B5C..0B5D,0B5F..0B62, 0B66..0B70

77 (to be determined)
1.1 U+0B56 1 (to be determined)
4.0 U+0B35,0B71 2 L2/02-425 Michael Everson (21 November 2002), On Oriya VA and WA (英語)
5.1 U+0B44,0B62..0B63 3 L2/07-196 Michael Everson (25 May 2007), Proposal to encode four characters for Oriya and Malayalam (WG2 N3272) (英語)
6.0 U+0B72..0B77 6 L2/07-413 Anshuman Pandey (5 December 2007), Proposal to Encode Oriya Fraction Signs (英語)
L2/08-199 Anshuman Pandey (17 June 2008), Proposal to Encode Oriya Fraction Signs (revised) (英語)
13.0 U+0B55 1 L2/19-005 Lorna Evans (21 June 2019), Proposal to encode ORIYA SIGN OVERLINE (revised) (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

編集
  1. ^ 3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
  2. ^ a b c d e f g h i "The Unicode Standard, Version 15.1 - U0B00.pdf" (PDF). The Unicode Standard (英語). 2024年7月27日閲覧
  3. ^ a b IASTではṛと表記される。
  4. ^ a b IASTではḷと表記される。
  5. ^ まつ毛のRの時はr̆となる。
  6. ^ a b Michael Everson (2002年11月21日). “On Oriya VA and WA” (英語). Unicode. 2024年7月27日閲覧。
  7. ^ a b IASTではṝと表記される。
  8. ^ Lorna Evans (2019年6月21日). “Proposal to encode ORIYA SIGN OVERLINE (revised)” (英語). Unicode. 2024年7月27日閲覧。
  9. ^ a b IASTではḹと表記される。
  10. ^ Anshuman Pandey (2008年6月17日). “Proposal to Encode Oriya Fraction Signs (revised)” (英語). Unicode. 2024年7月27日閲覧。

関連項目

編集