テルグ文字 (Unicodeのブロック)

テルグ文字(テルグもじ、英語: Telugu)は、Unicodeの29個目のブロック

テルグ文字 (Unicodeのブロック)
Telugu
範囲 U+0C00..U+0C7F
(128 個の符号位置)
基本多言語面
用字 テルグ文字
主な言語・文字体系
割当済 98 個の符号位置
未使用 30 個の保留
Unicodeのバージョン履歴
1.0.0 78 (+78)
5.1 91 (+13)
7.0 93 (+2)
8.0 94 (+1)
11.0 95 (+1)
12.0 96 (+1)
14.0 98 (+2)
テンプレートを表示

解説

編集

インド南東部のアーンドラ・プラデーシュ州およびテランガーナ州で話されているドラヴィダ語族テルグ語を表記するためのテルグ文字を収録している。

テルグ文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。

また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるハラント(halant)という記号を子音字の上に付加したりする。

書字方向ラテン文字キリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。

子音字は有声音無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。

符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。

加えて、アラビア文字タイ文字などと同様に独自の数字体系(テルグ数字)を有している。

Unicodeのバージョン1.0においても「テルグ文字(Telugu)」というブロック名で制定されていた。[1]

収録文字

編集

ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(及び一部はIAST)に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
各種記号
U+0C00 TELUGU SIGN COMBINING CANDRABINDU ABOVE
U+0C01 TELUGU SIGN CANDRABINDU アヌナーシカ、或いはチャンドラビンドゥ。

文脈上省略された鼻音を示す。[2]

元々は母音字や母音記号に付き、母音を鼻母音で発音することを表していた。

U+0C02 TELUGU SIGN ANUSVARA アヌスヴァーラ、或いはビンドゥ。

直後に音節が後続する子音字に付き、直後の子音と同じ調音点鼻音が挿入されることを表す。日本語における「」に相当する。

プラークリット語のテキストで後続する子音の二重化を示すために使用される。[2]

U+0C03 TELUGU SIGN VISARGA ヴィサルガ

音節末に[h]を伴うことを表す。

U+0C04 TELUGU SIGN COMBINING ANUSVARA ABOVE プラークリット語のテキストで言語上のアヌスヴァーラとして使用される
独立母音字
U+0C05 TELUGU LETTER A 短母音[ʌ]を表す。 a
U+0C06 TELUGU LETTER AA 長母音[ɑː]を表す。 ā
U+0C07 TELUGU LETTER I 短母音[ɪ]を表す。 i
U+0C08 TELUGU LETTER II 長母音[iː]を表す。 ī
U+0C09 TELUGU LETTER U 短母音[ʊ]を表す。 u
U+0C0A TELUGU LETTER UU 長母音[uː]を表す。 ū
U+0C0B TELUGU LETTER VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。

現代のテルグ語では[ru]と発音される。

[3]
U+0C0C TELUGU LETTER VOCALIC L 音節主音化した短母音としてのL(IPA:[l̩])を表す。 [4]
U+0C0D (予約済) ê
U+0C0E TELUGU LETTER E 短母音[e]を表す。 e
U+0C0F TELUGU LETTER EE 長母音[eː]を表す。 ē
U+0C10 TELUGU LETTER AI 二重母音[aɪ]を表す。 ai
U+0C11 (予約済) ô
U+0C12 TELUGU LETTER O 短母音[o]を表す。 o
U+0C13 TELUGU LETTER OO 長母音[oː]を表す。 ō
U+0C14 TELUGU LETTER AU 二重母音[aʊ]を表す。 au
子音字
U+0C15 TELUGU LETTER KA 子音[k]を表す。 k
U+0C16 TELUGU LETTER KHA 子音[kʰ]を表す。 kh
U+0C17 TELUGU LETTER GA 子音[ɡ]を表す。 g
U+0C18 TELUGU LETTER GHA 子音[ɡʱ]を表す。 gh
U+0C19 TELUGU LETTER NGA 子音[ŋ]を表す。
U+0C1A TELUGU LETTER CA 子音[c]を表す。 c
U+0C1B TELUGU LETTER CHA 子音[cʰ]を表す。 ch
U+0C1C TELUGU LETTER JA 子音[ɟ]を表す。 j
U+0C1D TELUGU LETTER JHA 子音[ɟʱ]を表す。 jh
U+0C1E TELUGU LETTER NYA 子音[ɲ]を表す。 ñ
U+0C1F TELUGU LETTER TTA 子音[ʈ]を表す。
U+0C20 TELUGU LETTER TTHA 子音[ʈʰ]を表す。 ṭh
U+0C21 TELUGU LETTER DDA 子音[ɖ]を表す。
U+0C22 TELUGU LETTER DDHA 子音[ɖʱ]を表す。 ḍh
U+0C23 TELUGU LETTER NNA 子音[ɳ]を表す。
U+0C24 TELUGU LETTER TA 子音[t]を表す。 t
U+0C25 TELUGU LETTER THA 子音[tʰ]を表す。 th
U+0C26 TELUGU LETTER DA 子音[d]を表す。 d
U+0C27 TELUGU LETTER DHA 子音[dʱ]を表す。 dh
U+0C28 TELUGU LETTER NA 子音[n]を表す。 n
U+0C29 (予約済)
U+0C2A TELUGU LETTER PA 子音[p]を表す。 p
U+0C2B TELUGU LETTER PHA 子音[pʰ]を表す。 ph
U+0C2C TELUGU LETTER BA 子音[b]を表す。 b
U+0C2D TELUGU LETTER BHA 子音[bʱ]を表す。 bh
U+0C2E TELUGU LETTER MA 子音[m]を表す。 m
U+0C2F TELUGU LETTER YA 子音[j]を表す。 y
U+0C30 TELUGU LETTER RA 子音[r]を表す。 r
U+0C31 TELUGU LETTER RRA 子音[r]を表す。

元々は[ɽ]で発音されていたが、現在のテルグ語では両者の発音が同化しており、現在はあまり使われなくなっている。

U+0C32 TELUGU LETTER LA 子音[l]を表す。 l
U+0C33 TELUGU LETTER LLA 子音[ɭ]を表す。
U+0C34 TELUGU LETTER LLLA 子音[ɻ]を表していた。10世紀ごろまでは使用されていたが、現在は用いられていない。[5]
U+0C35 TELUGU LETTER VA 子音[ʋ]を表す。 v
U+0C36 TELUGU LETTER SHA 子音[ɕ]を表す。 ś
U+0C37 TELUGU LETTER SSA 子音[ɕ]を表す。

元々は反り舌音の[ʂ]を表していた。

U+0C38 TELUGU LETTER SA 子音[s]を表す。 s
U+0C39 TELUGU LETTER HA 子音[h]を表す。 h
各種記号
U+0C3C TELUGU SIGN NUKTA ヌクター。子音字を拡張して新たな発音を表す際に用いられる。

タミル文字や、ペルシャ文字及びアラビア文字の翻字に使用される。[2][6] 大きな点として現れることもあるが、気息マーカーとの混同や衝突を避けるために子音のベースラインより十分下に配置する必要がある。[2]

サンスクリット語用の追加
U+0C3D TELUGU SIGN AVAGRAHA アヴァグラハ。連音サンディ)によって語頭の母音 a が消えたことを表す。
従属母音記号
U+0C3E TELUGU VOWEL SIGN AA 長母音[ɑː]を表す。 ā
U+0C3F ి TELUGU VOWEL SIGN I 短母音[ɪ]を表す。 i
U+0C40 TELUGU VOWEL SIGN II 長母音[iː]を表す。 ī
U+0C41 TELUGU VOWEL SIGN U 短母音[ʊ]を表す。 u
U+0C42 TELUGU VOWEL SIGN UU 長母音[uː]を表す。 ū
U+0C43 TELUGU VOWEL SIGN VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。

現代のテルグ語では[ru]と発音される。

[3]
U+0C44 TELUGU VOWEL SIGN VOCALIC RR 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。

現在のテルグ語では[ruː]と発音される。

r̥̄[7]
U+0C45 (予約済) ê
U+0C46 TELUGU VOWEL SIGN E 短母音[e]を表す。 e
U+0C47 TELUGU VOWEL SIGN EE 長母音[eː]を表す。 ē
U+0C48 TELUGU VOWEL SIGN AI 二重母音[aɪ]を表す。 ai
U+0C49 (予約済) ô
U+0C4A TELUGU VOWEL SIGN O 短母音[o]を表す。 o
U+0C4B TELUGU VOWEL SIGN OO 長母音[oː]を表す。 ō
U+0C4C TELUGU VOWEL SIGN AU 二重母音[aʊ]を表す。 au
ヴィラーマ
U+0C4D TELUGU SIGN VIRAMA ハラント(halant)、或いはヴィラーマ。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。[2]

レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にヴィラーマ記号が子音字の下に書かれることもある。

各種記号
U+0C55 TELUGU LENGTH MARK
U+0C56 TELUGU AI LENGTH MARK
歴史的な音声記号用異体字
U+0C58 TELUGU LETTER TSA 子音[t͡s]を表す。古い文法書や辞書などに見られる。[8] ĉ
U+0C59 TELUGU LETTER DZA 子音[d͡z]を表す。古い文法書や辞書などに見られる。[8] z
U+0C5A TELUGU LETTER RRRA 正確な音声値が不明な歯茎音の子音を表す文字。[2][9] ṯ/ḏ[9]
子音字
U+0C5D TELUGU LETTER NAKAARA POLLU 随伴母音/-a/を伴わない子音[n]を表す。[2]
サンスクリット語用の追加母音字
U+0C60 TELUGU LETTER VOCALIC RR 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。

現在のテルグ語では[ruː]と発音される。

r̥̄[7]
U+0C61 TELUGU LETTER VOCALIC LL 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 l̥̄[10]
従属母音記号
U+0C62 TELUGU VOWEL SIGN VOCALIC L 音節主音化した短母音としてのL(IPA:[l̩])を表す。 [4]
U+0C63 TELUGU VOWEL SIGN VOCALIC LL 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 l̥̄[10]
予約済
U+0C64 (予約済) .
U+0C65 (予約済)
数字
U+0C66 TELUGU DIGIT ZERO テルグ文字における数字の0 0
U+0C67 TELUGU DIGIT ONE テルグ文字における数字の1 1
U+0C68 TELUGU DIGIT TWO テルグ文字における数字の2 2
U+0C69 TELUGU DIGIT THREE テルグ文字における数字の3 3
U+0C6A TELUGU DIGIT FOUR テルグ文字における数字の4 4
U+0C6B TELUGU DIGIT FIVE テルグ文字における数字の5 5
U+0C6C TELUGU DIGIT SIX テルグ文字における数字の6 6
U+0C6D TELUGU DIGIT SEVEN テルグ文字における数字の7 7
U+0C6E TELUGU DIGIT EIGHT テルグ文字における数字の8 8
U+0C6F TELUGU DIGIT NINE テルグ文字における数字の9 9
記号
U+0C77 TELUGU SIGN SIDDHAM テキストの冒頭で祈りの言葉として使用される。[2]
テルグ分数及び重量単位記号
U+0C78 TELUGU FRACTION DIGIT ZERO FOR ODD POWERS OF FOUR 「4の奇数乗分の0」を表す。1/4よりも小さな値を記述する際に用いられる。[8]
U+0C79 TELUGU FRACTION DIGIT ONE FOR ODD POWERS OF FOUR 「4の奇数乗分の1」(1/4, 1/64, 1/1024, ...)を表す。[8]
U+0C7A TELUGU FRACTION DIGIT TWO FOR ODD POWERS OF FOUR 「4の奇数乗分の2」(2/4, 2/64, 2/1024, ...)を表す。[8]
U+0C7B TELUGU FRACTION DIGIT THREE FOR ODD POWERS OF FOUR 「4の奇数乗分の3」(3/4, 3/64, 3/1024, ...)を表す。[8]
U+0C7C TELUGU FRACTION DIGIT ONE FOR EVEN POWERS OF FOUR 「4の偶数乗分の1」(1/16, 1/256, 1/4096 ...)を表す。[8]
U+0C7D TELUGU FRACTION DIGIT TWO FOR EVEN POWERS OF FOUR 「4の偶数乗分の2」(2/16, 2/256, 2/4096 ...)を表す。[8]
U+0C7E TELUGU FRACTION DIGIT THREE FOR EVEN POWERS OF FOUR 「4の偶数乗分の3」(3/16, 3/256, 3/4096 ...)を表す。[8]
U+0C7F ౿ TELUGU SIGN TUUMU tuumuという伝統的な体積或いは重量の単位を表す記号。[8]

小分類

編集

このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「サンスクリット語用の追加」(Addition for Sanskrit)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「歴史的な音声記号用異体字」(Historic phonetic variants)、「予約済」(Reserved)、「数字」(Digits)、「記号」(Sign)、「テルグ分数及び重量単位記号」(Telugu fractions and weights)の11個となっている。[11]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

各種記号(Various signs

編集

この小分類にはテルグ文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字(Independent vowels

編集

この小分類にはテルグ文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字(Consonants

編集

この小分類にはテルグ文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。

サンスクリット語用の追加(Addition for Sanskrit

編集

この小分類にはテルグ文字のうち、サンスクリット語の翻字に用いられる記号1つのみが収録されている。

従属母音記号(Dependent vowel signs

編集

この小分類にはテルグ文字のうち、子音字に結合する母音記号が収録されている。組み合わせる先の子音字によっては特殊な合字を形成することがある。

ヴィラーマ(Virama

編集

この小分類にはテルグ文字のうち、ハラント(halant)(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。但し、文字によっては半子音字形を持たずただ単にハラントが子音字の上に付く場合もある。

なお文字名及び小分類名の「ヴィラーマ(virama)」とはデーヴァナーガリーにおける同様の機能を持つ記号の名称である。

歴史的な音声記号用異体字(Historic phonetic variants

編集

この小分類にはテルグ文字のうち、かつて音声記号として用いられていた拡張子音字が3つ収録されている。

予約済(Reserved

編集

この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点Generic punctuation for scripts of India)」に相当する。

なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。[2]

数字(Digits

編集

この小分類にはテルグ文字で用いられる固有の数字が収録されている。

記号(Sign

編集

この小分類にはテルグ文字のうち、テキストの冒頭で祈りの言葉(invocation)として用いられる記号1つのみが収録されている。

テルグ分数及び重量単位記号(Telugu fractions and weights

編集

この小分類にはテルグ文字において分数や重量の単位を表すための記号が収録されている。

文字コード

編集
テルグ文字(Telugu)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0C0x
U+0C1x
U+0C2x
U+0C3x ి
U+0C4x
U+0C5x
U+0C6x
U+0C7x ౿
注釈
1.^バージョン15.1時点


履歴

編集

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
1.0.0 61 (to be determined)
5.1 U+0C3D,0C58..0C59,0C78..0C7F 11 L2/06-250 Michael Everson; Sure¯s. Kolica¯la; Na¯ga¯rjuna Venna (28 July 2006), Proposal to add eighteen characters for Telugu to the BMP (WG2 N3116) (英語)
L2/06-267 N. Ganesan (1 August 2006), Comments on L2/06-250, Proposal to add eighteen characters for Telugu (英語)
7.0 U+0C00 1 (to be determined)
U+0C34 1 L2/12-015 Shriramana Sharma; Suresh Kolichala; Nagarjuna Venna; Vinodh Rajan (23 January 2012), Proposal to encode 0C34 TELUGU LETTER LLLA (WG2 N4214) (英語)
L2/12-076 Andhra Pradesh (6 February 2012), Govt. of Andhra Pradesh's inputs on document no. L2/12-015 (Telugu LLLA) (英語)
8.0 U+0C5A 1 L2/12-016 Shriramana Sharma; Suresh Kolichala; Nagarjuna Venna; Vinodh Rajan (23 January 2012), Proposal to encode 0C5A TELUGU LETTER RRRA (WG2 N4215) (英語)
L2/13-121 Suresh Kolichala (9 May 2013), Letter from Andhra Pradesh re Telugu RRRA (英語)
11.0 U+0C04 1 L2/16-285 Srinidhi A; Sridatta A (20 October 2016), Proposal to encode the TELUGU SIGN COMBINING ANUSVARA ABOVE (英語)
12.0 U+0C77 1 L2/17-218 Srinidhi A; Sridatta A (11 August 2017), Proposal to encode the TELUGU SIGN SIDDHAM (revised) (英語)
14.0 U+0C3C 1 L2/19-401 Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (17 December 2019), Proposal to Encode Telugu Sign Nukta (英語)
L2/19-405 Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (29 December 2019), Additional evidence for the use of Nukta sign in Telugu (英語)
L2/20-085 Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (18 March 2020), Revised Proposal to Encode Telugu Sign Nukta (英語)
U+0C5D 1 L2/11-409 Shriramana Sharma; Suresh Kolichala; Nagarjuna Venna; Vinodh Rajan (27 October 2011), On the Telugu nakaara-pollu (英語)
L2/20-084 Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (18 March 2020), Revised Proposal to Encode Telugu Letter Nakaara Pollu (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

編集
  1. ^ 3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
  2. ^ a b c d e f g h i "The Unicode Standard, Version 15.1 - U0C00.pdf" (PDF). The Unicode Standard (英語). 2024年7月29日閲覧
  3. ^ a b IASTではṛと表記される。
  4. ^ a b IASTではḷと表記される。
  5. ^ Shriramana Sharma; Suresh Kolichala, Nagarjuna Venna, Vinodh Rajan (2012年1月23日). “Proposal to encode 0C34 TELUGU LETTER LLLA (WG2 N4214)” (英語). Unicode. 2024年7月29日閲覧。
  6. ^ Vinodh Rajan; Shriramana Sharma, Suresh Kolichala (2020年3月18日). “Revised Proposal to Encode Telugu Sign Nukta” (英語). Unicode. 2024年7月29日閲覧。
  7. ^ a b IASTではṝと表記される。
  8. ^ a b c d e f g h i j Michael Everson; Sure¯s. Kolica¯la, and Na¯ga¯rjuna Venna (2006年7月28日). “Proposal to add eighteen characters for Telugu to the BMP (WG2 N3116)” (英語). Unicode. 2024年7月29日閲覧。
  9. ^ a b Shriramana Sharma; Suresh Kolichala, Nagarjuna Venna, Vinodh Rajan (2012年1月23日). “Proposal to encode 0C5A TELUGU LETTER RRRA (WG2 N4215)” (英語). Unicode. 2024年7月29日閲覧。
  10. ^ a b IASTではḹと表記される。
  11. ^ "The Unicode Standard, Version 15.1 - U0B80.pdf" (PDF). The Unicode Standard (英語). 2024年7月28日閲覧

関連項目

編集