グジャラート文字 (Unicodeのブロック)

グジャラート文字 (Unicodeのブロック)
	Gujarati
範囲	U+0A80..U+0AFF; (128 個の符号位置)
面	基本多言語面
用字	グジャラート文字
主な言語・文字体系	グジャラート語; サンスクリット語;
割当済	91 個の符号位置
未使用	37 個の保留
Unicodeのバージョン履歴
1.0.0	75 (+75)
1.1	78 (+3)
4.0	83 (+5)
6.1	84 (+1)
8.0	85 (+1)
10.0	91 (+6)
	テンプレートを表示

グジャラート文字（グジャラートもじ、英語: Gujarati）は、Unicodeの26個目のブロック。

解説

インド西部のグジャラート州などで話されているグジャラート語を表記するグジャラート文字を収録している。

グジャラート文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字（インド系文字）の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられることがあるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。

また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字（英語: half-form）と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるヴィラーマという記号を子音字の下に付加したりする。例えば子音字kaકの後にヴィラーマと子音字ssaષが後続するとkssaક્ષという合字が形成される。

書字方向はラテン文字やキリル文字などと同様に左から右へと横書き（左横書き）し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線（シローレーカー）は持たない。

子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられているが、現在のグジャラート語では発音上は区別されないものもある。

符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。

加えて、アラビア文字やタイ文字などと同様に独自の数字体系（グジャラート数字）を有している。

Unicodeのバージョン1.0においても「グジャラート文字(Gujarati)」というブロック名で制定されていた。^[1]

収録文字

「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919に従う。

コード	文字	文字名（英語）	用例・説明	ラテン文字転写
各種記号
U+0A81	ઁ	GUJARATI SIGN CANDRABINDU	チャンドラビンドゥ。母音字や母音記号に付き、母音を鼻母音で発音することを表す。	m̐
U+0A82	ં	GUJARATI SIGN ANUSVARA	アヌスヴァーラ。直後に音節が後続する子音字に付き、直後の子音と同じ調音点の鼻音が挿入されることを表す。日本語における「ん」に相当する。	ṁ
U+0A83	ઃ	GUJARATI SIGN VISARGA	ヴィサルガ。音節末に[h]を伴うことを表す。	ḥ
独立母音字
U+0A85	અ	GUJARATI LETTER A	母音[ə]を表す。	a
U+0A86	આ	GUJARATI LETTER AA	母音[ɑ]を表す。元は長母音のāを表していた。	ā
U+0A87	ઇ	GUJARATI LETTER I	母音[i]を表す。	i
U+0A88	ઈ	GUJARATI LETTER II	母音[i]を表す。元は長母音のīを表していた。	ī
U+0A89	ઉ	GUJARATI LETTER U	母音[u]を表す。	u
U+0A8A	ઊ	GUJARATI LETTER UU	母音[u]を表す。元は長母音のūを表していた。	ū
U+0A8B	ઋ	GUJARATI LETTER VOCALIC R	音節主音化した短母音としてのR（IPA:[ɹ̩]）を表す。現在のグジャラート語では[ru]と発音される。	r̥^[2]
U+0A8C	ઌ	GUJARATI LETTER VOCALIC L	音節主音化した短母音としてのL（IPA:[l̩]）を表す。サンスクリット語の表記に用いられる。^[3]	l̥^[4]
U+0A8D	ઍ	GUJARATI VOWEL CANDRA E	母音[ɛ]を表す。	ê
U+0A8E	(予約済)			ĕ
U+0A8F	એ	GUJARATI LETTER E	母音[e]を表す。	e
U+0A90	ઐ	GUJARATI LETTER AI	二重母音[əɪ]を表す。	ai
U+0A91	ઑ	GUJARATI VOWEL CANDRA O	母音[ɔ]を表す。	ô
U+0A92	(予約済)			ŏ
U+0A93	ઓ	GUJARATI LETTER O	母音[o]を表す。	o
U+0A94	ઔ	GUJARATI LETTER AU	二重母音[əʊ]を表す。	au
子音字
U+0A95	ક	GUJARATI LETTER KA	子音[k]を表す。	k
U+0A96	ખ	GUJARATI LETTER KHA	子音[kʰ]を表す。	kh
U+0A97	ગ	GUJARATI LETTER GA	子音[ɡ]を表す。	g
U+0A98	ઘ	GUJARATI LETTER GHA	子音[ɡʱ]を表す。	gh
U+0A99	ઙ	GUJARATI LETTER NGA	子音[ŋ]を表す。	ṅ
U+0A9A	ચ	GUJARATI LETTER CA	子音[c]を表す。	c
U+0A9B	છ	GUJARATI LETTER CHA	子音[cʰ]を表す。	ch
U+0A9C	જ	GUJARATI LETTER JA	子音[ɟ]を表す。	j
U+0A9D	ઝ	GUJARATI LETTER JHA	子音[ɟʱ]を表す。	jh
U+0A9E	ઞ	GUJARATI LETTER NYA	子音[ɲ]を表す。	ñ
U+0A9F	ટ	GUJARATI LETTER TTA	子音[ʈ]を表す。	ṭ
U+0AA0	ઠ	GUJARATI LETTER TTHA	子音[ʈʰ]を表す。	ṭh
U+0AA1	ડ	GUJARATI LETTER DDA	子音[ɖ]を表す。	ḍ
U+0AA2	ઢ	GUJARATI LETTER DDHA	子音[ɖʱ]を表す。	ḍh
U+0AA3	ણ	GUJARATI LETTER NNA	子音[ɳ]を表す。	ṇ
U+0AA4	ત	GUJARATI LETTER TA	子音[t]を表す。	t
U+0AA5	થ	GUJARATI LETTER THA	子音[tʰ]を表す。	th
U+0AA6	દ	GUJARATI LETTER DA	子音[d]を表す。	d
U+0AA7	ધ	GUJARATI LETTER DHA	子音[dʱ]を表す。	dh
U+0AA8	ન	GUJARATI LETTER NA	子音[n]を表す。	n
U+0AA9	(予約済)			ṉ
U+0AAA	પ	GUJARATI LETTER PA	子音[p]を表す。	p
U+0AAB	ફ	GUJARATI LETTER PHA	子音[pʰ]を表す。	ph
U+0AAC	બ	GUJARATI LETTER BA	子音[b]を表す。	b
U+0AAD	ભ	GUJARATI LETTER BHA	子音[bʱ]を表す。	bh
U+0AAE	મ	GUJARATI LETTER MA	子音[m]を表す。	m
U+0AAF	ય	GUJARATI LETTER YA	子音[j]を表す。	y
U+0AB0	ર	GUJARATI LETTER RA	子音[ɾ]を表す。	r
U+0AB1	(予約済)			ṟ / r̆^[5]
U+0AB2	લ	GUJARATI LETTER LA	子音[l]を表す。	l
U+0AB3	ળ	GUJARATI LETTER LLA	子音[ɭ]を表す。	ḷ
U+0AB4	(予約済)			ḻ
U+0AB5	વ	GUJARATI LETTER VA	子音[ʋ]を表す。	v
U+0AB6	શ	GUJARATI LETTER SHA	子音[ʃ]を表す。	ś
U+0AB7	ષ	GUJARATI LETTER SSA	子音[ʃ]を表す。元々は反り舌音の[ʂ]を表していた。	ṣ
U+0AB8	સ	GUJARATI LETTER SA	子音[s]を表す。	s
U+0AB9	હ	GUJARATI LETTER HA	子音[h]を表す。	h
各種記号
U+0ABC	઼	GUJARATI SIGN NUKTA	ヌクター。子音字を拡張して新たな発音を表す際に用いられる。^[3]
U+0ABD	ઽ	GUJARATI SIGN AVAGRAHA	アヴァグラハ。連音（サンディ）によって語頭の母音 a が消えたことを表す。	’
従属母音記号
U+0ABE	ા	GUJARATI VOWEL SIGN AA	母音[ɑ]を表す。元は長母音のāを表していた。	ā
U+0ABF	િ	GUJARATI VOWEL SIGN I	母音[i]を表す。文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。^[3]	i
U+0AC0	ી	GUJARATI VOWEL SIGN II	母音[i]を表す。元は長母音のīを表していた。	ī
U+0AC1	ુ	GUJARATI VOWEL SIGN U	母音[u]を表す。	u
U+0AC2	ૂ	GUJARATI VOWEL SIGN UU	母音[u]を表す。元は長母音のūを表していた。	ū
U+0AC3	ૃ	GUJARATI VOWEL SIGN VOCALIC R	音節主音化した短母音としてのR（IPA:[ɹ̩]）を表す。現在のグジャラート語では[ru]と発音される。	r̥^[2]
U+0AC4	ૄ	GUJARATI VOWEL SIGN VOCALIC RR	音節主音化した長母音としてのR（IPA:[ɹ̩ː]）を表す。現在のグジャラート語では[ru]と発音される。	r̥̄^[6]
U+0AC5	ૅ	GUJARATI VOWEL SIGN CANDRA E	母音[ɛ]を表す。	ê
U+0AC6	(予約済)			ĕ
U+0AC7	ે	GUJARATI VOWEL SIGN E	母音[e]を表す。	e
U+0AC8	ૈ	GUJARATI VOWEL SIGN AI	二重母音[əɪ]を表す。	ai
U+0AC9	ૉ	GUJARATI VOWEL SIGN CANDRA O	母音[ɔ]を表す。	ô
U+0ACA	(予約済)
U+0ACB	ો	GUJARATI VOWEL SIGN O	母音[o]を表す。	o
U+0ACC	ૌ	GUJARATI VOWEL SIGN AU	二重母音[əʊ]を表す。	au
ヴィラーマ
U+0ACD	્	GUJARATI SIGN VIRAMA	ヴィラーマ（殺母音記号）。母音/-a/を発音せず子音のみが読まれることを表す。^[3] レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にヴィラーマ記号が子音字の下に書かれることもある。
各種記号
U+0AD0	ૐ	GUJARATI OM	ヒンドゥー教などにおける聖音のオームを表す記号。
サンスクリット語用の追加母音字
U+09E0	ૠ	GUJARATI LETTER VOCALIC RR	音節主音化した長母音としてのR（IPA:[ɹ̩ː]）を表す。	r̥̄^[6]
U+09E1	ૡ	GUJARATI LETTER VOCALIC LL	音節主音化した長母音としてのL（IPA:[l̩ː]）を表す。	l̥̄^[7]
U+09E2	ॢ	GUJARATI VOWEL SIGN VOCALIC L	音節主音化した短母音としてのL（IPA:[l̩]）を表す。	l̥^[4]
U+09E3	ॣ	GUJARATI VOWEL SIGN VOCALIC LL	音節主音化した長母音としてのL（IPA:[l̩ː]）を表す。	l̥̄^[7]
予約済
U+0AE4	(予約済)			.
U+0AE5	(予約済)
数字
U+0AE6	૦	GUJARATI DIGIT ZERO	グジャラート文字における数字の0。	0
U+0AE7	૧	GUJARATI DIGIT ONE	グジャラート文字における数字の1。	1
U+0AE8	૨	GUJARATI DIGIT TWO	グジャラート文字における数字の2。	2
U+0AE9	૩	GUJARATI DIGIT THREE	グジャラート文字における数字の3。	3
U+0AEA	૪	GUJARATI DIGIT FOUR	グジャラート文字における数字の4。	4
U+0AEB	૫	GUJARATI DIGIT FIVE	グジャラート文字における数字の5。	5
U+0AEC	૬	GUJARATI DIGIT SIX	グジャラート文字における数字の6。	6
U+0AED	૭	GUJARATI DIGIT SEVEN	グジャラート文字における数字の7。	7
U+0AEE	૮	GUJARATI DIGIT EIGHT	グジャラート文字における数字の8。	8
U+0AEF	૯	GUJARATI DIGIT NINE	グジャラート文字における数字の9。	9
省略記号
U+0AF0	૰	GUJARATI ABBREVIATION SIGN	グジャラート文字における略語記号。ラテン文字などにおける省略のピリオド(.)に相当する。^[8]	.
通貨記号
U+0AF1	૱	GUJARATI RUPEE SIGN	インド・ルピーのグジャラート文字における通貨記号。現在は文字シーケンス0AB0 ર 0AC2 ૂ 0AF0 ૰ (રૂ૰)で表現することが推奨されている。^[3]U+0AF0が収録される以前の版から存在していた文字のため分解された表現とは別に符号位置が割り当てられている。^[9]
追加の子音字
U+0AF9	ૹ	GUJARATI LETTER ZHA	アヴェスター語（アヴェスター文字）の翻字に用いられる。^[3] U+10B32 𐬲 AVESTAN LETTER ZHEに対応し、子音[ʒ]を表す。^[10]	ž
翻字用記号
U+0AFA	ૺ	GUJARATI SIGN SUKUN	イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。^[3] U+0652 ْ ARABIC SUKUNに対応し、無母音の子音を表す。機能としてはヴィラーマ(U+0ACD ્)と同じだが、母音字にも付くことができ、その場合クルアーンの朗唱において休止することを表す。^[11]
U+0AFB	ૻ	GUJARATI SIGN SHADDA	イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。^[3] U+0651 ّ ARABIC SHADDAに対応し、子音を重子音として読むことを表す。^[11]
U+0AFC	ૼ	GUJARATI SIGN MADDAH	イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。^[3] U+0653 ٓ ARABIC MADDAH ABOVEに対応し、母音を長母音として読むことを表す。^[11]
U+0AFD	૽	GUJARATI SIGN THREE-DOT NUKTA ABOVE	イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。^[3] アラビア語のいくつかの子音の表現用にグジャラート文字の子音を拡張するために用いられる。例えば字母a(અ)やi(ઇ)に付くとアラビア文字ain ع [ʕ]を、字母ka(ક)に付くとアラビア文字qaf ق [q]を、字母kha(ખ)に付くとアラビア文字khah خ [x]を表す。^[11]
U+0AFE	૾	GUJARATI SIGN CIRCLE NUKTA ABOVE	イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。^[3] 字母sa(સ)に付いてアラビア文字theh ث [θ]の、字母jha(ઝ)に付いてアラビア文字thal ذ [ð]の音訳を表す。^[11]
U+0AFF	૿	GUJARATI SIGN TWO-CIRCLE NUKTA ABOVE	イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。^[3] 字母jha(ઝ)に付いてアラビア文字zah (U+0638 ظ) [ðˤ]の音訳を表す。^[11]

小分類

このブロックの小分類は「各種記号」（Various signs）、「独立母音字」（Independent vowels）、「子音字」（Consonants）、「従属母音記号」（Dependent vowel signs）、「ヴィラーマ」（Virama）、「サンスクリット語用の追加母音字」（Additional vowels for Sanskrit）、「予約済」（Reserved）、「数字」（Digits）、「省略記号」（Abbreviation sign）、「通貨記号」（Currency symbol）、「追加の子音字」（Additional consonant）、「翻字用記号」（Transliteration signs）の12個となっている。^[3]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

各種記号（Various signs）

この小分類にはグジャラート文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字（Independent vowels）

この小分類にはグジャラート文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字（Consonants）

この小分類にはグジャラート文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。

従属母音記号（Dependent vowel signs）

この小分類にはグジャラート文字のうち、子音字に結合する母音記号が収録されている。文字によっては子音字の左側に結合されるため文字の符号上の順序とレンダー上の順序が入れ替わる場合があり、また、組み合わせる先の子音字によっては特殊な合字を形成することがある。

ヴィラーマ（Virama）

この小分類にはグジャラート文字のうち、ヴィラーマ（殺母音記号）と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号１つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。但し、文字によっては半子音字形を持たずただ単にヴィラーマが子音字の下に付く場合もある。

サンスクリット語用の追加母音字（Additional vowels for Sanskrit）

この小分類にはグジャラート文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。

予約済（Reserved）

この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点（Generic punctuation for scripts of India）」に相当する。

なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。^[3]

数字（Digits）

この小分類にはグジャラート文字で用いられる固有の数字が収録されている。

省略記号（Abbreviation sign）

この小分類にはグジャラート文字のうち、略語に用いられる省略記号１つのみが収録されている。

通貨記号（Currency symbol）

この小分類にはグジャラート文字のうち、インド・ルピーの通貨記号１つのみが収録されている。

追加の子音字（Additional consonant）

この小分類にはグジャラート文字のうち、アヴェスター語（アヴェスター文字）の翻字に用いられる子音字1文字のみが収録されている。

翻字用記号（Transliteration signs）

この小分類にはイスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される記号^[3]が収録されている。

文字コード

グジャラート文字(Gujarati)^[1] Official Unicode Consortium code chart (PDF)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0A8x		ઁ	ં	ઃ		અ	આ	ઇ	ઈ	ઉ	ઊ	ઋ	ઌ	ઍ		એ
U+0A9x	ઐ	ઑ		ઓ	ઔ	ક	ખ	ગ	ઘ	ઙ	ચ	છ	જ	ઝ	ઞ	ટ
U+0AAx	ઠ	ડ	ઢ	ણ	ત	થ	દ	ધ	ન		પ	ફ	બ	ભ	મ	ય
U+0ABx	ર		લ	ળ		વ	શ	ષ	સ	હ			઼	ઽ	ા	િ
U+0ACx	ી	ુ	ૂ	ૃ	ૄ	ૅ		ે	ૈ	ૉ		ો	ૌ	્
U+0ADx	ૐ
U+0AEx	ૠ	ૡ	ૢ	ૣ			૦	૧	૨	૩	૪	૫	૬	૭	૮	૯
U+0AFx	૰	૱								ૹ	ૺ	ૻ	ૼ	૽	૾	૿
注釈 1.^バージョン15.1時点

履歴

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン	コードポイント^[a]	文字数	L2 ID	ドキュメント
1.0.0	U+0A81..0A83,0A85..0A8B,0A8F..0A90,0A93..0AA8, 0AAA..0AB0,0AB2..0AB3,0AB5..0AB9,0ABC..0AC5, 0AC7..0AC8,0ACB..0ACD,0AD0,0AE0,0AE6..0AEF	75		(to be determined)
1.1	U+0A8D,0A91,0AC9	3		(to be determined)
4.0	U+0A8C,0AE1..0AE3,0AF1	5		(to be determined)
6.1	U+0AF0	1	L2/09-330	Anshuman Pandey (2 October 2009), Proposal to Encode An Abbreviation Sign for Gujarati (英語)
6.1	U+0AF0	1	L2/09-331	Anshuman Pandey (8 October 2009), Proposal to Deprecate GUJARATI RUPEE SIGN (英語)
8.0	U+0AF9	1	L2/13-066	Vinodh Rajan (23 April 2013), Proposal to encode Gujarati Sign Triple Nukta (英語)
8.0	U+0AF9	1	L2/13-143	Vinodh Rajan (18 July 2013), Proposal to encode Gujarati Letter ZHA (英語)
10.0	U+0AFA..0AFF	6	L2/14-131	Anshuman Pandey (5 May 2014), Proposal to Encode Gujarati Signs for the Transliteration of Arabic (WG2 N4574) (英語)
10.0	U+0AFA..0AFF	6	L2/15-103	SEI; Anshuman Pandey (2 April 2015), Revised Proposal to Encode Gujarati Signs for the Transliteration of Arabic (replaces L2/14-131) (英語)
(提案中)PAO SIGN		1	L2/04-358	Manoj Jain (Govt India) (5 October 2004), Encoding of Gujarati Signs Pao, Addho & Pono in Gujarati code block (英語)
(提案中)PAO SIGN		1	L2/04-402	Eric Muller (14 November 2004), Clarifications on L2/04-358, Gujarati fractions (英語)
^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

^ “3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
^ ^a ^b IASTではṛと表記される。
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k ^l ^m ⁿ ^o "The Unicode Standard, Version 15.1 - U0A80.pdf" (PDF). The Unicode Standard (英語). 2024年7月15日閲覧。
^ ^a ^b IASTではḷと表記される。
^ まつ毛のRの時はr̆となる。
^ ^a ^b IASTではṝと表記される。
^ ^a ^b IASTではḹと表記される。
^ Anshuman Pandey (2009年10月2日). “Proposal to Encode An Abbreviation Sign for Gujarati” (英語). Unicode. 2024年7月15日閲覧。
^ Anshuman Pandey (2009年10月8日). “Proposal to Deprecate GUJARATI RUPEE SIGN” (英語). Unicode. 2024年7月15日閲覧。
^ Vinodh Rajan (2013年7月18日). “Proposal to encode Gujarati Letter ZHA” (英語). Unicode. 2024年7月15日閲覧。
^ ^a ^b ^c ^d ^e ^f SEI; Anshuman Pandey (2015年4月2日). “Revised Proposal to Encode Gujarati Signs for the Transliteration of Arabic (replaces L2/14-131)” (英語). Unicode. 2024年7月15日閲覧。