テルグ文字 (Unicodeのブロック)

テルグ文字 (Unicodeのブロック)
	Telugu
範囲	U+0C00..U+0C7F; (128 個の符号位置)
面	基本多言語面
用字	テルグ文字
主な言語・文字体系	テルグ語; サンスクリット語; プラークリット語;
割当済	98 個の符号位置
未使用	30 個の保留
Unicodeのバージョン履歴
1.0.0	78 (+78)
5.1	91 (+13)
7.0	93 (+2)
8.0	94 (+1)
11.0	95 (+1)
12.0	96 (+1)
14.0	98 (+2)
	テンプレートを表示

テルグ文字（テルグもじ、英語: Telugu）は、Unicodeの29個目のブロック。

解説

インド南東部のアーンドラ・プラデーシュ州およびテランガーナ州で話されているドラヴィダ語族のテルグ語を表記するためのテルグ文字を収録している。

テルグ文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字（インド系文字）の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。

また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字（英語: half-form）と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるハラント(halant)という記号を子音字の上に付加したりする。

書字方向はラテン文字やキリル文字などと同様に左から右へと横書き（左横書き）し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線（シローレーカー）は持たない。

子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。

符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。

加えて、アラビア文字やタイ文字などと同様に独自の数字体系（テルグ数字）を有している。

Unicodeのバージョン1.0においても「テルグ文字(Telugu)」というブロック名で制定されていた。^[1]

収録文字

「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919（及び一部はIAST）に従う。

コード	文字	文字名（英語）	用例・説明	ラテン文字転写
各種記号
U+0C00	ఀ	TELUGU SIGN COMBINING CANDRABINDU ABOVE
U+0C01	ఁ	TELUGU SIGN CANDRABINDU	アヌナーシカ、或いはチャンドラビンドゥ。文脈上省略された鼻音を示す。^[2] 元々は母音字や母音記号に付き、母音を鼻母音で発音することを表していた。	n̆
U+0C02	ం	TELUGU SIGN ANUSVARA	アヌスヴァーラ、或いはビンドゥ。直後に音節が後続する子音字に付き、直後の子音と同じ調音点の鼻音が挿入されることを表す。日本語における「ん」に相当する。プラークリット語のテキストで後続する子音の二重化を示すために使用される。^[2]	ṁ
U+0C03	ః	TELUGU SIGN VISARGA	ヴィサルガ。音節末に[h]を伴うことを表す。	ḥ
U+0C04	ఄ	TELUGU SIGN COMBINING ANUSVARA ABOVE	プラークリット語のテキストで言語上のアヌスヴァーラとして使用される
独立母音字
U+0C05	అ	TELUGU LETTER A	短母音[ʌ]を表す。	a
U+0C06	ఆ	TELUGU LETTER AA	長母音[ɑː]を表す。	ā
U+0C07	ఇ	TELUGU LETTER I	短母音[ɪ]を表す。	i
U+0C08	ఈ	TELUGU LETTER II	長母音[iː]を表す。	ī
U+0C09	ఉ	TELUGU LETTER U	短母音[ʊ]を表す。	u
U+0C0A	ఊ	TELUGU LETTER UU	長母音[uː]を表す。	ū
U+0C0B	ఋ	TELUGU LETTER VOCALIC R	音節主音化した短母音としてのR（IPA:[ɹ̩]）を表す。現代のテルグ語では[ru]と発音される。	r̥^[3]
U+0C0C	ఌ	TELUGU LETTER VOCALIC L	音節主音化した短母音としてのL（IPA:[l̩]）を表す。	l̥^[4]
U+0C0D	(予約済)			ê
U+0C0E	ఎ	TELUGU LETTER E	短母音[e]を表す。	e
U+0C0F	ఏ	TELUGU LETTER EE	長母音[eː]を表す。	ē
U+0C10	ఐ	TELUGU LETTER AI	二重母音[aɪ]を表す。	ai
U+0C11	(予約済)			ô
U+0C12	ఒ	TELUGU LETTER O	短母音[o]を表す。	o
U+0C13	ఓ	TELUGU LETTER OO	長母音[oː]を表す。	ō
U+0C14	ఔ	TELUGU LETTER AU	二重母音[aʊ]を表す。	au
子音字
U+0C15	క	TELUGU LETTER KA	子音[k]を表す。	k
U+0C16	ఖ	TELUGU LETTER KHA	子音[kʰ]を表す。	kh
U+0C17	గ	TELUGU LETTER GA	子音[ɡ]を表す。	g
U+0C18	ఘ	TELUGU LETTER GHA	子音[ɡʱ]を表す。	gh
U+0C19	ఙ	TELUGU LETTER NGA	子音[ŋ]を表す。	ṅ
U+0C1A	చ	TELUGU LETTER CA	子音[c]を表す。	c
U+0C1B	ఛ	TELUGU LETTER CHA	子音[cʰ]を表す。	ch
U+0C1C	జ	TELUGU LETTER JA	子音[ɟ]を表す。	j
U+0C1D	ఝ	TELUGU LETTER JHA	子音[ɟʱ]を表す。	jh
U+0C1E	ఞ	TELUGU LETTER NYA	子音[ɲ]を表す。	ñ
U+0C1F	ట	TELUGU LETTER TTA	子音[ʈ]を表す。	ṭ
U+0C20	ఠ	TELUGU LETTER TTHA	子音[ʈʰ]を表す。	ṭh
U+0C21	డ	TELUGU LETTER DDA	子音[ɖ]を表す。	ḍ
U+0C22	ఢ	TELUGU LETTER DDHA	子音[ɖʱ]を表す。	ḍh
U+0C23	ణ	TELUGU LETTER NNA	子音[ɳ]を表す。	ṇ
U+0C24	త	TELUGU LETTER TA	子音[t]を表す。	t
U+0C25	థ	TELUGU LETTER THA	子音[tʰ]を表す。	th
U+0C26	ద	TELUGU LETTER DA	子音[d]を表す。	d
U+0C27	ధ	TELUGU LETTER DHA	子音[dʱ]を表す。	dh
U+0C28	న	TELUGU LETTER NA	子音[n]を表す。	n
U+0C29	(予約済)			ṉ
U+0C2A	ప	TELUGU LETTER PA	子音[p]を表す。	p
U+0C2B	ఫ	TELUGU LETTER PHA	子音[pʰ]を表す。	ph
U+0C2C	బ	TELUGU LETTER BA	子音[b]を表す。	b
U+0C2D	భ	TELUGU LETTER BHA	子音[bʱ]を表す。	bh
U+0C2E	మ	TELUGU LETTER MA	子音[m]を表す。	m
U+0C2F	య	TELUGU LETTER YA	子音[j]を表す。	y
U+0C30	ర	TELUGU LETTER RA	子音[r]を表す。	r
U+0C31	ఱ	TELUGU LETTER RRA	子音[r]を表す。元々は[ɽ]で発音されていたが、現在のテルグ語では両者の発音が同化しており、現在はあまり使われなくなっている。	ṟ
U+0C32	ల	TELUGU LETTER LA	子音[l]を表す。	l
U+0C33	ళ	TELUGU LETTER LLA	子音[ɭ]を表す。	ḷ
U+0C34	ఴ	TELUGU LETTER LLLA	子音[ɻ]を表していた。10世紀ごろまでは使用されていたが、現在は用いられていない。^[5]	ḻ
U+0C35	వ	TELUGU LETTER VA	子音[ʋ]を表す。	v
U+0C36	శ	TELUGU LETTER SHA	子音[ɕ]を表す。	ś
U+0C37	ష	TELUGU LETTER SSA	子音[ɕ]を表す。元々は反り舌音の[ʂ]を表していた。	ṣ
U+0C38	స	TELUGU LETTER SA	子音[s]を表す。	s
U+0C39	హ	TELUGU LETTER HA	子音[h]を表す。	h
各種記号
U+0C3C	఼	TELUGU SIGN NUKTA	ヌクター。子音字を拡張して新たな発音を表す際に用いられる。タミル文字や、ペルシャ文字及びアラビア文字の翻字に使用される。^[2]^[6] 大きな点として現れることもあるが、気息マーカーとの混同や衝突を避けるために子音のベースラインより十分下に配置する必要がある。^[2]
サンスクリット語用の追加
U+0C3D	ఽ	TELUGU SIGN AVAGRAHA	アヴァグラハ。連音（サンディ）によって語頭の母音 a が消えたことを表す。	’
従属母音記号
U+0C3E	ా	TELUGU VOWEL SIGN AA	長母音[ɑː]を表す。	ā
U+0C3F	ి	TELUGU VOWEL SIGN I	短母音[ɪ]を表す。	i
U+0C40	ీ	TELUGU VOWEL SIGN II	長母音[iː]を表す。	ī
U+0C41	ు	TELUGU VOWEL SIGN U	短母音[ʊ]を表す。	u
U+0C42	ూ	TELUGU VOWEL SIGN UU	長母音[uː]を表す。	ū
U+0C43	ృ	TELUGU VOWEL SIGN VOCALIC R	音節主音化した短母音としてのR（IPA:[ɹ̩]）を表す。現代のテルグ語では[ru]と発音される。	r̥^[3]
U+0C44	ౄ	TELUGU VOWEL SIGN VOCALIC RR	音節主音化した長母音としてのR（IPA:[ɹ̩ː]）を表す。現在のテルグ語では[ruː]と発音される。	r̥̄^[7]
U+0C45	(予約済)			ê
U+0C46	ె	TELUGU VOWEL SIGN E	短母音[e]を表す。	e
U+0C47	ే	TELUGU VOWEL SIGN EE	長母音[eː]を表す。	ē
U+0C48	ై	TELUGU VOWEL SIGN AI	二重母音[aɪ]を表す。	ai
U+0C49	(予約済)			ô
U+0C4A	ొ	TELUGU VOWEL SIGN O	短母音[o]を表す。	o
U+0C4B	ో	TELUGU VOWEL SIGN OO	長母音[oː]を表す。	ō
U+0C4C	ౌ	TELUGU VOWEL SIGN AU	二重母音[aʊ]を表す。	au
ヴィラーマ
U+0C4D	్	TELUGU SIGN VIRAMA	ハラント(halant)、或いはヴィラーマ。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。^[2] レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にヴィラーマ記号が子音字の下に書かれることもある。
各種記号
U+0C55	ౕ	TELUGU LENGTH MARK
U+0C56	ౖ	TELUGU AI LENGTH MARK
歴史的な音声記号用異体字
U+0C58	ౘ	TELUGU LETTER TSA	子音[t͡s]を表す。古い文法書や辞書などに見られる。^[8]	ĉ
U+0C59	ౙ	TELUGU LETTER DZA	子音[d͡z]を表す。古い文法書や辞書などに見られる。^[8]	z
U+0C5A	ౚ	TELUGU LETTER RRRA	正確な音声値が不明な歯茎音の子音を表す文字。^[2]^[9]	ṯ/ḏ^[9]
子音字
U+0C5D	ౝ	TELUGU LETTER NAKAARA POLLU	随伴母音/-a/を伴わない子音[n]を表す。^[2]
サンスクリット語用の追加母音字
U+0C60	ౠ	TELUGU LETTER VOCALIC RR	音節主音化した長母音としてのR（IPA:[ɹ̩ː]）を表す。現在のテルグ語では[ruː]と発音される。	r̥̄^[7]
U+0C61	ౡ	TELUGU LETTER VOCALIC LL	音節主音化した長母音としてのL（IPA:[l̩ː]）を表す。	l̥̄^[10]
従属母音記号
U+0C62	ౢ	TELUGU VOWEL SIGN VOCALIC L	音節主音化した短母音としてのL（IPA:[l̩]）を表す。	l̥^[4]
U+0C63	ౣ	TELUGU VOWEL SIGN VOCALIC LL	音節主音化した長母音としてのL（IPA:[l̩ː]）を表す。	l̥̄^[10]
予約済
U+0C64	(予約済)			.
U+0C65	(予約済)
数字
U+0C66	౦	TELUGU DIGIT ZERO	テルグ文字における数字の0。	0
U+0C67	౧	TELUGU DIGIT ONE	テルグ文字における数字の1。	1
U+0C68	౨	TELUGU DIGIT TWO	テルグ文字における数字の2。	2
U+0C69	౩	TELUGU DIGIT THREE	テルグ文字における数字の3。	3
U+0C6A	౪	TELUGU DIGIT FOUR	テルグ文字における数字の4。	4
U+0C6B	౫	TELUGU DIGIT FIVE	テルグ文字における数字の5。	5
U+0C6C	౬	TELUGU DIGIT SIX	テルグ文字における数字の6。	6
U+0C6D	౭	TELUGU DIGIT SEVEN	テルグ文字における数字の7。	7
U+0C6E	౮	TELUGU DIGIT EIGHT	テルグ文字における数字の8。	8
U+0C6F	౯	TELUGU DIGIT NINE	テルグ文字における数字の9。	9
記号
U+0C77	౷	TELUGU SIGN SIDDHAM	テキストの冒頭で祈りの言葉として使用される。^[2]
テルグ分数及び重量単位記号
U+0C78	౸	TELUGU FRACTION DIGIT ZERO FOR ODD POWERS OF FOUR	「4の奇数乗分の0」を表す。1/4よりも小さな値を記述する際に用いられる。^[8]
U+0C79	౹	TELUGU FRACTION DIGIT ONE FOR ODD POWERS OF FOUR	「4の奇数乗分の1」(1/4, 1/64, 1/1024, ...)を表す。^[8]
U+0C7A	౺	TELUGU FRACTION DIGIT TWO FOR ODD POWERS OF FOUR	「4の奇数乗分の2」(2/4, 2/64, 2/1024, ...)を表す。^[8]
U+0C7B	౻	TELUGU FRACTION DIGIT THREE FOR ODD POWERS OF FOUR	「4の奇数乗分の3」(3/4, 3/64, 3/1024, ...)を表す。^[8]
U+0C7C	౼	TELUGU FRACTION DIGIT ONE FOR EVEN POWERS OF FOUR	「4の偶数乗分の1」(1/16, 1/256, 1/4096 ...)を表す。^[8]
U+0C7D	౽	TELUGU FRACTION DIGIT TWO FOR EVEN POWERS OF FOUR	「4の偶数乗分の2」(2/16, 2/256, 2/4096 ...)を表す。^[8]
U+0C7E	౾	TELUGU FRACTION DIGIT THREE FOR EVEN POWERS OF FOUR	「4の偶数乗分の3」(3/16, 3/256, 3/4096 ...)を表す。^[8]
U+0C7F	౿	TELUGU SIGN TUUMU	tuumuという伝統的な体積或いは重量の単位を表す記号。^[8]

小分類

このブロックの小分類は「各種記号」（Various signs）、「独立母音字」（Independent vowels）、「子音字」（Consonants）、「サンスクリット語用の追加」（Addition for Sanskrit）、「従属母音記号」（Dependent vowel signs）、「ヴィラーマ」（Virama）、「歴史的な音声記号用異体字」（Historic phonetic variants）、「予約済」（Reserved）、「数字」（Digits）、「記号」（Sign）、「テルグ分数及び重量単位記号」（Telugu fractions and weights）の11個となっている。^[11]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

各種記号（Various signs）

この小分類にはテルグ文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字（Independent vowels）

この小分類にはテルグ文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字（Consonants）

この小分類にはテルグ文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。

サンスクリット語用の追加（Addition for Sanskrit）

この小分類にはテルグ文字のうち、サンスクリット語の翻字に用いられる記号１つのみが収録されている。

従属母音記号（Dependent vowel signs）

この小分類にはテルグ文字のうち、子音字に結合する母音記号が収録されている。組み合わせる先の子音字によっては特殊な合字を形成することがある。

ヴィラーマ（Virama）

この小分類にはテルグ文字のうち、ハラント(halant)（殺母音記号）と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号１つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。但し、文字によっては半子音字形を持たずただ単にハラントが子音字の上に付く場合もある。

なお文字名及び小分類名の「ヴィラーマ(virama)」とはデーヴァナーガリーにおける同様の機能を持つ記号の名称である。

歴史的な音声記号用異体字（Historic phonetic variants）

この小分類にはテルグ文字のうち、かつて音声記号として用いられていた拡張子音字が3つ収録されている。

予約済（Reserved）

この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点（Generic punctuation for scripts of India）」に相当する。

なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。^[2]

数字（Digits）

この小分類にはテルグ文字で用いられる固有の数字が収録されている。

記号（Sign）

この小分類にはテルグ文字のうち、テキストの冒頭で祈りの言葉(invocation)として用いられる記号1つのみが収録されている。

テルグ分数及び重量単位記号（Telugu fractions and weights）

この小分類にはテルグ文字において分数や重量の単位を表すための記号が収録されている。

文字コード

テルグ文字(Telugu)^[1] Official Unicode Consortium code chart (PDF)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0C0x	ఀ	ఁ	ం	ః	ఄ	అ	ఆ	ఇ	ఈ	ఉ	ఊ	ఋ	ఌ		ఎ	ఏ
U+0C1x	ఐ		ఒ	ఓ	ఔ	క	ఖ	గ	ఘ	ఙ	చ	ఛ	జ	ఝ	ఞ	ట
U+0C2x	ఠ	డ	ఢ	ణ	త	థ	ద	ధ	న		ప	ఫ	బ	భ	మ	య
U+0C3x	ర	ఱ	ల	ళ	ఴ	వ	శ	ష	స	హ			఼	ఽ	ా	ి
U+0C4x	ీ	ు	ూ	ృ	ౄ		ె	ే	ై		ొ	ో	ౌ	్
U+0C5x						ౕ	ౖ		ౘ	ౙ	ౚ			ౝ
U+0C6x	ౠ	ౡ	ౢ	ౣ			౦	౧	౨	౩	౪	౫	౬	౭	౮	౯
U+0C7x								౷	౸	౹	౺	౻	౼	౽	౾	౿
注釈 1.^バージョン15.1時点

履歴

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン	コードポイント^[a]	文字数	L2 ID	ドキュメント
1.0.0		61		(to be determined)
5.1	U+0C3D,0C58..0C59,0C78..0C7F	11	L2/06-250	Michael Everson; Sure¯s. Kolica¯la; Na¯ga¯rjuna Venna (28 July 2006), Proposal to add eighteen characters for Telugu to the BMP (WG2 N3116) (英語)
5.1	U+0C3D,0C58..0C59,0C78..0C7F	11	L2/06-267	N. Ganesan (1 August 2006), Comments on L2/06-250, Proposal to add eighteen characters for Telugu (英語)
7.0	U+0C00	1		(to be determined)
	U+0C34	1	L2/12-015	Shriramana Sharma; Suresh Kolichala; Nagarjuna Venna; Vinodh Rajan (23 January 2012), Proposal to encode 0C34 TELUGU LETTER LLLA (WG2 N4214) (英語)
	U+0C34	1	L2/12-076	Andhra Pradesh (6 February 2012), Govt. of Andhra Pradesh's inputs on document no. L2/12-015 (Telugu LLLA) (英語)
8.0	U+0C5A	1	L2/12-016	Shriramana Sharma; Suresh Kolichala; Nagarjuna Venna; Vinodh Rajan (23 January 2012), Proposal to encode 0C5A TELUGU LETTER RRRA (WG2 N4215) (英語)
8.0	U+0C5A	1	L2/13-121	Suresh Kolichala (9 May 2013), Letter from Andhra Pradesh re Telugu RRRA (英語)
11.0	U+0C04	1	L2/16-285	Srinidhi A; Sridatta A (20 October 2016), Proposal to encode the TELUGU SIGN COMBINING ANUSVARA ABOVE (英語)
12.0	U+0C77	1	L2/17-218	Srinidhi A; Sridatta A (11 August 2017), Proposal to encode the TELUGU SIGN SIDDHAM (revised) (英語)
14.0	U+0C3C	1	L2/19-401	Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (17 December 2019), Proposal to Encode Telugu Sign Nukta (英語)
			L2/19-405	Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (29 December 2019), Additional evidence for the use of Nukta sign in Telugu (英語)
			L2/20-085	Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (18 March 2020), Revised Proposal to Encode Telugu Sign Nukta (英語)
	U+0C5D	1	L2/11-409	Shriramana Sharma; Suresh Kolichala; Nagarjuna Venna; Vinodh Rajan (27 October 2011), On the Telugu nakaara-pollu (英語)
	U+0C5D	1	L2/20-084	Vinodh Rajan; Shriramana Sharma; Suresh Kolichala (18 March 2020), Revised Proposal to Encode Telugu Letter Nakaara Pollu (英語)
^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

^ “3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ "The Unicode Standard, Version 15.1 - U0C00.pdf" (PDF). The Unicode Standard (英語). 2024年7月29日閲覧。
^ ^a ^b IASTではṛと表記される。
^ ^a ^b IASTではḷと表記される。
^ Shriramana Sharma; Suresh Kolichala, Nagarjuna Venna, Vinodh Rajan (2012年1月23日). “Proposal to encode 0C34 TELUGU LETTER LLLA (WG2 N4214)” (英語). Unicode. 2024年7月29日閲覧。
^ Vinodh Rajan; Shriramana Sharma, Suresh Kolichala (2020年3月18日). “Revised Proposal to Encode Telugu Sign Nukta” (英語). Unicode. 2024年7月29日閲覧。
^ ^a ^b IASTではṝと表記される。
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j Michael Everson; Sure¯s. Kolica¯la, and Na¯ga¯rjuna Venna (2006年7月28日). “Proposal to add eighteen characters for Telugu to the BMP (WG2 N3116)” (英語). Unicode. 2024年7月29日閲覧。
^ ^a ^b Shriramana Sharma; Suresh Kolichala, Nagarjuna Venna, Vinodh Rajan (2012年1月23日). “Proposal to encode 0C5A TELUGU LETTER RRRA (WG2 N4215)” (英語). Unicode. 2024年7月29日閲覧。
^ ^a ^b IASTではḹと表記される。
^ "The Unicode Standard, Version 15.1 - U0B80.pdf" (PDF). The Unicode Standard (英語). 2024年7月28日閲覧。