アラビア文字拡張A(アラビアもじかくちょうA、英語: Arabic Extended-A)は、Unicodeの22個目のブロック

アラビア文字拡張A
Arabic Extended-A
範囲 U+08A0..U+08FF
(96 個の符号位置)
基本多言語面
用字 アラビア文字
主な言語・文字体系
割当済 96 個の符号位置
未使用 0 個の保留
Unicodeのバージョン履歴
6.1 39 (+39)
7.0 47 (+8)
8.0 50 (+3)
9.0 73 (+23)
11.0 74 (+1)
13.0 84 (+10)
14.0 96 (+12)
テンプレートを表示

解説

編集

アラビア文字のうち、アラビア文字アラビア文字補助のいずれのブロックにも含まれていない文字を収録している。ミャンマーの少数民族であるロヒンギャが話すロヒンギャ語や、フラニ語の方言であるアダマワ・フルフルデ語英語版ハウサ語ウォロフ語などの西アフリカ地域の諸言語、パキスタンインドアフガニスタンなどの南アジア地域で話されるパンジャーブ語バルティ語アルウィー語英語版ヨーロッパ中央アジアで話される諸言語用の拡張文字、イスラム教の聖典であるクルアーンを記述する際に用いられる記号などが含まれている。

通常のアラビア文字同様に子音字のみを記述するアブジャドで、右から左に横書き(右横書き)し、単語の位置によって独立形・語頭形・語中形・語末形の4つの形状に変化する。また、クルアーン表記用の結合記号も含まれている。

本ブロックはUnicodeのバージョン6.1で初めて追加された。

収録文字

編集
コード 文字 文字名(英語) 用例・説明
アフリカ諸言語用のアラビア文字
U+08A0 ARABIC LETTER BEH WITH SMALL V BELOW セネガルの諸言語ウォロフ語フラニ語西部方言(プラー語)、マンディンカ語セレール語ジョラ語バランタ諸語英語版サーフィ語英語版ノーン語英語版ンドゥット語英語版で子音[ɓ]を表す。[1]
U+08A1 ARABIC LETTER BEH WITH HAMZA ABOVE カメルーンにおけるアダマワ・フルフルデ語英語版(フラニ語東部方言)で[ɓ]を表す。[2]

文字上部のハムザ(ء)と同形の記号は単なる音記号としての役割を持つ装飾記号であり、子音字としてのハムザとは関係がないためこの文字をU+0654 ٔとの合成文字で表現するのは不適切と判断され、新たに独立の文字として収録された。[3]

U+08A2 ARABIC LETTER JEEM WITH TWO DOTS ABOVE セネガルの諸言語ウォロフ語フラニ語西部方言(プラー語)、マンディンカ語セレール語ジョラ語バランタ諸語英語版サーフィ語英語版ノーン語英語版ンドゥット語英語版で子音/ƈ/[4]を表す。[1]
U+08A3 ARABIC LETTER TAH WITH TWO DOTS ABOVE セネガルの諸言語ウォロフ語フラニ語西部方言(プラー語)、マンディンカ語セレール語ジョラ語バランタ諸語英語版サーフィ語英語版ノーン語英語版ンドゥット語英語版で子音/ƭ/[5]を表す。[1]
U+08A4 ARABIC LETTER FEH WITH DOT BELOW AND THREE DOTS ABOVE チャドの諸言語で子音[](ラテン文字表記:vb)を表す。[1]
U+08A5 ARABIC LETTER QAF WITH DOT BELOW チャドの諸言語で子音[ɡ͡b](ラテン文字表記:gb)を表す。[1]
U+08A6 ARABIC LETTER LAM WITH DOUBLE BAR チャドの諸言語で子音[ɮ](ラテン文字表記:zl)を表す。[1]
U+08A7 ARABIC LETTER MEEM WITH THREE DOTS ABOVE チャドの諸言語で子音列[mv](ラテン文字表記:mv)を表す。[1]
U+08A8 ARABIC LETTER YEH WITH TWO DOTS BELOW AND HAMZA ABOVE カメルーンにおけるアダマワ・フルフルデ語英語版(フラニ語東部方言)で[ʕʲ]を表す。ニジェールにおけるラテン文字ではƴと表記される。[2]
U+08A9 ARABIC LETTER YEH WITH TWO DOTS BELOW AND DOT ABOVE カメルーンにおけるアダマワ・フルフルデ語英語版(ラニ語東部方言)で[ɲ]を表す。[2]
ロヒンギャ語用の従属子音字
U+08AA ARABIC LETTER REH WITH LOOP これらの文字は別の頭子音の後ろに書かれ、前の子音と一続きの子音列(子音クラスタ)として読まれる子音を表す。それぞれ[-r][-w][-j]が前の子音に後続することを表す。[1]

前に別の子音字が書かれることが前提の文字であるため、独立形や語頭形は定義されていない。[1]

U+08AB ARABIC LETTER WAW WITH DOT WITHIN
U+08AC ARABIC LETTER ROHINGYA YEH
欧州及び中央アジア諸言語用のアラビア文字
U+08AD ARABIC LETTER LOW ALEF バシキール語タタール語[2]ヤニャ・イムラ(Yaña imlâ)正書法では単語の頭に置き、そのままの綴りでは複数の読み方ができてしまう単語内において、後母音が使われていることを示す。[6]

バシキール語やタタール語を含むテュルク語族の言語では母音調和という現象が存在し、一つの単語内において前母音か後母音のどちらかしか存在することができないという制約があるため、どちらか一方であることが示せれば単語全体の読みを確定することができる。

U+08AE ARABIC LETTER DAL WITH THREE DOTS BELOW ベラルーシ語[2]において子音[d͡z]を表す。[6]

インドネシア諸言語におけるペゴン文字英語版ではU+068A ڊの異体字としても用いられる。[2]

U+08AF ARABIC LETTER SAD WITH THREE DOTS BELOW ベラルーシ語[2]において子音[t͡s]を表す。[6]
U+08B0 ARABIC LETTER GAF WITH INVERTED STROKE クリミア・タタール語において子音[j]を、チェチェン語ラク語において子音[]を表す。[2][6]
U+08B1 ARABIC LETTER STRAIGHT WAW タタール語[2]ウルタ・イムラ・アルパロフ(Urta imlâ Alparov)の正書法で母音[ɯ]を表す。[6]
ベルベル語用のアラビア文字
U+08B2 ARABIC LETTER ZAIN WITH INVERTED V ABOVE 子音[zˤ]を表す。現在のラテン文字表記ではẓと書かれる。[7]
アルウィー語英語版用のアラビア文字
U+08B3 ARABIC LETTER AIN WITH THREE DOTS BELOW アルウィー語で子音[ŋ]を表す。タミル文字のU+0B99 ஙに対応する。
U+08B4 ARABIC LETTER KAF WITH DOT BELOW アルウィー語で子音[ɡ]を表す。タミル文字のU+0B95 கに対応する。

インドネシア諸言語におけるペゴン文字英語版でも用いられる。[2]

早期アラビア文字
U+08B5 ARABIC LETTER QAF WITH DOT BELOW AND NO DOTS ABOVE 古いアラビア語の文献において、字母カーフ(ق)とファー(ف)の書き分けが定まっていなかった時代における字母カーフの異体字の一つ。[8]
ブラバ語英語版用のアラビア文字
U+08B6 ARABIC LETTER BEH WITH SMALL MEEM ABOVE 子音[ᵐb]を表す。[9]
U+08B7 ARABIC LETTER PEH WITH SMALL MEEM ABOVE 子音[ᵐp]を表す。[9]
U+08B8 ARABIC LETTER TEH WITH SMALL TEH ABOVE 子音[ʈ]を表す。[9]
U+08B9 ARABIC LETTER REH WITH SMALL NOON ABOVE 子音[ⁿr]を表す。[9]
U+08BA ARABIC LETTER YEH WITH TWO DOTS BELOW AND SMALL NOON ABOVE 子音[ɲ]を表す。[9]
ワルシュ英語版式正書法用のアラビア文字
U+08BB ARABIC LETTER AFRICAN FEH 語頭形、語中形の時だけ下に点が一つ付く。[2]
U+08BC ARABIC LETTER AFRICAN QAF 語頭形、語中形の時だけ上に点が一つ付く。[2]
U+08BD ARABIC LETTER AFRICAN NOON 語頭形、語中形の時だけ上に点が一つ付く。[2]
ヒンドコ語用のアラビア文字
U+08BE ARABIC LETTER PEH WITH SMALL V
U+08BF ARABIC LETTER TEH WITH SMALL V
U+08C0 ARABIC LETTER TTEH WITH SMALL V
U+08C1 ARABIC LETTER TCHEH WITH SMALL V
U+08C2 ARABIC LETTER KEHEH WITH SMALL V
ハウサ語ウォロフ語及びその他のアフリカ正書法用のアラビア文字
U+08C3 ARABIC LETTER GHAIN WITH THREE DOTS ABOVE ハウサ語で子音[ɡʲ](ラテン文字表記: gy)を表す。[10]
U+08C4 ARABIC LETTER AFRICAN QAF WITH THREE DOTS ABOVE 語頭形と語中形のみにqafの上に1つの点が追加される。[2]ハウサ語で子音[ɠ̊ʲ](ラテン文字表記: ƙy)を表す。[10]
U+08C5 ARABIC LETTER JEEM WITH THREE DOTS ABOVE ウォロフ語で用いられる。現在ラテン文字でñ, č, nǰ, nčなどと書かれる音素の表記に用いられる。これらの文字は互いに異体字関係で、文献によっていずれかの文字が使用される。[11]
U+08C6 ARABIC LETTER JEEM WITH THREE DOTS BELOW
パンジャーブ語用のアラビア文字
U+08C7 ARABIC LETTER LAM WITH SMALL ARABIC LETTER TAH ABOVE グルムキー文字のU+0A33 ਲ਼に対応し、子音[ɭ]を表す。[12]
バルティ語用のアラビア文字
U+08C8 ARABIC LETTER GRAF 子音列[gr]を表す。[13]
クルアーン正書法用の追加
U+08C9 ARABIC SMALL FARSI YEH ワルシュ英語版式クルアーンでで欠落している子音[j]と欠落している母音[iː]を区別するために用いられる。[14]
U+08CA ARABIC SMALL HIGH FARSI YEH Qaloon(カルーン英語版)/al-Dani(アル・ダニ英語版 )式のクルアーンで欠落している子音[j]と欠落している母音[iː]を区別するために用いられる。[14]
U+08CB ARABIC SMALL HIGH YEH BARREE WITH TWO DOTS BELOW クルアーンにおいて、字母アリフ(ا)が字母ヤー(ي)として、つまり母音[iː]ではなく子音[j]として読まれることを表す記号。[14]
U+08CC ARABIC SMALL HIGH WORD SAH 北西アフリカ地域のクルアーンの朗唱用記号で、休止(waqf)を表す。[14]
U+08CD ARABIC SMALL HIGH ZAH クルアーンにおいて字母ダード()をザー()の発音[ðˤ]で発音することを表す記号。[14]
U+08CE ARABIC LARGE ROUND DOT ABOVE Al-Duri(アル・ドゥリ英語版)式のクルアーンでImāla(イマーラ英語版)と呼ばれる、古代アラビア語では/a/で発音されていた母音が/i/に変化した現象を表す記号。[14]
U+08CF ARABIC LARGE ROUND DOT BELOW
U+08D0 ARABIC SUKUN BELOW al-Dani(アル・ダニ英語版 )式のクルアーンで用いられる。[14][15]
U+08D1 ARABIC LARGE CIRCLE BELOW Al-Duri(アル・ドゥリ英語版)式のクルアーンでImāla現象を表す記号。[14]
U+08D2 ARABIC LARGE ROUND DOT INSIDE CIRCLE BELOW チュニジアチュニスのQaloon(カルーン英語版)式クルアーンでImāla現象を表す記号。[14]
クルアーン註釈記号
U+08D3 ARABIC SMALL LOW WAW al-Dani(アル・ダニ英語版 )式のクルアーンで用いられる。[15]
U+08D4 ARABIC SMALL HIGH WORD AR-RUB パキスタンのクルアーンで用いられる。[16]
U+08D5 ARABIC SMALL HIGH SAD 朗誦時に休止が推奨されていないが、休止したい場合は休止しても良い箇所であることを表す記号。[17][18]
U+08D6 ARABIC SMALL HIGH AIN クルアーンにおける「章」にあたるスーラ内で、トピックであるルクー(クルアーン)英語版の終わりを示す。また、すべてのスーラの終わりにも用いられる。[17][18]
U+08D7 ARABIC SMALL HIGH QAF 朗誦時に休止が推奨されていない箇所であることを表す記号。[17][18]
U+08D8 ARABIC SMALL HIGH NOON WITH KASRA 通常のクルアーン朗誦では[-n]を伴う母音記号のターンウィーン(ファトハターンダンマターンカスラターン)のある位置で休止を伴うが、次の字母がアリフ(ا)の時に休止せずに頭子音[n-]を伴って読みたい場合に用いる記号。[17][18]
U+08D9 ARABIC SMALL LOW NOON WITH KASRA
U+08DA ARABIC SMALL HIGH WORD ATH-THALATHA クルアーンにおける「巻」にあたるジュズウの終わりから4分の1の位置にあることを表す記号。[17][18]
U+08DB ARABIC SMALL HIGH WORD AS-SAJDA クルアーンにおいて、END OF AYAH (U+06DD ۝)の上部に書かれるサジダ記号。クルアーンの「節」にあたるアーヤ英語版の末尾でサジダ(伏拝)の姿勢を取ることを表す。[17][18]
U+08DC ARABIC SMALL HIGH WORD AN-NISF クルアーンにおける「巻」にあたるジュズウの終わりから半分の位置にあることを表す記号。[17][18]
U+08DD ARABIC SMALL HIGH WORD SAKTA 朗誦時にある程度休止することは可能だが、次の単語を同じ息で[19]発音すべき箇所であることを表す記号。[17][18]
U+08DE ARABIC SMALL HIGH WORD QIF 朗誦時に一旦朗誦を停止しなければならない箇所であることを表す記号。[17][18]
U+08DF ARABIC SMALL HIGH WORD WAQFA 朗誦時にsaktaよりも長い休止があり、次の単語を同じ息で発音すべき箇所であることを表す記号。[17][18]
U+08E0 ARABIC SMALL HIGH FOOTNOTE MARKER 余白にクルアーンの「節」にあたるアーヤ英語版に関する注釈を書く必要があるときに書かれる記号。[17][18]
U+08E1 ARABIC SMALL HIGH SIGN SAFHA クルアーンにおいて脚注を表す記号。1ページに複数の注記がある場合、この記号は他の注記に使用される。[17][18]
U+08E2 ARABIC DISPUTED END OF AYAH クルアーンの「節」にあたるアーヤ英語版の総数はクルアーン朗誦学者の間で意見が分かれているため、学者によってアーヤの末尾であるか途中であるか意見が分かれている箇所を示すために使用される。[17][18]
アルウィー語英語版用の拡張母音記号
U+08E3 ARABIC TURNED DAMMA BELOW アルウィー語で母音[e]を表す。タミル文字のU+0BC6 ெに対応する。
ロヒンギャ語用の拡張母音記号
U+08E4 ARABIC CURLY FATHA ロヒンギャ語で母音[o]を表す。[1]
U+08E5 ARABIC CURLY DAMMA ロヒンギャ語で二重母音[ou]を表す。[1]
U+08E6 ARABIC CURLY KASRA ロヒンギャ語で母音[e]を表す。[1]
U+08E7 ARABIC CURLY FATHATAN ロヒンギャ語で母音[on]を表す。[1]
U+08E8 ARABIC CURLY DAMMATAN ロヒンギャ語で二重母音[oun]を表す。[1]
U+08E9 ARABIC CURLY KASRATAN ロヒンギャ語で母音[en]を表す。[1]
ロヒンギャ語用の声調記号
U+08EA ARABIC TONE ONE DOT ABOVE これらの記号はロヒンギャ語において声調を表す記号として用いられる。

ファトハダンマなどの子音字の上に書かれる母音記号についてはその更に上側に、カスラなどの子音字の下に書かれる母音記号についてはその更に下側に書かれる記号である。実際には3種類の声調記号が存在するが、実装上の都合から上側に付く場合と下側に付く場合とで符号位置を分けられている。[1]

U+08EB ARABIC TONE TWO DOTS ABOVE
U+08EC ARABIC TONE LOOP ABOVE
U+08ED ARABIC TONE ONE DOT BELOW
U+08EE ARABIC TONE TWO DOTS BELOW
U+08EF ARABIC TONE LOOP BELOW
クルアーン註釈記号
U+08F0 ARABIC OPEN FATHATAN これらの記号は本来は[-n]を伴う母音記号のターンウィーン(ファトハターンダンマターンカスラターン)について、鼻音[-n]が発音されないことを表す。[20]
U+08F1 ARABIC OPEN DAMMATAN
U+08F2 ARABIC OPEN KASRATAN
U+08F3 ARABIC SMALL HIGH WAW 単語上は表記されない長母音[uː]を表す。

類似した形状のU+06E5 ARABIC SMALL WAWは左右に結合しない文字であるためこの文字の代用にはならず、また、短母音[u]を表すU+064C ARABIC DAMMAも音価上の違いがありクルアーンの朗唱者もが両者を区別しているためこれらの文字とは別の文字として符号化された。[20]

アフリカ諸言語用の拡張母音記号
U+08F4 ARABIC FATHA WITH RING セネガルウォロフ語及びジョラ語で母音[ə](ラテン文字表記:ë)を表す。ニジェールダザガ語でも同様の母音(ラテン文字表記:ə)を表す。[1]
U+08F5 ARABIC FATHA WITH DOT ABOVE セネガルウォロフ語で長母音[aː](ラテン文字表記:à)を表す。[1]
U+08F6 ARABIC KASRA WITH DOT BELOW セネガルジョラ語バランタ諸語英語版で母音[iː](ラテン文字表記:í)を表す。[1]

フィリピンの諸言語でも用いられる。[2]

U+08F7 ARABIC LEFT ARROWHEAD ABOVE セネガルウォロフ語で母音[ɔ](ラテン文字表記:o)を表す。[1]
U+08F8 ARABIC RIGHT ARROWHEAD ABOVE セネガルの諸言語ウォロフ語フラニ語西部方言(プラー語)、ソニンケ語マンディンカ語セレール語ジョラ語バランタ諸語英語版で母音[ɔ](ラテン文字表記:o)を表す。[1]

ギニアの諸言語(スス語モゴフィン語英語版フラニ語西部方言(プラー語))の表記[1]や、アフリカ諸国などの正書法のクルアーンのテキストにおいては、母音記号(シャクル)のダンマ(母音[u])がこの字形で書かれる。[2]

U+08F9 ARABIC LEFT ARROWHEAD BELOW セネガルの諸言語ウォロフ語フラニ語西部方言(プラー語)、ソニンケ語マンディンカ語セレール語ジョラ語バランタ諸語英語版母音[e](ラテン文字表記:e)を表す。[1]
U+08FA ARABIC RIGHT ARROWHEAD BELOW セネガルの諸言語ウォロフ語ジョラ語バランタ諸語英語版で母音[eː](ラテン文字表記:é)を表す。[1]
U+08FB ARABIC DOUBLE RIGHT ARROWHEAD ABOVE ギニアの諸言語(スス語モゴフィン語英語版フラニ語西部方言(プラー語))の表記[1]や、アフリカ諸国などの正書法のクルアーンのテキストにおいては、母音記号(シャクル)のダンマターン(母音[un])がこの字形で書かれる。[2]
U+08FC ARABIC DOUBLE RIGHT ARROWHEAD ABOVE WITH DOT ギニアの諸言語(スス語モゴフィン語英語版フラニ語西部方言(プラー語))の表記で母音[on]または[ɔn]を表す。[1]
U+08FD ARABIC RIGHT ARROWHEAD ABOVE WITH DOT ギニアの諸言語(スス語モゴフィン語英語版フラニ語西部方言(プラー語))の表記で母音[o]または[ɔ]を表す。[1]
拡張母音記号
U+08FE ARABIC DAMMA WITH DOT フィリピンの諸言語で母音[o]を表す。[1][2]
U+08FF ARABIC MARK SIDEWAYS NOON GHUNNA パキスタン北部で話されるパルーラ語及びシナー語において、母音[e]が短く発音されることを表す記号。U+06E1 ۡ (クルアーン用のスクーン記号、無母音であることを表す)と近形だが機能が異なるため符号位置が分けられた。[21]

小分類

編集

このブロックの小分類は「アフリカ諸言語用のアラビア文字」(Arabic letters for African languages)、「ロヒンギャ語用の従属子音字」(Dependent consonants for Rohingya)、「欧州及び中央アジア諸言語用のアラビア文字」(Arabic letters for European and Central Asian languages)、「ベルベル語用のアラビア文字」(Arabic letter for Berber)、「アルウィー語用のアラビア文字」(Arabic letters for Arwi)、「早期アラビア文字」(Early Arabic letter)、「ブラバ語用のアラビア文字」(Arabic letters for Bravanese)、「ワルシュ式正書法用のアラビア文字」(Arabic letters for Warsh orthography)、「ヒンドコ語用のアラビア文字」(Arabic letters for Hindko)、「ハウサ語・ウォロフ語及びその他のアフリカ正書法用のアラビア文字」(Arabic letters for Hausa, Wolof and other African orthographies)、「パンジャーブ語用のアラビア文字」(Arabic letter for Punjabi)、「バルティ語用のアラビア文字」(Arabic letter for Balti)、「クルアーン正書法用の追加」(Additions for Quranic orthographies)、「クルアーン註釈記号」(Quranic annotation signs)、「アルウィー語用の拡張母音記号」(Extended vowel sign for Arwi)、「ロヒンギャ語用の拡張母音記号」(Extended vowel signs for Rohingya)、「ロヒンギャ語用の声調記号」(Tone marks for Rohingya)、「アフリカ諸言語用の拡張母音記号」(Extended vowel signs for African languages)、「拡張母音記号」(Extended vowel signs)の19個となっている。[2]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

アフリカ諸言語用のアラビア文字(Arabic letters for African languages

編集

この小分類にはアラビア文字のうち、カメルーンで話されるフラニ語の方言であるアダマワ・フルフルデ語英語版などの西アフリカの諸言語を表記するための文字が収録されている。Unicodeのバージョン6.1で本ブロックと共に追加され、のちにU+08A1がバージョン7.0で追加された。

ロヒンギャ語用の従属子音字(Dependent consonants for Rohingya

編集

この小分類にはアラビア文字のうち、ミャンマーラカイン州などに居住する同国の少数民族であるロヒンギャが話すロヒンギャ語を表記するための文字が収録されている。Unicodeのバージョン6.1で本ブロックと共に追加された。

欧州及び中央アジア諸言語用のアラビア文字(Arabic letters for European and Central Asian languages

編集

この小分類にはアラビア文字のうち、ベラルーシの公用語であるベラルーシ語クリミア半島で話されるクリミア・タタール語などのヨーロッパの諸言語や、タタール語バシキール語チェチェン語ラク語などの現在のロシア連邦に含まれる中央アジアコーカサス地域の諸言語の表記に用いられる、或いはかつて用いられていた文字が収録されている。

ベルベル語用のアラビア文字(Arabic letter for Berber

編集

この小分類にはアラビア文字のうち、モロッコアルジェリアなどの北アフリカ地域に居住するベルベル人が話すベルベル語派の諸言語の表記に用いられる文字が収録されている。

アルウィー語用のアラビア文字(Arabic letters for Arwi

編集

この小分類にはアラビア文字のうち、インドタミル・ナードゥ州スリランカなどにおいて、イスラム教徒が話すタミル語の方言であるアルウィー語英語版の表記に用いられる文字が収録されている。

早期アラビア文字(Early Arabic letter

編集

この小分類にはアラビア文字のうち、古いアラビア語の文献において、字母カーフ(ق)とファー(ف)の書き分けが定まっていなかった時代における字母カーフの異体字の一つ[8]が収録されている。

ブラバ語用のアラビア文字(Arabic letters for Bravanese

編集

この小分類にはアラビア文字のうち、東アフリカに位置するソマリアブラバなどに居住するブラバ人英語版が話すスワヒリ語の方言であるブラバ語英語版の表記に用いられる文字が収録されている。

ワルシュ式正書法用のアラビア文字(Arabic letters for Warsh orthography

編集

この小分類にはアラビア文字のうち、中世エジプトワルシュ英語版によって発案されたワルシュ式正書法によるクルアーンの表記に用いられる文字が収録されている。ワルシュ式正書法は、北アフリカ及び西アフリカで最も広く普及している伝統的なアラビア文字による聖典の記述法である。[2]

ヒンドコ語用のアラビア文字(Arabic letters for Hindko

編集

この小分類にはアラビア文字のうち、パキスタンインド北部に居住する民族であるヒンドコワン(Hindkowans)やアフガニスタンに居住するHindkiよって話されるインド・ヨーロッパ語族インド語派に属する、パンジャーブ語と近縁の関係にあるヒンドコ語の表記に用いられる文字(シャームキー文字)が収録されている。

ハウサ語・ウォロフ語及びその他のアフリカ正書法用のアラビア文字(Arabic letters for Hausa, Wolof and other African orthographies

編集

この小分類にはアラビア文字のうち、ナイジェリアニジェールなどで話されるハウサ語や、セネガルなどで話されるウォロフ語を始めとしたアフリカの諸言語の表記に用いられる文字が収録されている。

パンジャーブ語用のアラビア文字(Arabic letter for Punjabi

編集

この小分類にはアラビア文字のうち、パキスタンパンジャーブ州インドパンジャーブ州で話されるパンジャーブ語の表記に用いられる文字(シャームキー文字)が1文字のみ収録されている。

バルティ語用のアラビア文字(Arabic letter for Balti

編集

この小分類にはアラビア文字のうち、インドとパキスタンの領有係争地であるカシミール地方の北部に位置するバルティスターン地域のギルギット・バルティスタン州などに居住するバルティ人が話すシナ・チベット語族に属するバルティ語の表記に用いられる文字が収録されている。

クルアーン正書法用の追加(Additions for Quranic orthographies

編集

この小分類にはイスラム教の聖典であるクルアーンの記述に用いられる記号類が収録されている。

クルアーン註釈記号(Quranic annotation signs

編集

この小分類にはイスラム教の聖典であるクルアーンにおいて註釈記号として用いられる記号類が収録されている。この小分類に属する文字の提案のため、本ブロックが新たに追加されることとなった。[20]Unicodeのバージョン6.1で本ブロックと共に追加された。

アルウィー語用の拡張母音記号(Extended vowel sign for Arwi

編集

この小分類にはインドタミル・ナードゥ州スリランカなどにおいて、イスラム教徒が話すタミル語の方言であるアルウィー語英語版の表記に用いられる母音記号が収録されている。全て文字幅を持たない結合文字である。

ロヒンギャ語用の拡張母音記号(Extended vowel signs for Rohingya

編集

この小分類にはミャンマーの少数民族であるロヒンギャが話すロヒンギャ語の表記に用いられる母音記号が収録されている。全て文字幅を持たない結合文字である。Unicodeのバージョン6.1で本ブロックと共に追加された。

ロヒンギャ語用の声調記号(Tone marks for Rohingya

編集

この小分類にはミャンマーの少数民族であるロヒンギャが話すロヒンギャ語の表記に用いられる声調記号が収録されている。全て文字幅を持たない結合文字である。Unicodeのバージョン6.1で本ブロックと共に追加された。

アフリカ諸言語用の拡張母音記号(Extended vowel signs for African languages

編集

この小分類にはアフリカの諸言語において用いられる母音記号が収録されている。全て文字幅を持たない結合文字である。Unicodeのバージョン6.1で本ブロックと共に追加された。

拡張母音記号(Extended vowel signs

編集

この小分類にはその他の母音記号が収録されている。全て文字幅を持たない結合文字である。

文字コード

編集
アラビア文字拡張A(Arabic Extended-A)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+08Ax
U+08Bx
U+08Cx
U+08Dx
U+08Ex  ࣢ 
U+08Fx
注釈
1.^バージョン15.1時点


履歴

編集

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
6.1 U+08F0..08F3 4 L2/09-419 Roozbeh Pournader (1 April 2010), Proposal to encode four combining Arabic characters for Koranic use (revised) (英語)
U+08A0,08A2..08AC,08E4..08EF,08F4..08FE 35 L2/10-288 Lorna Priest; Martin Hosken (12 August 2010), Proposal to add Arabic script characters for African and Asian languages (revised) (英語)
7.0 U+08A1 1 L2/10-442 Lorna Priest; Martin Hosken (29 October 2010), Proposal to add ARABIC LETTER BEH WITH HAMZA ABOVE (英語)
U+08FF 1 L2/11-033 Lorna Priest (17 February 2011), Proposal to add Arabic Mark Sideways Noon Ghunna (revised) (英語)
U+08AD..08B1 5 L2/11-138 Ilya Yevlampiev; Karl Pentzlin; Nurlan Joomagueldinov (29 April 2011), Proposal to encode Arabic characters used for Bashkir, Belarusian, Crimean Tatar, Karachay, Karakalpak, and Tatar languages (英語)
L2/11-201 Roozbeh Pournader; Deborah Anderson (16 May 2011), Proposed codepoints and properties for characters in "Proposal to encode Arabic characters used for Bashkir, Belarusian, Crimean Tatar, Karachay, Karakalpak, and Tatar languages" (WG2 N4065) (英語)
L2/11-209 Ilya Yevlampiev; Karl Pentzlin; Nurlan Joomagueldinov (27 May 2011), Revised Proposal to encode Arabic characters used for Bashkir, Belarusian, Crimean Tatar, and Tatar languages (WG2 N4071/N4072; replaces L2/11-138) (英語)
U+08B2 1 L2/12-181 Lorna Priest (9 May 2012), Proposal to add Arabic Letter Zain with Inverted V Above (revised) (英語)
8.0 U+08B3..08B4,08E3 3 L2/08-429 Seyed Mohamed Buhari (4 December 2008), Additional Arabic letters needed for Arwi Script (英語)
L2/09-143 Seyed Buhari (15 April 2009), Additional Arabic letters needed for Arwi Script (replaces L2/08-429) (英語)
L2/13-130 Roozbeh Pournader (25 June 2013), Proposal to encode three Arabic characters for Arwi (英語)
L2/13-168 Naga Ganesan (29 July 2013), Comment on L2/13-130: Writing classical Tamil in Arabic script (英語)
9.0 U+08B6..08BA 5 L2/13-178 Hamid Banfunzi (6 September 2013), Proposal to encode five Arabic script characters for the Bravanese (英語)
L2/13-223 Roozbeh Pournader (7 November 2013), Proposal to encode four Arabic characters for Bravanese (revised; WG2 N4498) (英語)
L2/14-293 Roozbeh Pournader; Shervin Afshar (19 January 2015), Proposal to Encode Arabic Letter Teh with Small Teh Above for Bravanese (revised) (英語)
U+08D5..08E2 14 L2/14-095 Lateef Sagar Shaikh (24 April 2014), Proposal to encode Quranic marks used in Quran published in Pakistan (英語)
L2/14-105 Roozbeh Pournader (30 April 2014), Proposal to encode fourteen Pakistani Quranic marks (英語)
U+08D4 1 L2/14-148 Lateef Sagar Shaikh (1 July 2014), Proposal to encode Quranic mark Ar-Rbaa used in Quran published in Pakistan (英語)
U+08BB..08BD 3 L2/14-207 Roozbeh Pournader (8 August 2014), Implications of the Unicode Arabic model for the Warsh orthography (revised) (英語)
L2/14-211 Lorna Evans (29 August 2014), Proposal to encode Warsh-based Arabic script characters (replaces L2/14-104) (英語)
11.0 U+08D3 1 L2/15-329 Mussa A. A. Abudena (2 December 2015), Proposal to encode Quranic marks used in Quran published in Libya (英語)
L2/16-044 Mussa A. A. Abudena (27 January 2016), Proposal to encode Quranic marks used in Quran published in Libya with Commentary (supersedes L2/15-329) (英語)
L2/16-056 Lateef Sagar Shaikh (24 February 2016), Proposal to encode Al-Dani Quranic marks used in Quran published in Libya (英語)
13.0 U+08BE..08C2 5 L2/18-032 Lateef Sagar Shaikh (17 January 2018), Proposal to include Hindko alphabets (英語)
L2/18-174 Deborah Anderson; Roozbeh Pournader (3 May 2018), Hindko additions for Arabic (英語)
U+08C3..08C4 2 L2/18-094 Lorna Evans; Andy Warren-Rothlin (26 April 2018), Proposal to encode additional Arabic script characters for Hausa (英語)
U+08C7 1 L2/19-111 Lorna Evans; M. G. Abbas Malik (1 May 2019), Proposal to encode ARABIC LETTER LAM WITH SMALL ARABIC LETTER TAH ABOVE (英語)
U+08C5..08C6 2 L2/19-118 Neil Patel; Charles Riley; Jesus MacLean (19 April 2019), Proposal to add Arabic letter JEEM WITH THREE DOTS ABOVE and JEEM WITH THREE DOTS BELOW (英語)
14.0 U+08C8 1 L2/19-252 Lateef Sagar Shaikh (2 July 2019), Proposal to include Balti alphabet ARABIC LETTER GRAF (英語)
U+08B5 1 L2/19-313 Marijn van Putten; Roozbeh Pournader (29 September 2019), Proposal to encode an Arabic qaf with dot below (英語)
U+08C9..08D2 10 L2/19-306 Roozbeh Pournader; Deborah Anderson (29 September 2019), Arabic additions for Quranic orthographies (英語)
L2/19-393 Azzeddine Lazrek (4 December 2019), Comments about "Arabic additions for Quranic orthographies" proposition (英語)
L2/20-041 Yannis Haralambous (9 January 2020), Comments on L2/19-306 Arabic additions for Quranic orthographies (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

編集
  1. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab Proposal to add Arabic script characters for African and Asian languages (revised)” (英語). Unicode (2010年8月12日). 2024年6月12日閲覧。
  2. ^ a b c d e f g h i j k l m n o p q r s t "The Unicode Standard, Version 15.1 - U08A0.pdf" (PDF). The Unicode Standard (英語). 2024年6月12日閲覧
  3. ^ Lorna Priest; Martin Hosken (2010年10月29日). “Proposal to add ARABIC LETTER BEH WITH HAMZA ABOVE” (英語). Unicode. 2024年6月12日閲覧。
  4. ^ 恐らくIPA:[ʄ̊]
  5. ^ 恐らくIPA:[ɗ̥]
  6. ^ a b c d e Ilya Yevlampiev; Karl Pentzlin, Nurlan Joomagueldinov (2011年4月29日). “Proposal to encode Arabic characters used for Bashkir, Belarusian, Crimean Tatar, Karachay, Karakalpak, and Tatar languages” (英語). Unicode. 2024年6月12日閲覧。
  7. ^ Lorna Priest (2012年5月9日). “Proposal to add Arabic Letter Zain with Inverted V Above (revised)” (英語). Unicode. 2024年6月12日閲覧。
  8. ^ a b Marijn van Putten; Roozbeh Pournader (2019年9月29日). “Proposal to encode an Arabic qaf with dot below” (英語). Unicode. 2024年6月12日閲覧。
  9. ^ a b c d e Hamid Banfunzi (2013年9月6日). “Proposal to encode five Arabic script characters for the Bravanese” (英語). Unicode. 2024年6月12日閲覧。
  10. ^ a b Lorna Evans; Andy Warren-Rothlin (2018年4月26日). “Proposal to encode additional Arabic script characters for Hausa” (英語). Unicode. 2024年6月12日閲覧。
  11. ^ Neil Patel; Charles Riley, Jesus MacLean (2019年4月19日). “Proposal to add Arabic letter JEEM WITH THREE DOTS ABOVE and JEEM WITH THREE DOTS BELOW” (英語). Unicode. 2024年6月12日閲覧。
  12. ^ Lorna Priest Evans; M. G. Abbas Malik (2019年5月1日). “Proposal to encode ARABIC LETTER LAM WITH SMALL ARABIC LETTER TAH ABOVE” (英語). Unicode. 2024年6月12日閲覧。
  13. ^ Lateef Sagar Shaikh (2019年7月2日). “Proposal to include Balti alphabet ARABIC LETTER GRAF” (英語). Unicode. 2024年6月12日閲覧。
  14. ^ a b c d e f g h i Roozbeh Pournader; Deborah Anderson (2019年9月29日). “Arabic additions for Quranic orthographies” (英語). Unicode. 2024年6月12日閲覧。
  15. ^ a b Mussa A. A. Abudena (2015年11月29日). “Proposal to encode Quranic marks used in Quran published in Libya (Narration of Qaloon with script Aldani)” (英語). Unicode. 2024年6月12日閲覧。
  16. ^ Lateef Sagar Shaikh (2014年7月1日). “Proposal to encode Quranic mark Ar-Rbaa used in Quran published in Pakistan” (英語). Unicode. 2024年6月12日閲覧。
  17. ^ a b c d e f g h i j k l m Lateef Sagar Shaikh (2014年4月24日). “Proposal to encode Quranic marks used in Quran published in Pakistan” (英語). Unicode. 2024年6月12日閲覧。
  18. ^ a b c d e f g h i j k l m Roozbeh Pournader (2014年4月30日). “Proposal to encode fourteen Pakistani Quranic marks” (英語). Unicode. 2024年6月12日閲覧。
  19. ^ 間で息を吸い直さず、という意味か? 原文:Here the reciter can make a pause to some extent but should start the next word in same breath.
  20. ^ a b c Roozbeh Pournader (2010年4月1日). “Proposal to encode four combining Arabic characters for Koranic use (revised)” (英語). Unicode. 2024年6月12日閲覧。
  21. ^ Lorna Priest (2011年2月17日). “Proposal to add Arabic Mark Sideways Noon Ghunna (revised)” (英語). Unicode. 2024年6月12日閲覧。

関連項目

編集