アラビア文字補助(アラビアもじほじょ、英語: Arabic Supplement)は、Unicodeの15個目のブロック

アラビア文字補助
Arabic Supplement
範囲 U+0750..U+077F
(48 個の符号位置)
基本多言語面
用字 アラビア文字
主な言語・文字体系
割当済 48 個の符号位置
未使用 0 個の保留
Unicodeのバージョン履歴
4.1 30 (+30)
5.1 48 (+18)
テンプレートを表示

解説 編集

アラビア語モロッコ方言(ダリジャ)、ジャウィ文字(かつてのマレー語、及び現在タイなどで話されているジャウィ語を表記するための文字)、サライキ語ブルシャスキー語カラム語などのいくつかの言語を表記するためのアラビア文字のうち、アラビア文字ブロックに収録されていないものの一部が収録されている。

通常のアラビア文字と同様に子音のみを記述するアブジャドであり、右から左へと横書き(右横書き)され、文字が書かれる単語内の位置によって独立形・語頭形・語中形・語末形の4種類の形状を取る。

本ブロックはUnicodeのバージョン4.1で初めて追加された。

収録文字 編集

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
拡張アラビア文字
U+0750 ݐ ARABIC LETTER BEH WITH THREE DOTS HORIZONTALLY BELOW フラニ語東部方言(フルフルディ語)[1][2]

子音[ʔʲ]を表す。[1][2][3]

U+0751 ݑ ARABIC LETTER BEH WITH DOT BELOW AND THREE DOTS ABOVE フラニ語西部方言(プラー語)[1][2]

子音[p]を表す。[1][2]

U+0752 ݒ ARABIC LETTER BEH WITH THREE DOTS POINTING UPWARDS BELOW フラニ語西部方言(プラー語)、ザルマ語ニジェール国内で)、ソンガイ語英語版ニジェール国内で)[1][2]ウォロフ語

フラニ語では子音[ɓ]を[1][2]、ザルマ語、ソンガイ語[1][2]及びウォロフ語では子音[p]を表す。

U+0753 ݓ ARABIC LETTER BEH WITH THREE DOTS POINTING UPWARDS BELOW AND TWO DOTS ABOVE ハウサ語[1][2]

子音[c]を表す。[1][2]

U+0754 ݔ ARABIC LETTER BEH WITH TWO DOTS BELOW AND DOT ABOVE ザルマ語マリ国内で)、ソンガイ語英語版マリ国内で)、フラニ語[1][2]

子音[ɲ]を表す。[1][2]

U+0755 ݕ ARABIC LETTER BEH WITH INVERTED SMALL V BELOW フラニ語西部方言(プラー語)、ザルマ語ニジェール国内で)、ソンガイ語英語版ニジェール国内で)[1][2]

U+0752 ݒの変種。[1][2]

U+0756 ݖ ARABIC LETTER BEH WITH SMALL V フラニ語ザルマ語ソンガイ語英語版[1][2]ウォロフ語

子音[c]を表す。[1][2]

U+0757 ݗ ARABIC LETTER HAH WITH TWO DOTS ABOVE ザルマ語マリ国内で)、ソンガイ語英語版マリ国内で)、フラニ語東部方言(フルフルディ語)[1][2]

子音[ŋ]を表す。[1][2]

U+0758 ݘ ARABIC LETTER HAH WITH THREE DOTS POINTING UPWARDS BELOW ザルマ語ニジェール国内で)、ソンガイ語英語版ニジェール国内で)[1][2]

子音[t͡ʃ]を表す。[1][2]

U+0759 ݙ ARABIC LETTER DAL WITH TWO DOTS VERTICALLY BELOW AND SMALL TAH サライキ語[4][5]

子音[]を表す。

U+075A ݚ ARABIC LETTER DAL WITH INVERTED SMALL V BELOW アフリカのいくつかの言語で[ɗ]を表す。[1][6]
U+075B ݛ ARABIC LETTER REH WITH STROKE アフリカのいくつかの言語で[ɽ]を表す。[1][7]
U+075C ݜ ARABIC LETTER SEEN WITH FOUR DOTS ABOVE シナー語[4][5]トルワル語

子音[ʂ]を表す。[5]

U+075D ݝ ARABIC LETTER AIN WITH TWO DOTS ABOVE ソンガイ語英語版フラニ語東部方言(フルフルディ語)[1]

ソンガイ語では子音[ɡ]を、フラニ語では前鼻音化した子音[ᵑɡ]を表す。[1]

U+075E ݞ ARABIC LETTER AIN WITH THREE DOTS POINTING DOWNWARDS ABOVE ハウサ語ザルマ語ニジェール国内で)、ソンガイ語英語版ニジェール国内で)[1]

ハウサ語では唇音化した子音[ɡʷ]を、ザルマ語及びソンガイ語では子音[ŋ]を表す。[1]

U+075F ݟ ARABIC LETTER AIN WITH TWO DOTS VERTICALLY ABOVE ザルマ語マリ国内で)、ソンガイ語英語版マリ国内で)[1]

子音[ɡ]を表す。[1]

U+0760 ݠ ARABIC LETTER FEH WITH TWO DOTS BELOW フラニ語東部方言(フルフルディ語)、ザルマ語マリ国内で)、ソンガイ語英語版マリ国内で)[1]

子音[p]を表す。

U+0761 ݡ ARABIC LETTER FEH WITH THREE DOTS POINTING UPWARDS BELOW アフリカのいくつかの言語で[β]を表す。[1]
U+0762 ݢ ARABIC LETTER KEHEH WITH DOT ABOVE ジャウィ文字で用いられる。U+06AC ڬよりもこちらを使う方が好ましい。[4][8]

子音[ɡ]を表す。

U+0763 ݣ ARABIC LETTER KEHEH WITH THREE DOTS ABOVE アラビア語モロッコ方言(ダリジャ)、ベルベル語[8]ブルシャスキー語[4][8]

ベルベル語では子音[ɡ]を表す。

U+0764 ݤ ARABIC LETTER KEHEH WITH THREE DOTS POINTING UPWARDS BELOW アフリカのいくつかの言語で[ɠ̊]を表す。[1][9]
U+0765 ݥ ARABIC LETTER MEEM WITH DOT ABOVE フラニ語東部方言(フルフルディ語)[1]

子音[ɓ]を表す。

U+0766 ݦ ARABIC LETTER MEEM WITH DOT BELOW マバ語[4][2]
U+0767 ݧ ARABIC LETTER NOON WITH TWO DOTS BELOW アルウィー語英語版(アラブ・タミル語とも呼ばれる)[4]、アフリカのいくつかの言語[1]ウォロフ語

子音[ɲ]を表す。

U+0768 ݨ ARABIC LETTER NOON WITH SMALL TAH サライキ語パハリ・ポスワリ語英語版[4][5]シナー語シャームキー文字西パンジャーブ語ラフンダー語

子音[ɳ]を表す。

U+0769 ݩ ARABIC LETTER NOON WITH SMALL V グジャール語[4][5]

子音[ɳ]を表す。[5]

U+076A ݪ ARABIC LETTER LAM WITH BAR マールワーリー語[10]

子音[𝼈](反り舌側面弾き音、[ɭ̆]あるいは[ɺ̢]とも書かれる)を表す。

U+076B ݫ ARABIC LETTER REH WITH TWO DOTS VERTICALLY ABOVE トルワル語オルムル語英語版[4][11]

オルムル語では子音[ʑ]を表す。

U+076C ݬ ARABIC LETTER REH WITH HAMZA ABOVE オルムル語英語版[4][11]

有声歯茎硬口蓋摩擦音[ʑ]を表す。[4]

U+076D ݭ ARABIC LETTER SEEN WITH TWO DOTS VERTICALLY ABOVE カラム語オルムル語英語版[4][11]

オルムル語では子音[ɕ]を表す。

コワール語用の追加
U+076E ݮ ARABIC LETTER HAH WITH SMALL ARABIC LETTER TAH BELOW 子音[ɖ͡ʐ]を表す。[12]
U+076F ݯ ARABIC LETTER HAH WITH SMALL ARABIC LETTER TAH AND TWO DOTS 子音[ʈ͡ʂ]を表す。[12]
U+0770 ݰ ARABIC LETTER SEEN WITH SMALL ARABIC LETTER TAH AND TWO DOTS 子音[ʂ]を表す。[12]
U+0771 ݱ ARABIC LETTER REH WITH SMALL ARABIC LETTER TAH AND TWO DOTS 子音[ʐ]を表す。[12]
トルワル語用の追加
U+0772 ݲ ARABIC LETTER HAH WITH SMALL ARABIC LETTER TAH ABOVE 子音[ɖ͡ʐ]を表す。[12]
ブルシャスキー語用の追加
U+0773 ݳ ARABIC LETTER ALEF WITH EXTENDED ARABIC-INDIC DIGIT TWO ABOVE 短母音の[a]を表す。なお、ブルシャスキー語において通常のアリフは緊張を伴わない長母音[aː]を表す。[12]
U+0774 ݴ ARABIC LETTER ALEF WITH EXTENDED ARABIC-INDIC DIGIT THREE ABOVE 緊張を伴う長母音[ˈaː]を表す。ラテン文字での翻字ではáaと鋭アクセント記号を用いて表される。[12]
U+0775 ݵ ARABIC LETTER FARSI YEH WITH EXTENDED ARABIC-INDIC DIGIT TWO ABOVE 短母音[i]を表す。[12]
U+0776 ݶ ARABIC LETTER FARSI YEH WITH EXTENDED ARABIC-INDIC DIGIT THREE ABOVE 緊張を伴う長母音[ˈiː]を表す。[12]
U+0777 ݷ ARABIC LETTER FARSI YEH WITH EXTENDED ARABIC-INDIC DIGIT FOUR BELOW 子音[ɻ]を表す。[12]
U+0778 ݸ ARABIC LETTER WAW WITH EXTENDED ARABIC-INDIC DIGIT TWO ABOVE 短母音[o]を表す。[12]
U+0779 ݹ ARABIC LETTER WAW WITH EXTENDED ARABIC-INDIC DIGIT THREE ABOVE 緊張を伴う長母音[ˈoː]を表す。[12]
U+077A ݺ ARABIC LETTER YEH BARREE WITH EXTENDED ARABIC-INDIC DIGIT TWO ABOVE 短母音[e]を表す。[12]
U+077B ݻ ARABIC LETTER YEH BARREE WITH EXTENDED ARABIC-INDIC DIGIT THREE ABOVE 緊張を伴う長母音[ˈeː]を表す。[12]
U+077C ݼ ARABIC LETTER HAH WITH EXTENDED ARABIC-INDIC DIGIT FOUR BELOW 子音[t͡sʰ]を表す。[12]
U+077D ݽ ARABIC LETTER SEEN WITH EXTENDED ARABIC-INDIC DIGIT FOUR ABOVE 子音[ʂ]を表す。[12]
早期ペルシャ語用の追加
U+077E ݾ ARABIC LETTER SEEN WITH INVERTED V 12世紀~13世紀のペルシア語正書法で使用されており、[s]または類似のさまざまな音素を表す可能性がある。 現代ペルシャ語では、 [s] の音で発音され、U+0633 س ARABIC LETTER SEEN で書かれる。[13]
U+077F ݿ ARABIC LETTER KAF WITH TWO DOTS ABOVE ペルシア語の方言の音素[ɡ]または鼻音化された[ŋ]を表すために使用された。 後の正書法では、これらは通常、 U+06AF گ ARABIC LETTER GAF 、 U+06AB ګ ARABIC LETTER KAF WITH RING 、または U+06AD ڭ ARABIC LETTER NG のいずれかに置き換えられた。[13]

小分類 編集

このブロックの小分類は「拡張アラビア文字」(Extended Arabic letters)、「コワール語用の追加」(Additions for Khowar)、「トルワル語用の追加」(Addition for Torwali)、「ブルシャスキー語用の追加」(Additions for Burushaski)、「早期ペルシャ語用の追加」(Additions for early Persian)の6つとなっている。[4]

拡張アラビア文字(Extended Arabic letters 編集

この小分類にはアラビア文字のうち、主にアフリカの諸言語の正書法で使用される文字を収録している。[4]Unicodeのバージョン4.1で本ブロックと共に追加された。

コワール語用の追加(Additions for Khowar 編集

この小分類にはアラビア文字のうち、パキスタンカイバル・パクトゥンクワ州チトラルギルギット・バルティスタンギザル県、上スワート英語版の一部などで話されているインド・ヨーロッパ語族インド・イラン語派ダルド語群に属するコワール語(チトラリー語)用の追加文字が収録されている。Unicodeのバージョン5.1で追加された。

トルワル語用の追加(Addition for Torwali 編集

この小分類にはアラビア文字のうち、パキスタンのカイバル・パクトゥンクワ州スワート英語版コヒスタン英語版に居住するトルワル人の間で話されているインド・ヨーロッパ語族インド・イラン語派ダルド語群に属するトルワル語用の追加文字が1文字のみ収録されている。Unicodeのバージョン5.1で追加された。

ブルシャスキー語用の追加(Additions for Burushaski 編集

この小分類にはアラビア文字のうち、パキスタン北部のカラコルム山脈及びヒンドゥークシュ山脈などに居住するブルショー人の間で話されている系統的に孤立した言語ブルシャスキー語を表記するための追加文字が収録されている。Unicodeのバージョン5.1で追加された。

早期ペルシャ語用の追加(Additions for early Persian 編集

この小分類には10~11世紀の古代ペルシャ語及び11~16世紀の古典ペルシャ語(総称して早期ペルシャ語(英語: early Persian)と呼ばれる)の正書法にかつて用いられていた文字[13]を2文字収録している。Unicodeのバージョン5.1で追加された。

文字コード 編集

アラビア文字補助(Arabic Supplement)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+075x ݐ ݑ ݒ ݓ ݔ ݕ ݖ ݗ ݘ ݙ ݚ ݛ ݜ ݝ ݞ ݟ
U+076x ݠ ݡ ݢ ݣ ݤ ݥ ݦ ݧ ݨ ݩ ݪ ݫ ݬ ݭ ݮ ݯ
U+077x ݰ ݱ ݲ ݳ ݴ ݵ ݶ ݷ ݸ ݹ ݺ ݻ ݼ ݽ ݾ ݿ
注釈
1.^バージョン15.1時点


履歴 編集

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
4.1 U+0759,075C,0768..0769 4 L2/02-274 Jonathan Kew (2 August 2002), Proposal for extensions to the Arabic block (英語)
L2/03-210 Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語)
L2/03-223 Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語)
U+0750..0758,075A..075B,075D..0761,0764..0767 20 L2/03-044 Jonathan Kew (11 February 2003), Encoding Arabic extensions: options for the future of Unicode (英語)
L2/03-051 Jonathan Kew (18 February 2003), Images of potential extended Arabic characters (英語)
L2/03-168 Jonathan Kew (30 May 2003), Proposal to encode Arabic-script letters for African languages (英語)
L2/03-210 Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語)
L2/03-223 Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語)
U+0762..0763 2 L2/03-176 Jonathan Kew (8 June 2003), Proposal to encode Jawi and Moroccan Arabic GAF characters (英語)
L2/03-210 Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語)
L2/03-223 Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語)
U+076A 1 L2/03-228 Jonathan Kew (29 July 2003), Proposal to encode Marwari Lam with Bar Character (英語)
U+076B..076D 3 L2/04-025 Jonathan Kew (21 January 2004), Proposal to encode 5 new Arabic script characters [WG2-N2723] (英語)
5.1 U+076E..077D 16 L2/06-149 Elena Bashir; Sarmad Hussain; Deborah Anderson (9 May 2006), Proposal to add characters needed for Khowar, Torwali, and Burushaski (英語)
L2/06-150 Elena Bashir (9 May 2006), Letters of support for characters needed for Khowar, Torwali, and Burushaski (英語)
U+077E..077F 2 L2/06-345 Michael Everson; Roozbeh Pournader; Elnaz Sarbar (8 November 2006), Proposal to encode eight Arabic characters for Persian and Azerbaijani (WG2 N3180R - Revised) (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典 編集

  1. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af Jonathan Kew (2003年2月18日). “Images of potential extended Arabic characters” (英語). Unicode. 2024年2月20日閲覧。
  2. ^ a b c d e f g h i j k l m n o p q r s t Jonathan Kew (2003年5月30日). “Proposal to encode Arabic-script letters for African languages” (英語). Unicode. 2024年2月20日閲覧。
  3. ^ 原文ではラテン文字で"ƴ"と転写されており、これはハウサ語で子音/ʔʲ/を表す文字である。現代のフラニ語では通常、ラテン文字で"yy"と綴られる。
  4. ^ a b c d e f g h i j k l m n "The Unicode Standard, Version 15.1 - U0750.pdf" (PDF). The Unicode Standard (英語). 2024年2月20日閲覧
  5. ^ a b c d e f Jonathan Kew (2002年8月2日). “Proposal for extensions to the Arabic block” (英語). Unicode. 2024年2月20日閲覧。
  6. ^ 原文では”ɗ”のフックが左右逆向きに付いた記号が使われている。
  7. ^ 原文では"ṛ"と表記されている。他のドットビローが付いた子音の発音と比較するに、/r/の反舌音を表しているものと見られる。
  8. ^ a b c Jonathan Kew (2003年6月8日). “Proposal to encode Jawi and Moroccan Arabic GAF characters” (英語). Unicode. 2024年2月20日閲覧。
  9. ^ 原文では"ƙ"のフックを左右逆向きにしたような記号が用いられている。"ƙ"はIPA(国際音声記号)においてかつて無声軟口蓋入破音を表していた記号だが、のちに廃止されたものである。
  10. ^ Jonathan Kew (2003年7月29日). “Proposal to encode Marwari Lam with Bar Character” (英語). Unicode. 2024年2月20日閲覧。
  11. ^ a b c Jonathan Kew (2004年1月21日). “Proposal to encode 5 new Arabic script characters [WG2-N2723]” (英語). Unicode. 2024年2月20日閲覧。
  12. ^ a b c d e f g h i j k l m n o p Elena Bashir; Sarmad Hussain, Deborah Anderson (2006年5月9日). “Proposal to add characters needed for Khowar, Torwali, and Burushaski” (英語). Unicode. 2024年2月20日閲覧。
  13. ^ a b c Michael Everson; Roozbeh Pournader, Elnaz Sarbar (2006年11月8日). “Proposal to encode eight Arabic characters for Persian and Azerbaijani (WG2 N3180R - Revised)” (英語). Unicode. 2024年2月20日閲覧。

関連項目 編集