「Specials (Unicode block)」の版間の差分

文体や語順等、不自然な部分を一部修正。
(文体や語順等、不自然な部分を一部修正。)
 
{{Infobox Unicode block|blockname=Specials|rangestart=FFF0|rangeend=FFFF|script1=[[Script (Unicode)#Special script property values|Common]]共通|1_0_0=1|2_1=1|3_0=3|nonchar=2|note=<ref>{{cite web|url=https://www.unicode.org|title=Unicode character database|work=The Unicode Standard|accessdate=2016-07-09}}</ref><ref>{{cite web|url=https://www.unicode.org/versions/enumeratedversions.html|title=Enumerated Versions of The Unicode Standard|work=The Unicode Standard|accessdate=2016-07-09}}</ref>}} '''Specials'''([[ATOK]]では「特殊用途文字」と訳される)は、[[Unicode]]においてU + FFF0 〜 FFFFの[[基本多言語 (文字コード)|Basic Multilingual Planeの]]最後に割り当てられる短い[[Unicode]]ブロックである。 これらの16個のコードポイントのうち、5個がUnicode 3.0以降に割り当てられています
 
* <templatestyles src="Mono/styles.css" />
* <templatestyles src="Mono/styles.css" /> {{Unichar|FFFA|INTERLINEAR ANNOTATION SEPARATOR}} 注釈文字の開始をマークします
* <templatestyles src="Mono/styles.css" /> {{Unichar|FFFB|INTERLINEAR ANNOTATION TERMINATOR}} 注釈ブロックの終わりをマーク
* <templatestyles src="Mono/styles.css" /> <span id="OBJ">{{Unichar|FFFC|OBJECT REPLACEMENT CHARACTER}} </span> <span id="OBJ"><span class="smallcaps smallcaps-smaller" data-ve-ignore="true">OBJECT REPLACEMENT CHARACTER</span></span> 、たとえば[[複合文書|複合ドキュメント]]など、指定されていない別のオブジェクトのテキスト内のプレースホルダー。を置換する記号<span id="OBJ"><span class="smallcaps smallcaps-smaller" data-ve-ignore="true">OBJECT REPLACEMENT CHARACTER</span></span>
* <templatestyles src="Mono/styles.css" /> {{Unichar|FFFD|REPLACEMENT CHARACTER}} 不明な文字、認識できない文字、表現できない文字を置き換えるために使用される
* <templatestyles src="Mono/styles.css" /> {{Unichar|FFFE|}} 文字ではありません。
* <templatestyles src="Mono/styles.css" /> {{Unichar|FFFF|}} 文字ではありません。
 
FFFEとFFFFは通常の意味で割り当てられていないが、[[Unicode文字のマッピング|ませんが、Unicode文字ではないこと]]が[[Unicode文字のマッピング|保証されています]] これらはテキストのエンコーディングスキーム符号化を推測するために使用できますこれは、これらの文字を含むテキストはすべて、正しくエンコード符号化されたUnicodeテキストではないためですとされる Unicodeの {{Unichar|FEFF|[[Byte order mark]]}} 文字をUnicodeテキストの先頭に挿入して[[エンディアン]]を示すことができます。そのようなテキストを読み取り、0xFFFEに遭遇したプログラムは、次のすべての文字のバイト符号のを切り替える必要があることを認識しま。 <templatestyles src="Mono/styles.css" />
[[ファイル:Replacement_character.svg|サムネイル| 置換文字 ]]
�(多くの場合、白い疑問符の付いた黒いひし形または空の四角いボックス)は、 [[Unicode]]規格の''Specials''テーブルのにおいてコードポイントU + FFFDに割り当てられている記号です。 これはあり、システムがデータストリーム文字列を正しいシンボルにレンダリングできない場合の問題を示すために使用されます これは通常データが無効であるか、どの文字とも一致しない場合に表示されます
 
仮に、[[UTF-8]]での入力を想定したテキストエディタで、[[ISO/IEC 8859-1|ISO-8859-1]]エンコード( <code>0x66 0xFC 0x72</code> )でドイツ語の単語 "für"( "for"を意味する)を含むテキストファイルを考えます。 このファイルは、入力が[[UTF-8|UTF-8で]]ある開いた想定するテキストエディタで開かれます 最初と最後のバイトは[[ASCII]]において有効なUTF-8エンコードであるが、中間バイト( <code>0xFC</code> )はUTF-8で有効なバイトではありませんない したがって、テキストエディターはこのバイトを置換文字記号に置き換えて、有効なUnicode [[符号点|コードポイント]]文字列を生成できますこのときf�r".表示される。さらに、正しく実装されていないテキストエディタにおいては、UTF-8形式に置換して保存される可能性がある。この場合ときテキストファイルのデータ<code>0x66 0xEF 0xBF 0xBD 0x72</code>-8859-1となり、「fï¿1/2r」として表示される([[文字化け]]を参照)。置換はべてのエラーで同じであるため、元の文字を復元することはできない
 
== コード表 ==
正しく実装されていないテキストエディタは、置換をUTF-8形式で保存する可能性があります。テキストファイルのデータは次のようになります: <code>0x66 0xEF 0xBF 0xBD 0x72</code> -8859-1では「fï¿1/2r」として表示されます( [[文字化け|文字化けを]]参照)。 置換はすべてのエラーで同じであるため、元の文字を復元することはできません。 より良い(しかし実装が難しい)設計は、エラーを含む元のバイトを保持し、テキストを''表示する''ときにのみ置換に変換''する''ことです。 これにより、テキストエディターは元のバイトシーケンスを保存しながら、ユーザーにエラーインジケーターを表示できます。
 
それはますます一般的になっています{{いつ|date=August 2019}} ソフトウェアが、バイトがISO-8859-1などの別のバイトベースのエンコーディングであると推測して、無効なUTF-8を解釈する。 これにより、有効なUTF-8と無効なUTF-8の両方を貼り付けて正しく表示できます。 WebページがISO-8859-1(または[[Windows-1252]] )を使用していて、エンコーディングをUTF-8として指定している場合、ほとんどのWebブラウザーはすべての非ASCII文字を�として表示するために使用されましたが、新しいブラウザー{{いつ|date=August 2019}} エラーのあるバイトを個別にWindows-1252の文字に変換するため、�はあまり表示されません。
 
== Unicodeチャート ==
{{Unicode chart Specials}}
 
== 歴史 ==
次のUnicode関連のドキュメント以下に示す文書群は、Specialsブロック特定の文字を定義する目的とプロセス過程記録ていますたものである
{| class="wikitable collapsible"
![[Unicode|Version]]
|}
 
== 参照 ==
== こちらもご覧ください ==
 
* [[Unicode]]文字
 
== 参考文献 ==
<references group="" responsive="1"></references>
{{Reflist}}
[[カテゴリ:Unicodeのブロック]]