2018年10月6日 (土) 07:13時点における版編集 Wdpp (会話 \| 投稿記録) 拡張承認された利用者 6,983 回編集 m Category:RFCを追加 ← 古い編集		2019年3月11日 (月) 18:46時点における版編集取り消し 111.239.37.196 (会話) 編集の要約なしタグ: ビジュアルエディター: 中途切替新しい編集 →
143行目: ** ただし、他のUnicodeの符号化と同様に、単にバイト列の比較では文字列が同一か判断できない場合がある。詳細は、[[Unicodeの等価性]]及び[[Unicode正規化\|正規化]]を参照のこと。 * [[UTF-16]]や[[UTF-32]]と異なり、バイト単位の入出力を行うため、[[エンディアン\|バイト順]]の影響がない。 * ~~31bit~~21bitまで表現できるため、[[サロゲートペア]]を使用する必要がない。 * ASCII文字が主体の文書であれば、ほとんどデータサイズを増やさずにUnicodeのメリットを享受できる。UTF-16やUTF-32では、データサイズはほぼ2倍、4倍となる。 * 複数のUTF-8文字列を、単なる符号なし8ビット整数の配列とみなして辞書順ソートした結果は、Unicodeの符号位置の辞書順のソート結果（すなわちUTF-32に変換した後にソートした結果）と等しくなる。これに対して、サロゲートペアを含むUTF-16文字列を符号なし16ビット整数の配列とみなしてソートした結果は、Unicodeの符号位置の辞書順のソート結果と異なりうる。

「UTF-8」の版間の差分