削除された内容 追加された内容
ShizuShizu (会話 | 投稿記録)
32行目:
{{main|UTF-8}}
: 可変長(1-4バイト)の8ビット符号単位で表現する文字符号化形式及び文字符号化スキーム。ASCIIに対して[[上位互換]]となっており、文字の境界が明確である、UTF-16符号化スキームやUTF-32符号化スキームとの変換・逆変換に際して乗除算などの高負荷処理が必要ない、などの特長を持ち、インターネットではもっとも一般的に利用されている。
:なお、UTF-8はもともと8ビットを符号単位とするUTF-8でためBOM(バイト順マーク;後述)BOMを付与する必要ないが、UTF-8であることが識別できるようデータストリームの先頭に EF BB BF(U+FEFFのUTF-8での表現)の3バイトが付与されることがある。UTF-8のBOMはバイト順を表すものではなく、UTF-16符号化スキーム等における「真の意味でのBOM」と同じコードポイントを利用しているがゆえに慣用的にこう呼ばれているに過ぎない。
; UTF-16
{{main|UTF-16}}