「UTF-8」の版間の差分
削除された内容 追加された内容
リンク切れ、Citeテンプレート |
編集の要約なし |
||
213行目:
Unicodeの符号位置を2進表記したものを、上のビットパターンのx, yに右詰めに格納する。最短のバイト数で符号化するため、yの部分には最低1回は1が出現する。符号化されたバイト列は、[[エンディアン|バイト順]]に関わらず左から順に出力する。これにより4バイトで21bit、6バイトで31bitまで表現することができる。
1バイト目の先頭の連続するビット "1"(その後にビット "0" が1つ付く)の個数で、その文字のバイト数が
7バイト以上の文字は規定されないため、<code>0xFE、0xFF</code>は使用されない。このため、[[バイトオーダーマーク|バイト順マーク]] (BOM) に<code>0xFEと0xFF</code>を使用するUTF-16やUTF-32が、UTF-8と混同されることはない。
|