「マルチバイト文字」の版間の差分

削除された内容 追加された内容
m 白紙化
Yh (会話 | 投稿記録)
編集の要約なし
1行目:
'''2バイトコード'''はで1文字2バイトで表される文字の俗称である。
いわゆる'''全角文字'''も同義で用いられる。
正式な定義は無いが、[[Shift JIS]]において2バイトで表される
[[JIS X 0208]]の文字集合全て、
およびShift JISの95区以降の拡張部分の文字を指している例が多い。
もっとも、文脈によっては東アジア圏の他の[[文字コード]]
([[EUC-JP]]、[[EUC-KR]]、[[BIG5]]、[[GB2312]]など)
のうち一つまたは全てにおいて2バイトで表される
漢字やハングルを指して2バイトコードと呼ぶこともある。
また、具体的な文字コードを仮定せず
[[ASCII]]以外の文字の意味で用いられることさえある。
 
なお、東アジア以外の国で用いられている文字コードは、
基本的に1文字1バイトであり、
これらの各国の文字が2バイトコードと呼ばれることは無い。
一部ヨーロッパ圏の文字は[[UTF-8]]であれば2バイトで表されるが、
これを2バイトコードと呼ぶ例は過去に無いと思われる。
また、[[UTF-16]]では[[ASCII]]文字を含め全ての文字が2バイトであるので、
これも有り得ないと言える。
 
以上のように2バイトコードというのは定義が曖昧な単語であり、
大抵の状況ではより適切な名称があると思われる。
一方で、一般に通りの良い呼び方であり、
常に使用を避ける必要があるほど問題のある単語ではない。