「KS X 1001」の版間の差分

削除された内容 追加された内容
TXiKiBoT (会話 | 投稿記録)
m ロボットによる 追加: zh:KS X 1001
編集の要約なし
1行目:
'''KS X 1001'''は、[[大韓民国|韓国]]で[[ハングル]]や[[漢字]]をあらわすのに用いられている[[文字コード]]([[符号化文字集合]])の規格。以前は'''KS C 5601'''といい、現在でもこの名称で呼ばれることが多い。単にKSコードとも呼ばれる。
 
[[JIS X 0208]]に似た94×94文字集合で、ハングル2350字、漢字4888字の他、[[英数字]]や[[仮名 (文字)|仮名]]など合計8226字を含んでいる。ハングルについては、[[ハングル#字母|字母]]を組み合わせて構成した1音節を1文字とみなしてコードを振る「完成型コード」であり、すべての可能な組み合わせを符号化しているわけではないので、表現できない音節が多数存在し、批判の声も多かった。[[ペプシコーラ]]の韓国法人は「ペ<small>プ</small>」({{lang|ko|펲}})の字がKS X 1001に含まれなかったため、[[1992年]]にハングル表記をKS X 1001に存在する別の「ペ<small>プ</small>」({{lang|ko|펩}})の字に変更した。<ref>[http://www2dwww.biglobekmml.ne.jp/~kmlabsnet/ehc/gairon.html 【概論】パソコン上のハングル環境]</ref>
 
漢字は読みの順に配列されている。[[朝鮮語|韓国語]]では原則として漢字は一字一音であるが、複数の読みを持つ漢字がわずかながらあり、この規格ではそのような漢字をそれぞれの読みの位置に重複して符号化していることが大きな特徴である。頭音法則により、先頭に来るかそうでないかで読みが異なるものもあるが、「盧」や「李」などのよく使われるものはそれも別の読みとみなして重複符号化している。もっとも多いのは「樂」で、4個所に重複符号化されている。この方式は、コードから文字の読みを機械的に判定できるという利点があるが、文字コードとしての大原則に反しているという批判もある。なお、このように重複符号化されている漢字は、[[Unicode]]および[[ISO/IEC 10646]]においても互換性のため1文字のみを[[CJK統合漢字]]に収録し、それ以外の文字を[[CJK互換漢字]]に収録することにより重複符号化されている。