メインメニューを開く

外字(がいじ)とは、

  • 外国(特に欧米圏)の文字のこと。この意味の外字で印刷されている新聞を外字新聞という。
  • 活版印刷の用語である組版において、使用頻度が低いため、常用漢字人名用漢字とは別(外(ほか))のケースに収められていた活字をこう呼んでいた。
  • 文字コードなどの特定の文字集合に含まれない文字のことをいう。本項で詳述。

外字とは特定の文字集合(文字コードなど)に含まれない文字のことをいう。日本で一般には、JIS規格文字コード(通常はJIS X 0208、稀にJIS X 0213JIS X 0221)に含まれない文字のことをさし、「表外字」、「拡張漢字(ベンダ選定拡張漢字)」とも呼ばれる。常用漢字に含まれない文字のことを外字ということもある。

目次

文字コードにおける外字編集

日本語1バイト文字集合における外字編集

PC98シリーズなどでは、JIS X 0201の文字以外に記号などが個別に定義されていた。これらは98文字などと呼ばれ、外字の一種である。

JIS X 0208における外字編集

1979年にJIS X 0208に含まれない文字を使用するために、未定義領域と呼ばれるエリアに独自の文字を作成する手段がとられていた。

メーカなどがシステムにあらかじめ組み込んでいた外字をシステム外字ベンダ定義文字と呼び、個々のユーザが作成した外字はユーザ外字ユーザ定義文字と呼ぶ。

ワードプロセッサなどでも、外字の作成が可能な製品も多数存在した。Microsoft Windowsの場合は、標準で附属する外字エディタというアプリケーションでユーザ外字が作成可能である。

一般にはShift_JISにおける0xF000〜0xFFFCの領域がユーザ外字領域として広く用いられてきた。

このユーザ外字領域にあらかじめ各種の文字を入れておいたフォントなどもあり、外字領域の文字しか含まれないフォントのことを外字フォントと呼ぶ。

JIS X 0208の1997年における改訂でこの未定義領域に外字を入れることが原則禁止された。

JIS X 0213における外字編集

2000年に規格化されたJIS X 0213では、Shift_JIS-2004(Shift_JISX0213)というShift_JISの符号化表現を拡張した規格が定義された。この文字コードでは、実装水準3(第3水準の文字までしか含まない)で実装する場合には、0xF000〜0xFFFCの領域を外字領域として使用してよいこととした。

JIS X 0221 (Unicode)における外字編集

Unicodeでは、外字エリアとして私用領域という名称でU+E000〜U+F8FF、U+000F0000〜U+000FFFFD、U+00100000〜U+0010FFFDに外字領域を設けてある。このうち、あとの2つは面単位で用意されているので、私用面と呼ばれる。

Windowsのユーザ外字領域であるShift_JISの0xF040〜0xF9FCはUnicodeのU+E000〜U+E757に順番に対応付けられている。(Shift_JISで0xF07Fなどの使用不可能なコードポイントは飛ばす。)

Windows付属の外字エディタではU+E758〜U+F8FFにも外字を作成可能であるが、そこに作成したものはUnicode環境でのみ使用可能となる。

WingdingsなどのシンボルフォントのグリフはUnicodeではU+F020〜U+F0FFの一部に対応付けられている。

ARIB外字や携帯電話の絵文字などこれまでは外字でしか使用できなかった文字についても、企業ロゴ等を除いて順次Unicodeに含めることが進められている。

ユーザ外字領域(Shift_JIS) 私用領域(Unicode) 文字数
0xF040 - 0xF07E U+E000 - U+E03E 63文字
0xF080 - 0xF0FC U+E03F - U+E0BB 125文字
0xF140 - 0xF17E U+E0BC - U+E0FA 63文字
0xF180 - 0xF1FC U+E0FB - U+E177 125文字
0xF240 - 0xF27E U+E178 - U+E1B6 63文字
0xF280 - 0xF2FC U+E1B7 - U+E233 125文字
0xF340 - 0xF37E U+E234 - U+E272 63文字
0xF380 - 0xF3FC U+E273 - U+E2EF 125文字
0xF440 - 0xF47E U+E2F0 - U+E32E 63文字
0xF480 - 0xF4FC U+E32F - U+E3AB 125文字
0xF540 - 0xF57E U+E3AC - U+E3EA 63文字
0xF580 - 0xF5FC U+E3EB - U+E467 125文字
0xF640 - 0xF67E U+E468 - U+E4A6 63文字
0xF680 - 0xF6FC U+E4A7 - U+E523 125文字
0xF740 - 0xF77E U+E524 - U+E562 63文字
0xF780 - 0xF7FC U+E563 - U+E5DF 125文字
0xF840 - 0xF87E U+E5E0 - U+E61E 63文字
0xF880 - 0xF8FC U+E61F - U+E69B 125文字
0xF940 - 0xF97E U+E69C - U+E6DA 63文字
0xF980 - 0xF9FC U+E6DB - U+E757 125文字
対応なし U+E758 - U+F8FF 4,520文字
対応なし U+000F0000 - U+000FFFFD 65,534文字
対応なし U+00100000 - U+0010FFFD 65,534文字

DRCS外字編集

日本のデータ放送、文字放送、字幕放送などではDRCS外字という外字が使用可能である。ARIBの文字コードではJIS X 0208の文字やARIB外字などを使用できるが、これ以外に任意の外字が自由に使用可能である。ARIBの規格で任意の外字を送信する仕組みが仕様として規定されており、この仕様をすべての受信機がサポートしていることが保障されているため、自由な外字を使用することが可能となっている。

問題点編集

外字はその文字コード情報のみでは、あらかじめどのコードにどの文字を入れているかを同期させている場合と、上記DRCS外字を使用する場合を除き、別の環境とのデータのやり取りができない。

外字登録編集

ワープロ専用機ワープロソフトWindows などのオペレーティングシステムでは、ユーザが自分で外字(ユーザー定義外字)を登録できるようになっている。

常用漢字表外字編集

常用漢字表に含まれない文字のことを表外字と呼ぶ。平成12年に表外漢字字体表国語審議会が発表し、常用漢字に含まれない漢字の字形のよりどころを規定した。

人名・地名用外字編集

人名を扱うシステムにおいて人名用外字が使われていた。日本の人名に使われる文字 (漢字や変体仮名など) は住基ネット統一文字戸籍統一文字の中に殆ど含まれており、これらの文字はユニコードコンソーシアムやISOでの標準化が行われ、2017年6月のUnicode 10.0及び2017年12月のISO/IEC 10646:2017でほぼ全てが収録されるに至った。これらの文字に対応するフォントには、IPAmj明朝花園明朝が存在する。

中国語を表記できないシステムにおいて、中国や韓国の人名・地名を表記するために多くの外字が使われてきたが、現在はUnicode及び中国語フォントが普及したため外字の使用も減っている。また、日本語と中国語の両方に対応する多言語フォントも登場している (源ノ角ゴシック源ノ明朝Notoフォント、ヒラギノ角ゴ、UD新ゴ金剛黒体Droidフォントなど)。

その他、民生向け人名外字フォントには、DynaFont 人名記号外字 (DynaComware)、筆まめ人名外字 (SOURCENEXT)、人名外字1500/人名外字PRO (イースト)、Super名字太郎 (ビープラス)などが存在する。

入管正字・入管外字編集

日本では法務省が漢字圏の氏名の表記のために入管正字を定めているが、入管正字にはかつてUnicodeに含まれない文字も含まれていた。しかし、Unicode 10.0でCJK統合漢字拡張Fが追加され、入管正字の全ての文字が収録されるに至った。

入管正字に置き換える元の漢字(簡体字等)の一部はUnicodeに収録されていないため入管外字として管理している。入管外字は、Unicodeの私用領域(U+E000 ~ U+F8FF)を使用している。具体的な文字コードと漢字の関係は法務省告示第五百八十二号 在留カード等に係る漢字氏名の表記等に関する告示 別表第二参照。ただし、別表第二には、この告示後にUnicodeに収録された漢字も含まれている。そのため、入管正字の一部も含まれている(文字コード等 = e5d4、e5d5、e5d6、e5d7)。

登記用外字編集

登記用の文字集合として法務省の登記統一文字が存在し、そこにはUnicodeに含まれない文字も存在している。

  • 登記統一文字は、戸籍統一文字登記固有文字で構成される。登記統一文字番号の8桁で管理する。[1]
  • 戸籍統一文字の登記統一文字番号は、戸籍統一文字コード(6桁)の先頭に00を追加して8桁に拡張する。
  • 登記固有文字の登記統一文字番号は、先頭01で始まる8桁の番号とする。

著名な外字集合編集

JIS X 0208の外字として使用された文字集合の一部は、標準化されたりデファクトスタンダードになった外字集合がある。

ARIB外字
社団法人電波産業会によりデータ放送などでの使用を規定した外字集合。多くの文字はUnicodeに収録されたが、モザイク集合などの一部の文字は収録されていない。
レコード用文字符号
レコード協会がRIS506-1996としてまとめた外字集合であり、Music Shift-JISとしてCDDVD-Audioなどに使われている。
iモード絵文字
DoCoMoのiモード用に作られた外字集合。多くの絵文字はUnicodeに収録されたが、一部の文字は収録されていない。
EZweb絵文字
KDDIのEZweb用に作られた外字集合。同上。
SoftBank絵文字
SoftBankの携帯電話(当初はJ-Phone)用に作られた外字集合。同上。
歯科用外字
歯科用の記号をまとめた外字集合
ビブロス外字
もともとBiblosが定めていた外字集合で、一般化した
K-JIS外字
共同通信がU-PRESSよりも前に定めた外字集合。U-PRESSに取り込まれなかった文字が残っており、イワタ製のU-PRESS向けフォントは残存K-JIS文字を外字として搭載している[3]
共同通信外字 (U-PRESS外字)
共同通信が定めた外字集合。Adobe-Japan1-6に取り込まれたが、Unicodeに含まれていない文字も存在する。
案内用図記号
JIS Z8210で制定されたピクトグラムだが、文字コードが割り当てられていないため外字として実装されることがある。対応フォントには、一般案内用図記号フォント (外字神社)[4]、人名記号外字3 (ダイナコムウェア)[5]などがある。

Adobe-Japan1-6対応フォントで表示できる外字集合編集

Unicode (結合文字を含む) 及びOpenType Feature Tagの組み合わせで表示できるが、正しく表示するためにAdobe-Japan1-6対応フォントが必要となる文字集合。

通産省外字/Apple外字
通産省主導の文字フォント開発普及センターがJIS X 0208外で必要な記号定めた外字集合であり[6]、Macintoshなどで使用されている。

過去の外字集合編集

既にUnicodeに含まれるものなど。

IBM外字 
汎用機用にIBMが制定した外字集合であり、JIS X 0208に含まれない記号および漢字を定義した外字集合(IBM漢字・IBM拡張漢字)。Microsoft外字に含まれている。
NEC外字/98外字[7]
汎用機用にNECが制定した外字集合であり、JIS X 0208に含まれない記号および漢字を定義した外字集合(NEC特殊文字、NEC選定IBM特殊文字)。Microsoft外字に含まれている。
Microsoft外字
MicrosoftのOS上でIBM外字とNEC外字を使用可能にした外字集合。JIS X 0221で「通用日本文字集合」として規格化された。
JIS2004外字
JIS X 0203:2004で規定された文字をJIS X 0208の外字として実装した外字集合

その他の外字編集

裁判所外字
裁判所で使われている外字[8]
エヌフォー外字集合[9]
漫画用外字
写研の写植記号に由来し、主に漫画で使われる外字。イワタアンチック体、GL-アンチックなどに搭載されている。

医学用編集

  • Win 外字辞書セット 医学バージョン[10]
  • エヌフォー外字DXオプションパック医学用[11]
  • エヌフォー外字DXオプションパック歯科用[11]

関連項目編集

出典編集

外部リンク編集