「異体字セレクタ」の版間の差分

削除された内容 追加された内容
編集の要約なし
最新の状況を加筆、ほか
17行目:
なお、U+303EにIDEOGRAPHIC VARIATION INDICATOR(直訳すると漢字異体字表示子)という似たような名称で、かつ例示字形が点線で囲まれている(通常は不可視である制御文字などを示す)ものが存在するが、これはこれに続く漢字が異体字であることを示す可視の記号 ([[下駄記号]]の異体字版) であり、異体字セレクタではない<ref>{{cite web|url=http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1728.doc|title=Ad-Hoc Report on Ideographic Variation Indicator|date=1998-03-18|accessdate=2008-02-21}}</ref>。
 
20082011年2月現在Unicodeに登録されている異体字セレクタの組み合わせは、[[数学記号の表|数学記号]]が23通り、[[モンゴル文字]]が64通り、[[パスパ文字]]が6通り<ref name="u5stdvars"/>、そして[[漢字]]が[[CID (文字コード)|Adobe-Japan1-6]]に含まれる約14600通り、および汎用電子コレクション ({{lang-en-short|Hanyo-Denshi collection}}) に含まれる約4200通りである<ref name="ivd"/>。ただし汎用電子コレクションには、Adobe-Japan1コレクションと多数の重複がある<ref>{{cite web|url=http://itpro.nikkeibp.co.jp/article/COLUMN/20110124/356398/|title=UnicodeのIVSがもたらすメリットとデメリット - 新常用漢字が引き起こす文字コード問題|author=安岡孝一|date=2011-01-24|accessdate=2011-02-01}}</ref>。漢字は[[常用漢字]]の字形など日本において標準的な字形も登録されており、Adobe-Japan1-6に含まれるものなら、「一」のように単一の字形しか存在しないものでもその単一の字形が登録されている。
 
漢字の字形指定には、[[基本多言語面]]の異体字セレクタを使わない<ref>{{cite web|url=http://www.unicode.org/reports/tr37/|title=Unicode Technical Standard #37 - Ideographic Variation Database|date=2006-01-13|accessdate=2008-02-02}}</ref>。このため漢字の異体字セレクタに対応し、[[UTF-16]]を使用するアプリケーションは、[[Unicode#サロゲートペア|サロゲートペア(代用対)]]を正常に扱えなければならない。
47行目:
 
{{Double image aside|right|u93ad.svg|120|cid-13370.svg|120|{{Unihan|93AD}}|{{Unihan|93AD}}ではなく、{{Unihan|93AE}}に異体字セレクタ18を付けて表す}}
2007年12月14日、[[CID (文字コード)|Adobe-Japan1-6]]が最初の漢字字形コレクションとして正式に承認された<ref name="ivd">{{cite web|url=http://www.unicode.org/ivd/index.html|title=Ideographic Variation Database|accessdate=20082011-02-0201}}</ref>。ただし2度の公開レビューにもかかわらず割り当てに疑問が残る組み合わせの存在も指摘されている (右図はその一例)<ref>{{cite web|url=http://slashdot.jp/~yasuoka/journal/426907|title=IVDのダブリ|date=2008-01-07|accessdate=2008-02-02}}</ref>。
 
2008年10月10日、日本は[[汎用電子情報交換環境整備プログラム]]の成果として収集・整理された、[[戸籍]]や[[住民基本台帳ネットワーク]]の処理に必要とされる異体字を、[[CJK互換漢字|互換漢字]]として追加提案した<ref name="hanyo">{{cite web|url=http://www.dkuug.dk/jtc1/sc2/wg2/docs/n3530-cover.doc|title=Proposal to Add a Set of Compatibility Ideographs for Government Use|date=2008-10-10|accessdate=2011-02-01}}</ref>。これに対しUnicode Technical Committee (UTC)と米国は、互換漢字は正規化に際して区別が保存されず、また統合漢字の字形の一意性は保証されないため、IVDによる登録を推奨するとコメントした<ref>{{cite web|url=http://www.dkuug.dk/jtc1/sc2/wg2/docs/n3590.pdf|title=Handling Glyph Shapes for Government Use in WG2/N3530 via Variation Sequences|date=2009-02-09|accessdate=2011-02-01}}</ref>。またUTCは、SC2からの登録に対して通常IVDへの登録にかかる登録料を免除すると伝えた<ref>{{cite web|url=http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3591.pdf|title=Information on the Unicode Ideographic Variation Database – Letter to SC2 Unicode Consortium|date=2009-03-12|accessdate=2011-02-01}}</ref>。これを受け、2009年10月16日、日本は互換漢字の追加提案を取り下げた<ref>{{cite web|url=http://std.dkuug.dk/jtc1/sc2/wg2/docs/N3706.doc|title=Follow-up on N3530 (Compatibility Ideographs for Government Use)|date=2009-10-16|accessdate=2011-02-01}}</ref>。
 
2010年3月31日、日本は取り下げた互換漢字の追加提案に代わってIVDへ登録を申請し<ref>{{cite web|url=http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3796.pdf|title=N3796 Announcement of Japan's IVD Registration Japan NB|date=2010-03-31|accessdate=2011-02-01}}</ref>、2010年11月14日正式に汎用電子コレクションが登録された<ref>{{cite web|url=http://blogs.adobe.com/CCJKType/2010/11/the-hanyo-denshi-ivd-collection-has-been-registered.html|title=The “Hanyo-Denshi” IVD Collection has been registered!|author=Ken Lunde|date=2010-11-25|accessdate=2011-02-01}}</ref>。
 
2010年12月6日、[[アドビシステムズ]]、イースト、[[ジャストシステム]]、[[大日本スクリーン製造|大日本スクリーン]]、[[マイクロソフト]]、[[モリサワ]]の6社共同で、IVSの普及推進を目的としてIVS技術促進協議会が設立された<ref>{{cite web|url=http://internet.watch.impress.co.jp/docs/news/20101206_412176.html|title=人名などの異体字もデータ交換可能に、MSなどが「IVS技術促進協議会」発足 |publisher=INTERNET Watch|accessdate=2011-01-19|accessdate=2011-02-01}}</ref>。
 
{{clear}}
== 互換漢字との関係 ==
53 ⟶ 60行目:
[[JIS X 0213]]や[[CNS 11643]]などの各国の従来文字コードでは区別されているがUnicodeでは統合されている文字を区別するため、Unicodeではこれまで[[CJK互換漢字]]を使ってきた。しかし技術的な制約により、漢字の異体字セレクタは[[CJK統合漢字]] (正確にはUnified_Ideographプロパティを持つ文字) にしか付けることができない。これは[[Unicode正規化]]に対する安定性の問題 ([[CJK互換漢字#問題点]]を参照) を改善するが<ref>{{cite web|url=http://www.unicode.org/mail-arch/unicode-ml/y2007-m03/0122.html|title=Re: Comment on PRI 98: IVD Adobe-Japan1 (pt.2)|date=2007-03-20|accessdate=2008-02-02}}</ref>、同じ字形を意図していても異体字セレクタに対応した[[実装]]と対応していない実装との間で異なる符号化表現が採用され、混乱を招く可能性も指摘されている<ref>{{cite web|url=http://www.unicode.org/mail-arch/unicode-ml/y2007-m03/0144.html|title=Re: Comment on PRI 98: IVD Adobe-Japan1 (pt.2)|date=2007-03-25|accessdate=2008-02-02}}</ref>。
 
また、2006年1月に漢字字形データベースへの登録手続きが制定されて<ref name="uts37"/>漢字字形コレクションの登録が可能になった後にも[[Broadcast Markup Language|ARIB STD-B24外字]]の独自文や汎用電子で収集された漢字の一部を互換漢字として収録することが要望される<ref>{{cite web|url=http://www.cse.cuhk.edu.hk/~irg/irg/irg29/IRGN1347_wg2n3318-ARIB_CJK.pdf|title=Proposal to encode six CJK Ideographs in UCS|date=2007-09-07|accessdate=2008-02-02}}</ref><ref name="hanyo"/>など、足並みは必ずしもそろっていなかった
{{clear}}
 
== 問題点 ==
* フォントを指定できないプレーンテキストでの使用を想定されているにもかかわらず、確実にフォントを指定できる環境以外では、異体字セレクタを使用しても対象の環境で意図した異体字が表示されるとは限らない。ただし外字と異なり、どのような字形を意図していたかの情報は失われない。
* 異体字セレクタに対応した環境はかなり少なく、現在のところ一部のDTPソフトウェアやブラウザなどのみである。
さらに2011年2月現在、
* 異体字セレクタに対応したフォントが少ない。
* 異体字セレクタに対応した環境はかなり少なく、現在のところ一部のDTPソフトウェアやブラウザなどのみである ([[#ソフトウェア]]の節を参照)
* 確実にフォントを指定できる環境以外では、異体字セレクタを使用しても対象の環境で意図した異体字が出るとは限らない。
* 異体字セレクタに対応したフォントが少ない ([[#フォント]]の節を参照)
* 現状では日本向けのコレクションしか登録されていないため、国によって異なる骨の異体字[[ファイル:R188 font.gif|80px]]のようなケースを異体字セレクタで区別することはできない。
 
== 実装 ==
2008201132月現在、漢字の異体字セレクタに対応した[[実装]]には以下のようなものがある。
=== フォント仕様 ===
* [[OpenType]]仕様のバージョン1.5は、漢字の異体字セレクタによる字形切り替えをサポートするためにFormat 14 'cmap''UVS Subtable'''subtableと呼ばれる情報のフォーマットを規定する<ref>{{cite web|url=http://www.microsoft.com/typography/otspec150/default.htm|title=Microsoft Typography - OpenType Specification|date=2008-01-29|accessdate=2008-03-10}}</ref>。
* [[Scalable Vector Graphics|SVG]]フォントはIVSに限らず、任意のUnicode符号列に対してグリフを割り当て可能である<ref>{{cite web|url=http://www.w3.org/TR/SVG/fonts.html#GlyphElement|title=Fonts – SVG 1.1 (Second Edition)|accessdate=2011-02-01}}</ref>。
=== フォント ===
* Y.OzFont - [[フリーフォント]]のY.OzFontは2008年2月8日のバージョン12.04以降、漢字の異体字セレクタに対応している<ref>{{cite web|url=http://yozvox.web.infoseek.co.jp/|title=Y.Oz Vox|date=2008-03-10|accessdate=2008-03-10}}</ref>。
* 小塚明朝/小塚ゴシック Pr6N - 2007年8月1日のバージョン6.003で、初めてUVSFormat Subtable14 'cmap' subtableに対応した<ref name="IRGN1374">{{cite web|url=http://www.cse.cuhk.edu.hk/~irg/irg/irg29/IRGN1374_IUC.pdf|title=Ideographic Variation Sequences|pages=p.10|date=2007-10-17|accessdate=2008-03-10}}</ref>。
* [[花園フォント]] - 2009年12月1日版よりIVSのサポートを開始し、2010年2月22日版でAdobe-Japan1コレクションのIVSを完全収録した<ref>{{cite web|url=http://fonts.jp/hanazono/|title=花園フォント|accessdate=2011-01-19}}</ref>。
* [[IPAフォント|IPAexフォント]] - [[JIS X 0213|JIS X 0213:2004]]で例示字形が変更される以前の字形をIVSによりサポートしている。サポート文字数はVer.001.02の時点で172文字<ref>{{cite web|url=http://www.ipa.go.jp/software/open/ossc/ipafont/releasenote.html|title=IPAフォントリリースノート |accessdate=2011-01-19}}</ref>。
=== フォント作成ツール ===
UVSFormat Subtable14 'cmap' subtableを含んだフォントの作成に対応したツールには、以下のようなものがある。
* [[FontForge]] - 2007年10月2日以降のビルドでUVSFormat Subtable14 'cmap' subtableの生成に対応<ref>{{cite web|url=http://fontforge.sourceforge.net/changelog.html|title=Change log for FontForge|date=2008-03-09|accessdate=2008-03-10}}</ref>。
* Adobe Font Development Kit for OpenType (AFDKO) - バージョン2.1以降でUVSFormat Subtable14 'cmap' subtableの作成に対応<ref name="IRGN1374"/>。
* TTX/FontTools - GlyphWikiでIVS対応フォントの生成に使われている<ref>{{cite web|url=http://glyphwiki.org/wiki/GlyphWiki:%E3%83%95%E3%82%A9%E3%83%B3%E3%83%88%E7%94%9F%E6%88%90#i9|title=GlyphWiki:フォント生成|accessdate=2011-01-19}}</ref>。
=== ライブラリ ===
[[FreeType]]の2007年10月以降の開発版には、UVSFormat Subtable14 'cmap' subtableから異体字セレクタの情報を読み取るための[[Application Programming Interface|API]]が追加されている<ref>{{cite web|url=http://lists.gnu.org/archive/html/freetype-devel/2007-10/threads.html#00016|title=freetype-devel (thread)|date=2007-10-31|accessdate=2008-03-10}}</ref>。
=== ソフトウェア ===
* [[Windows 7]]は標準のテキスト描画処理が異体字セレクタに対応しており、[[エクスプローラー]]でのファイル名表示や[[NotePadメモ帳]]やサードパーティのテキストエディタでのテキスト表示等で異体字セレクタによる字形切り替えが可能である。但し、使用するフォントが異体字セレクタによる字形切り替えに対応している必要があり、日本語版に[[プリ・インストール]]された標準的なフォントである[[メイリオ]]は非対応であるため、初期設定では異体字セレクタで字形が切り替わらない。<ref>{{cite web|url=http://biotronique.jp/techno/pc/unicode_variationselector_windows7|title=Biotronique - PC - 実は異体字セレクタに対応済のWindows 7|date=2009-12-02|accessdate=2009-12-03}}</ref>
* [[Mac OS X 10.5]]標準のテキスト描画処理はdefault ignorableプロパティに従い<ref>{{cite web|url=http://unicode.org/faq/unsup_char.html|title=FAQ - Display of Unsupported Characters|accessdate=2011-01-19}}</ref>異体字セレクタを描画しないが、字形の切り替えはサポートしない。
* [[Mac OS X 10.6]]標準のテキスト描画処理は字形の切り替えをサポートするが<ref name="lunde2009">{{cite web|url=http://blogs.adobe.com/typblography/2009/08/ivs_ideographic.html|title=IVS (Ideographic Variation Sequence) support in OSes|author=Ken Lunde|accessdate=2011-02-01}}</ref>、Windows 7と同様標準フォントの[[ヒラギノ]]は異体字セレクタに未対応である。
[[Image:uts37sample.png|thumb|right|289px|AlphaとY.OzFontによる、UTS #37の例文の描画結果]]
* Alpha (テキストエディタ) - 2008年2月のIVS-OTFT試験公開版では異体字セレクタの情報をOpenType機能タグの情報に変換することにより、異体字セレクタによるグリフの切り替えに対応している<ref>{{cite web|url=http://alpha.sourceforge.jp/diary/|title=Alpha の бесполезный な日記|date=2008-03-04|accessdate=2008-03-10}}</ref>。
* [[gdi++]]
* [[Emacs|Emacs 23]]<ref>{{cite web|url=http://kanji-database.sourceforge.net/emacs/index.html|title=Emacs 23 と Lookup|accessdate=2011-01-19}}</ref>
* [[Adobe Reader|Adobe Reader 9]]以降、[[Flash Player|Flash Player 10]]のFlash Text Engine、[[Adobe InDesign|Adobe InDesign CS4]]などの[[アドビ|アドビシステムズ]]社製品<ref name="lunde2009"/>。
* Windows 7上での[[Opera]]<ref>{{cite web|url=http://d.hatena.ne.jp/iwaman/20100827/p1|title=Windows7でIVSの表示テスト|accessdate=2011-01-19}}</ref>
* [[Mozilla Firefox|Mozilla Firefox 4]]は、システムにインストールされたフォントおよびWebフォントによる異体字セレクタの描画をサポートする<ref>{{cite web|url=https://bugzilla.mozilla.org/show_bug.cgi?id=552460|title=Bug 552460 - implement Ideographic Variation Sequences support|accessdate=2011-01-19}}</ref>。
* [[WebKit]]はSVGフォントをサポートしており、SVGフォントによって定義したIVSによる字形切り替えが可能である。OperaもSVG文書でのみSVGフォントによる字形切り替えが可能<ref>{{cite web|url=http://d.hatena.ne.jp/mandel59/20100131/1264941470|title=SVGフォントでIVSを表示するテスト|accessdate=2011-01-19}}</ref>。
 
== 脚注 ==