「異体字セレクタ」の版間の差分
削除された内容 追加された内容
軽微な修正 |
内部リンク追加、表記ゆれの修正、項目の整理、その他軽微な修正 |
||
27行目:
Standardized Variation Sequences(標準化された異体字シーケンス、略称SVS)とIdeographic Variation Sequences(漢字異体字シーケンス、略称IVS)がある。SVSには非漢字や[[CJK互換漢字]]などが登録され、字形のコレクションはUnicodeのStandardizedVariants.txt<ref>
{{Cite web | title=StandardizedVariants.txt | url=http://www.unicode.org/Public/UCD/latest/ucd/StandardizedVariants.txt | publisher=Unicode Consortium | date=2015-11-20 | accessdate=2017-06-01 }}
</ref>にて定義されており、追加は[[ユニコードコンソーシアム]]が行なっている。IVSは漢字専用で字形のコレクションが Ideographic Variation Database (漢字異体字データベース、略称IVD) にて定義されており、
{{Cite web | title=Unicode® Technical Standard #37 UNICODE IDEOGRAPHIC VARIATION DATABASE | url=http://www.unicode.org/reports/tr37/| publisher=Unicode Consortium | date=| accessdate=2017-10-05 }}
</ref>。
2017年5月現在Unicodeに登録されている異体字セレクタで利用できる異体字は、SVSに登録されている組み合わせで[[数学記号の表|数学記号]]が25通り、
{{Cite web | title=emoji-variation-sequences.txt| url=https://unicode.org/Public/emoji/6.0/emoji-variation-sequences.txt| publisher=Unicode Consortium | date=| accessdate=2017-10-06}}
</ref>。IVDに登録されている字形コレクションは、[[CID (文字コード)|Adobe-Japan1]]コレクションに含まれる14,681通り<ref>なおAdobe-Japan1-6の文字セットに含まれる漢字は14,664個である</ref>、汎用電子情報交換環境整備プログラムのHanyo-Denshiコレクションに含まれる13,047通り<ref name="ivd"/>、文字情報基盤整備事業のMoji_Johoコレクションに含まれる10,711通り、[[マカオ|マカオ特別行政区]]のMSARGコレクションに含まれる21通りである。ただしHanyo-Denshiコレクションには、Adobe-Japan1コレクションと多数の重複がある(後述の[[#問題点]]も参照)<ref>
{{cite web|url=http://itpro.nikkeibp.co.jp/article/COLUMN/20110124/356398/|title=UnicodeのIVSがもたらすメリットとデメリット - 新常用漢字が引き起こす文字コード問題|author=安岡孝一|date=2011-01-24|accessdate=2011-02-01}}
</ref>。
==符号位置==
異体字セレクタは、[[モンゴル文字]]専用のモンゴル自由字形選択子が{{U+}}180B〜U+180Dに3
IVSでは[[基本多言語面]]の異体字セレクタ
2012年1月には[[携帯電話の絵文字|絵文字]]としても使われる107文字について、テキストスタイル(普通の文字のように白黒で表示)と絵文字スタイル(カラーで表示したり、アニメーションする)の切替を異体字セレクタで行えるようになった。使用する異体字セレクタは基本多言語面に規定されたもので、テキストスタイルがU+FE0E(VS15)、絵文字スタイルがU+FE0F(VS16)となっている。
なお、U+303EにIDEOGRAPHIC VARIATION INDICATOR(直訳すると漢字異体字表示子)という似たような名称で、かつ例示字形が点線で囲まれている(通常は不可視である制御文字などを示す)ものが存在するが、これはこれに続く漢字が異体字であることを示す可視の記号 ([[下駄記号]]の異体字版) であり、異体字セレクタではない<ref>{{cite web|url=http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1728.doc|title=Ad-Hoc Report on Ideographic Variation Indicator|date=1998-03-18|accessdate=2008-02-21}}</ref>。
46 ⟶ 48行目:
== CJK互換漢字との関係 ==
[[Image:ufa30.svg|thumb|right|120px|CJK互換漢字を使うと<U+FA30>、異体字セレクタを使うと<U+4FAE E0101>,<U+4FAE E0103>,<U+4FAE FE00>のいずれかで符号化される]]
[[JIS X 0213]]や[[CNS 11643]]などの各国の
{{cite web|url=http://www.unicode.org/mail-arch/unicode-ml/y2007-m03/0122.html|title=Re: Comment on PRI 98: IVD Adobe-Japan1 (pt.2)|date=2007-03-20|accessdate=2008-02-02}}
</ref>、同じ字形を意図していても異体字セレクタに対応した[[実装]]と対応していない実装との間で異なる符号化表現が採用され、混乱を招く可能性も指摘されている<ref>
{{cite web|url=http://www.unicode.org/mail-arch/unicode-ml/y2007-m03/0144.html|title=Re: Comment on PRI 98: IVD Adobe-Japan1 (pt.2)|date=2007-03-25|accessdate=2008-02-02}}</ref>。
また、2006年1月にIVDへの
2013年9月30日制定のUnicode 6.3では、CJK互換漢字が正規化でCJK統合漢字に置き換えられ、字形等の情報を失ってしまう問題を解消するために、SVSとしてCJK互換漢字と等価なCJK統合漢字と異体字セレクタの組合せがIVSとは別に登録された。IVSとは異なり基本多言語面にあるU+FE00(VS1)~U+FE02(VS3)を使う。IVSにある字形と同じものでも登録されている。例えば、「侮」の康煕別掲の字体であるU+FA30の「侮」は、SVSではU+4FAEとU+FE00(VS1)の組合せで登録された。CJK互換漢字ブロックおよびその補助集合のうち、CJK統合漢字扱いするものを除いた1002字全てが登録された。字体の違いでなく韓国[[KS X 1001]]の読みの違いで分離されているものや台湾[[Big5]]の誤って重複収録されたものに対応するCJK互換漢字にも異体字セレクタが与えられている。例えば、U+F90Aの「금」(Geum、クム)と読む「金」には、U+91D1(KS X 1001では「김」(Gim、キム)と読む「金」に対応)と字体が全く同じであるが、これにU+FE00(VS1)を付け加える組合せが与えられた。
== 問題点 ==
[[Image:R188 font.gif|thumb|right|250px|国によって異なる骨の異体字({{lang|zh|骨}}・骨)。異体字セレクタでは対応していない例]]
* [[フォント]]を指定できない[[プレーンテキスト]]での使用を想定されているにもかかわらず、
*
* IVDの * 現状では国によって異なる骨の異体字(図参照)のようなケースを異体字セレクタで区別することができない。
== 歴史 ==
92 ⟶ 94行目:
2008年10月10日、日本は[[汎用電子情報交換環境整備プログラム]]の成果として収集・整理された、[[戸籍]]や[[住民基本台帳ネットワーク]]の処理に必要とされる異体字を、[[CJK互換漢字|互換漢字]]として追加提案した<ref name="hanyo">{{cite web|url=http://www.dkuug.dk/jtc1/sc2/wg2/docs/n3530-cover.doc|title=Proposal to Add a Set of Compatibility Ideographs for Government Use|date=2008-10-10|accessdate=2011-02-01}}</ref>。これに対しUnicode Technical Committee (UTC)と米国は、互換漢字は正規化に際して区別が保存されず、また統合漢字の字形の一意性は保証されないため、IVDによる登録を推奨するとコメントした<ref>{{cite web|url=http://www.dkuug.dk/jtc1/sc2/wg2/docs/n3590.pdf|title=Handling Glyph Shapes for Government Use in WG2/N3530 via Variation Sequences|date=2009-02-09|accessdate=2011-02-01}}</ref>。またUTCは、SC2からの登録に対して通常IVDへの登録にかかる登録料を免除すると伝えた<ref>{{cite web|url=http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3591.pdf|title=Information on the Unicode Ideographic Variation Database – Letter to SC2 Unicode Consortium|date=2009-03-12|accessdate=2011-02-01}}</ref>。これを受け、2009年10月16日、日本は互換漢字の追加提案を取り下げた<ref>{{cite web|url=http://std.dkuug.dk/jtc1/sc2/wg2/docs/N3706.doc|title=Follow-up on N3530 (Compatibility Ideographs for Government Use)|date=2009-10-16|accessdate=2011-02-01}}</ref>。
2010年3月31日、日本は取り下げた互換漢字の追加提案に代わってIVDへ登録を申請し<ref>{{cite web|url=http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3796.pdf|title=N3796 Announcement of Japan's IVD Registration Japan NB|date=2010-03-31|accessdate=2011-02-01}}</ref>、2010年11月14日正式に
2010年12月6日、[[アドビシステムズ]]、イースト、[[ジャストシステム]]、[[大日本スクリーン製造|大日本スクリーン]]、[[マイクロソフト]]、[[モリサワ]]の6社共同で、IVSの普及推進を目的としてIVS技術促進協議会が設立された<ref>{{cite web|url=http://internet.watch.impress.co.jp/docs/news/20101206_412176.html|title=人名などの異体字もデータ交換可能に、MSなどが「IVS技術促進協議会」発足 |publisher=INTERNET Watch|date=2010-12-06|accessdate=2011-02-01}}</ref>。
100 ⟶ 102行目:
2012年1月31日、Unicode 6.1が制定。絵文字のテキストスタイルと絵文字スタイル切り替えのための異体字セレクタの組合せが登録された<ref>{{cite web |url=http://www.unicode.org/Public/6.1.0/ucd/StandardizedVariants.html |title=Standardized Variants Revision 6.1.0 |date=2011-11-27 |accessdate=2014-09-17 }}</ref>。
2012年3月2日、IVDがバージョンアップ。
2013年9月30日、Unicode 6.3が制定。CJK互換漢字のコレクションがSVSに登録された<ref>{{cite web |url=http://www.unicode.org/Public/6.3.0/ucd/StandardizedVariants.html |title=Standardized Variants Revision 6.3.0 |date=2013-03-03 |accessdate=2014-09-17 }}</ref>。
2014年5月16日、IVDがバージョンアップ。文字情報基盤整備事業のMoji_Johoコレクションが登録された<ref name="ivdversions"/>。
2016年6月21日、Unicode 9.0が制定。絵文字の追加等があった。
2016年8月15日、IVDがバージョンアップ。マカオ特別行政区
== 実装 ==
漢字の異体字セレクタに対応した[[実装]]には以下のようなものがある。
=== フォント仕様 ===▼
* [[OpenType]] 1.5では、Unicodeの異体字セレクタによる字形切り替えをサポートするため、cmapテーブルでFormat 14 "Unicode Variation Sequences"を規定した<ref>▼
{{cite web|url=http://www.microsoft.com/typography/otspec150/default.htm|title=Microsoft Typography - OpenType Specification|date=2008-01-29|accessdate=2008-03-10}}</ref>。▼
* [[Scalable Vector Graphics|SVG]]フォントはIVSに限らず、任意のUnicode符号列に対してグリフを割り当て可能である<ref>{{cite web|url=http://www.w3.org/TR/SVG/fonts.html#GlyphElement|title=Fonts – SVG 1.1 (Second Edition)|accessdate=2011-02-01}}</ref>。▼
=== フォント ===
以下は和文フォントでのIVSへの対応状況である。大別すると、Adobe-Japan1コレクションのIVSに完全対応したもの、[[JIS X 0213|JIS X 0213:2004]]で例示字形が変更される以前の字形(いわゆるJIS90字形)のみIVSで対応したもの<ref>IVSの実装上ではAdobe-Japan1コレクションのごく一部のみに対応した形である</ref>の2つとなる。
* [[MS 明朝]]・[[MS ゴシック]]・[[メイリオ|メイリオ・Meiryo UI]] - [[Windows 8]]に搭載のバージョンから、JIS X 0213:2004で例示字形が変更される以前の字形をIVSによりサポートしている<ref>{{cite web|url=https://www.microsoft.com/ja-jp/business/industry/gov/ivs/|title=Windows 8 の IVS 対応と IVS Add-in for Microsoft Office|publisher=マイクロソフト|accessdate=2017-10-05}}</ref>。
* [[ヒラギノ|ヒラギノ角ゴシック/明朝/丸ゴシック]] ProN(Adobe-Japan1) - [[Mac OS X Lion|Mac OS X Lion 10.7]]に搭載のバージョン(8.10)からIVSに対応した<ref>
128 ⟶ 125行目:
* [[IPAフォント]]
** IPAexフォント - JIS X 0213:2004で例示字形が変更される以前の字形をIVSによりサポートしている。サポート文字数はVer.001.02の時点で172文字<ref>{{cite web|url=http://www.ipa.go.jp/software/open/ossc/ipafont/releasenote.html|title=IPAフォントリリースノート |accessdate=2011-01-19}}</ref>。
** IPAmj明朝 -
{{cite web|url=http://www.atmarkit.co.jp/flinux/rensai/osstopics/01/01.html|title=連載:OSS界のちょっと気になる話 第1回 どんな人名も正しく表示? IPAの新フォントを試そう!|accessdate=2012-01-05}}
</ref><ref>{{cite web|url=http://mojikiban.ipa.go.jp/
</ref>
</ref>。
* [[源ノ角ゴシック]]・[[源ノ明朝]] - [[Adobe]]と[[Google]]の共同開発。Adobe-Japan1コレクションのIVSに対応しており、Adobe-Japan1-6文字セットの漢字グリフは網羅しているが、Adobe-Japan1との互換性がとくに考慮されているわけではない。
* [[花園フォント]](Adobe-Japan1) - 2009年12月1日版よりIVSのサポートを開始し、2010年2月22日版でAdobe-Japan1コレクションのIVSを完全収録した<ref>{{cite web|url=http://fonts.jp/hanazono/|title=花園フォント|accessdate=2011-01-19}}</ref>。
* [[Y.OzFont]] - [[フリーフォント]]のY.OzFontは2008年2月8日のバージョン12.04以降、IVSに対応している<ref>{{cite web|url=http://yozvox.web.infoseek.co.jp/|title=Y.Oz Vox|date=2008-03-10|accessdate=2008-03-10}}</ref>。
* [[和田研フォント]] - IVSに対応したものは「和田研細丸ゴシックProN」がある。JIS X 0213:2004で例示字形が変更される以前の字形をこれによりサポートしている<ref>{{cite web|url=http://sourceforge.jp/projects/jis2004/wiki/FrontPage|title=和田研細丸ゴシック2004フォントの公開|accessdate=2012-01-05}}</ref>。
▲* [[OpenType]] 1.5では、Unicodeの異体字セレクタによる字形切り替えをサポートするため、cmapテーブルでFormat 14 "Unicode Variation Sequences"を規定した<ref>
▲{{cite web|url=http://www.microsoft.com/typography/otspec150/default.htm|title=Microsoft Typography - OpenType Specification|date=2008-01-29|accessdate=2008-03-10}}</ref>。
▲* [[Scalable Vector Graphics|SVG]]フォントはIVSに限らず、任意のUnicode符号列に対してグリフを割り当て可能である<ref>{{cite web|url=http://www.w3.org/TR/SVG/fonts.html#GlyphElement|title=Fonts – SVG 1.1 (Second Edition)|accessdate=2011-02-01}}</ref>。
=== フォント作成ツール ===
|