「Text Encoding Initiative」の版間の差分

削除された内容 追加された内容
Mnamihdk (会話 | 投稿記録)
Initial commit
 
Mnamihdk (会話 | 投稿記録)
文章の細かな修正。出典リンク3.の追加。ウェブサイト出典書式にdate=とwebsite=を追加。
11行目:
== 標準の概要 ==
 
[[Extensible_Markup_Language|XML]] によってテキストデータを[[マークアップ言語|マークアップ]]していくという方法を採っており、書誌情報的なものからテキスト全体の構造から個別の箇所の解釈や異読、その他書誌情報的なものなど、様々な付帯情報までも[[マークアップ言語|マークアップ]]によって記述することを目指している。
 
どのような深さで構造化を行い注釈を記述するかは、記述者の任意であり、段落を示す程度の記述から、紙媒体での脚注のレベルかそれ以上の細い記述まで、様々なレベルの記述が可能である。また、[[コーパス|言語コーパス]]のように各単語の属性に着目して記述するものもあれば、古典文献学のように書誌情報や異文に着目して記述するものもあるなど、対応可能な分野も様々である。厳密な学術利用に耐え得ることを目的に高い構築性を実現したものは、デジタル学術編集版 Digital Scholarly Edition と呼ばれることがある<ref name="www.dhii.jp/nagasaki/blog/node/12">{{Cite web |url=http://www.dhii.jp/nagasaki/blog/node/12 |title=TEIとoXygenの初歩 |date= |website=Digital Humanities notes in Japan |publisher=永崎研宣 |accessdate=2018-05-01}}</ref>。
 
主に人文学者や情報工学者・図書館情報学者・専門司書などが集まって作られている標準であり、コミュニティ駆動型の標準である。すべての資料に完全に適用が可能なものではなく、また、工業標準のように完全に確定したものではない。世界中のあらゆる時代の資料を、様々な方法論に基づいてデジタル化を行うべくするために、現在も参加者の議論を通じてルールの拡張が続けられている。
 
== TEI ガイドライン ==
 
TEI ガイドラインは、[[Extensible_Markup_Language|XML]] のタグ(要素)の種類や属性を定義するとともに、それらがどういう関係において利用できるかということを決めている。決められた内容は、散文で解説されるとともに、スキーマ([[Document_Type_Definition|DTD]]、[[RELAX_NG|RelaxNG]] 等で記述される)として配布されおり、スキーマファイルは日本語化もされている<ref name="digitalnagasaki.hatenablog.com/entry/2017/08/26/095642">{{Cite web |url=http://digitalnagasaki.hatenablog.com/entry/2017/08/26/095642 |title=デジタルアーカイブにおけるテクスト資料の扱い: oXygenで日本語解説付きTEIガイドラインを利用する |date=2017-08-26 |website=digitalnagasakiのブログ |publisher=永崎研宣 |accessdate=2018-05-01}}</ref>
 
また、用途にあわせたタグのモジュール化が行われており、言語学、辞書、書誌学、校訂テクストなど、必要に応じてタグをまとめて取捨選択できるようになっている。
 
ガイドライン自体が TEI を使って記述され、この単一のソースファイルから、散文による TEI ガイドライン解説、スキーマの断片、および TEI リファレンスドキュメントが生成されている。この仕組みは ODD ("One Document Does it all") と呼ばれ、TEI ガイドライン内で定義された tagdocs モジュールを使うことによって可能になっている<ref name="www.tei-c.org/Guidelines/Customization/odds.xml#body.1_div.2">{{Cite web |url=http://www.tei-c.org/Guidelines/Customization/odds.xml#body.1_div.2 |title=Writing ODD specifications |date=2013-12-08 |website=Getting Started with P5 ODDs |publisher=TEI Consortium |accessdate=2018-05-01}}</ref>。
 
現在の最新版のガイドラインは、2007年にリリースされた P5 である。リリース後の改訂は GitHub リポジトリを使用して継続的に行われており、改訂の区切りごとにバージョン番号が付されている。
32行目:
== TEI コンソーシアム ==
 
[[Text Encoding Initiative]] は1987年に幾つかの学術団体の助成を受けて開始された。その後プロジェクトの成功を受けて、2000年に国際的なメンバーシップ組織である TEI コンソーシアムが設立された。現在プロジェクトの運営は、TEI コンソーシアムが行っている。
 
TEI コンソーシアムは、TEI ガイドラインの維持・開発・普及活動のために、技術部会の運営、カンファレンスの開催、公式ホームページの運営、ジャーナルの発行、メーリングリストの運営、TEI の利用のための[[ツールチェーン]]の開発・提供などを行っている。
39行目:
== 日本での取り組み ==
 
日本はその第1回準備会議から参加者を派遣し、ガイドラインの第2版である TEI P2 段階まで関与をつづけてきたが、それ以降は個人的関与にとどまり、TEI について知っている研究者は現在も少ない<ref name="coe21.zinbun.kyoto-u.ac.jp/tei-day/abstracts.html.ja#ts1">{{Cite web |url=http://coe21.zinbun.kyoto-u.ac.jp/tei-day/abstracts.html.ja#ts1 |title=TEIはなぜ日本で知られなかった、知られていないか、知られるようになるか |date= |website=国際セミナー TEI Day in Kyoto 2006: アブストラクト集 |publisher=土屋俊 |accessdate=2018-05-01}}</ref>。
 
しかし現在の最新版である TEI P5 では「gaiji」と名付けられた外字を扱うためのモジュールも用意されるなど、東洋の文献への適用も現実的なものになりつつあることに加え、2016年にはTEI コンソーシアムに日本語資料に対応するための環境を整備する分科会である East Asian/Japanese Special Interest Group が作られるなど、日本においても TEI の活用に取り組む機運が高まりつつある。2018年9月には、欧米以外での初めての開催となる、東京での TEI カンファレンスの開催が予定されている<ref name="tei2018.dhii.asia/home">{{Cite web |url=https://tei2018.dhii.asia/home |title=TEI Conference & Members' Meeting 2018 in Tokyo |date= |website=TEI2018 |publisher= |accessdate=2018-05-01}}</ref>。
 
== 脚注 ==