削除された内容 追加された内容
編集の要約なし
編集の要約なし
1行目:
[[辞書]]や[[コーパス]][[シソーラス]]などの、[[自然言語]]を研究するさいに
用いられる資源のこと。電子化された言語資源は[[自然言語処理]]技術の
研究に不可欠であるが、作成に非常に手間がかかるため、
いまだにその数は多くはないしとても高価である。
 
近年[[WWW]]が普及したこともあり、これらの資源を[[インターネット]]上から
自動的に獲得しようとする試みも数多くなされているが、
一般的なネットワーク上の文章には[[ノイズ]]が多すぎて
価値ある情報を収集するのは難しいとされる。
 
また、言語資源には[[著作権]]の問題が重くのしかかっている。
たとえ資源を作っていても、それを公開するのは権利上の許可を
得なければならず難しい場合が多い。
 
== 言語資源に関するサイト ==
8 ⟶ 17行目:
* LDC, 英語の言語資源のポータル: http://www.ldc.upenn.edu/
* 日本語の言語資源一覧: http://cl.aist-nara.ac.jp/lab/resource/resource.html
* http://cl.aist-nara.ac.jp/lab/resource/resource-print.html