「計算言語学」の版間の差分

削除された内容 追加された内容
180.246.127.130 (会話) による ID:36182850 の版を取り消し
編集の要約なし
1行目:
{{言語学}}
'''計算言語学'''(けいさんげんごがく、Computational Linguistics)とは、[[言語学]]の一分野である。[[計算機科学]]における[[自然言語処理]]との類似点もみられるが、計算言語学という言い方をした場合、言語学に[[ルーツ]]を持ちながらも[[コンピュータ]]の観点からの[[自然言語]]の[[論理]][[モデリング]]を中心とした研究分野を指すことが多い。このモデリング自体は言語学に限定されているわけではなく、他にも[[コンピュータ科学]]、[[人工知能]]、[[認知心理学]]などが研究に参加している。
 
== [[自然言語処理]] ==
実際の言語データ([[コーパス]])から計算によって言語の特徴を取り出し、言語の分析を行う。
* [[形態素解析]]
15行目:
== 統計手法 ==
=== 出現頻度 ===
[[文字]]、単語、単語の[[品詞]]、複数単語の組などの頻度を総数で割る。
 
=== ''n''-gram ===
21行目:
 
=== 共起頻度 ===
一定区間に ''n'' 個の単位が出現 (共起) する頻度。2 つの単語が一緒に出てくる共起のしやすさを計る。作成された単語の[[クラスタ]]は、例えば、統計ベースの言語処理において「データ・スパースネス問題」の対処に用いたり、新聞の関連記事を検索する際に有効である。
 
== 応用 ==