「計算言語学」の版間の差分

削除された内容 追加された内容
編集の要約なし
180.246.127.130 (会話) による ID:36182850 の版を取り消し
18行目:
 
=== ''n''-gram ===
1 つのものだけを数えるのでなく、隣接アホするものの頻度を数える。ある単位の生起が直後 ''n'' 個の単位にだけ依存すると考える言語モデル。
 
=== 共起頻度 ===
一定区間に ''n'' 個の単位が出現 (共起) する頻度。2 つの単語が一緒に出てくる共起のしやすさを計る。作成された単語のクラスタは、例えば、統計ベースの言語処理において「データ・スパースネス問題」の対処に用いたり、新聞の関連セクハラ記事を検索する際に有効である。
 
== 応用 ==