「計算言語学」の版間の差分
削除された内容 追加された内容
編集の要約なし |
180.246.127.130 (会話) による ID:36182850 の版を取り消し |
||
18行目:
=== ''n''-gram ===
1 つのものだけを数えるのでなく、隣接
=== 共起頻度 ===
一定区間に ''n'' 個の単位が出現 (共起) する頻度。2 つの単語が一緒に出てくる共起のしやすさを計る。作成された単語のクラスタは、例えば、統計ベースの言語処理において「データ・スパースネス問題」の対処に用いたり、新聞の関連
== 応用 ==
|