削除された内容 追加された内容
編集の要約なし
江口磐世☆ (会話 | 投稿記録)
m lang
1行目:
'''統計分類'''([[英語{{lang-en-short|英]]: '''Statistical classification'''}}は、各個体に固有の特性を表す1つ以上の量的情報に基づいて個体をグループ分けする[[統計学|統計的]]手続きである。このとき、事前にラベル付けされた[[訓練例]](training set)を用いる。'''統計的識別'''とも。
 
形式的に表すと、次のようになる。訓練データ <math>\{(\mathbf{x_1},y_1),\dots,(\mathbf{x_n}, y_n)\}</math> から、オブジェクト <math>\mathbf{x} \in \mathcal{X}</math> から分類ラベル <math>\mathbf{y} \in \mathcal{Y}</math> へマップする分類器(classifier、識別器とも) <math>h:\mathcal{X}\rightarrow\mathcal{Y}</math> を生成するのが統計分類である。例えば、スパムのフィルタリングをする場合、<math>\mathbf{x_i}</math> は具体的な[[電子メール]]の例であり、<math>y</math> は "Spam" か "Non-Spam" のどちらかである。