2009年6月5日 (金) 17:25時点における版編集 218.231.93.137 (会話) 編集の要約なし ← 古い編集		2009年9月19日 (土) 07:41時点における版編集取り消し江口磐世☆ (会話 \| 投稿記録) 28,237 回編集 m lang 新しい編集 →
1行目: '''統計分類'''（~~[[英語~~{{lang-en-short\|~~英]]: '''~~Statistical classification~~'''~~}}）とは、各個体に固有の特性を表す1つ以上の量的情報に基づいて個体をグループ分けする[[統計学\|統計的]]手続きである。このとき、事前にラベル付けされた[[訓練例]]（training set）を用いる。'''統計的識別'''とも。形式的に表すと、次のようになる。訓練データ <math>\{(\mathbf{x_1},y_1),\dots,(\mathbf{x_n}, y_n)\}</math> から、オブジェクト <math>\mathbf{x} \in \mathcal{X}</math> から分類ラベル <math>\mathbf{y} \in \mathcal{Y}</math> へマップする分類器（classifier、識別器とも） <math>h:\mathcal{X}\rightarrow\mathcal{Y}</math> を生成するのが統計分類である。例えば、スパムのフィルタリングをする場合、<math>\mathbf{x_i}</math> は具体的な[[電子メール]]の例であり、<math>y</math> は "Spam" か "Non-Spam" のどちらかである。

「分類 (統計学)」の版間の差分