「分類 (統計学)」の版間の差分

削除された内容 追加された内容
Abionab (会話 | 投稿記録)
m編集の要約なし
Abionab (会話 | 投稿記録)
判別分析 2015年9月13日 (日) 03:25‎ から移動。判別分析というより統計分類の話のため。
40行目:
 
分類器の性能は分類すべきデータの特性に大きく依存する。あらゆる問題について最高の性能を示す分類器は存在しない([[ノーフリーランチ定理]]と同様の現象である)。分類器の性能を比較し、データの特性を特定するために各種実験的検証を実施して分類器の性能を決定する。ただし、ある問題に適した分類器を特定する手法は科学というよりも技能である。
 
== 評価手法 ==
<!-- この文章は[[判別分析]]から移動しました -->
判別式の妥当性は、誤判別率などで評価できる。適した[[変数選択]]と判別方法にもとづいて分析することが必要であり、判別式(のみならず[[変数選択]])の妥当性を検証する手法として、元のデータから1つだけ外して判別(モデル)式を得、外したデータを新たなデータとして適用した際に妥当な結果が得られるかを検証する、1つとって置き法({{lang-en-short|leave-1-out}})などが一般に用いられる。
 
== 例 ==
<!-- この文章は[[判別分析]]から移動しました -->
[[入学試験|入試]]を具体例に取ると、個々の受験生は、各群に属する個々の入試得点により、合格・不合格という2群に分けられる。学校側で明確な基準を設ける場合、たとえば英語で100点満点中70点を合否ラインにした場合、生徒の合否は得点が70点を境に分かれることとなるが、合否基準が非公開な場合や、その年度によって、合格者の平均点も変動することは周知である。
 
このような教師データが存在する場合(予備校などでは自己採点結果などから、相当に精度の高い標本を有しており、これを教師データとして扱うことは相応に妥当と考えられる)、判別分析により、過去の受験生の点数実績と合格実績から、合否の基準を計算によって求めることができる。
 
== 応用分野 ==