「判別分析」の版間の差分

削除された内容 追加された内容
編集の要約なし
52行目:
== 線形判別分析 ==
線形判別関数は以下の通り。これの正負で判断。<math>x</math> は入力、<math>\mu</math> は[[平均]]、<math>\mathbf{\Sigma}</math> は[[共分散行列]]<ref>この文脈中には総和を表すシグマ記号「<math>\sum_{i=1}^n</math>」もあるが、それとは異なるので注意。</ref>。この式は多変量[[正規分布]]の式より導出できる。
: <math>\left(x - \frac{\mu_{\rm 1^{st} groupfirst} + \mu_{\rm 2^{nd} groupsecond}}{2}\right)^T \mathbf{\Sigma}^{-1} (\mu_{\rm 1^{st} groupfirst} - \mu_{\rm 2^{nd} groupsecond})</math>
 
より細かく、線形判別関数 (<math>y=\sum_{i=1}^{n}a_ix_i+a_0</math>) の求め方を以下に示す。
58行目:
#第一群、第二群についてそれぞれ積和を求める。
#:<math>W_{ij}=\Sigma_{ij}(x_i-x)(x_j-x)</math>
#第一群と第二群の平方和・積和を、同じ2変数について足し、[[自由度]] <math>N_1N_{\rm first}+N_2N_{\rm second}-2</math> で除す。
#:<math>S_{ij}=\frac{W_{ij} {\rm(1^{st} groupfirst)}+W_{ij} \rm{(2^{nd} groupsecond)}}{N_1N_{\rm first}+N_2N_{\rm second}-2}</math>
#<math>S_{ij}</math> を、その <math>i</math>行<math>j</math>列に対応させて分散共分散行列<math>{\mathbf S}</math>とし、各変数にかかる係数を<math>n</math>行<math>1</math>列に並べた行列を<math>{\mathbf A}</math>、第一群の各変数の平均値から第二群の各変数を引いた数 <math>x_i {\rm (1^{st} groupfirst)}-x_i {\rm (2^{nd} groupsecond)}</math>を<math>n</math>行<math>1</math>列に並べた行列を<math>{\mathbf X}</math>とすると以下の式が成り立つ。
#:<math>{\mathbf S}{\mathbf A}={\mathbf X}</math> ゆえに <math>{\mathbf A}={\mathbf S}^{-1}{\mathbf X}</math>
#これにより各変数にかかる係数を求めることができる。
#:定数項は、<math>a_0=-\frac{1}{2}\sum_{i=1}^na_i\left\{x_i {\rm (1^{st}first average)}+x_i {\rm (2^{nd}second average)}\right\}</math>
#判別得点<math>y</math>が正のとき第一群、負のとき第二群と判別される。
#:変数が標準化されていれば、係数の大きさは、そのままその変数が判別に与える影響の大きさである。
#:変数が定性的な場合は、[[ダミー変数]]を用いる。
#::<math>y=\sum_{i=1}^n\left(a_a_i{i1\rm (first)}x_x_i{i1\rm (first)}+a_a_i{i2\rm (second)}x_x_i{i2\rm (second)}\right)+a_{0}</math>
#:ここに、<math>x_{ij}</math>: <math>x_i</math>の<math>j</math>番目のカテゴリーに反応するとき<math>1</math>、しないとき<math>0</math>。