「摂動完全均衡」の版間の差分

削除された内容 追加された内容
回診糖 (会話 | 投稿記録)
99行目:
正規形ゲームでは 2 つの[[ナッシュ均衡]]戦略プロファイル,(''a''<sub>1</sub>, ''b''<sub>1</sub>), (''a''<sub>2</sub>, ''b''<sub>2</sub>) がある.ここでは両プレーヤーにとって,それぞれの相手のプレーヤーの選ぶ戦略に対して相互に最適になっている.
 
変動ゲームにおいてはそれは成りたたない.プレーヤー B が戦略 ''b''<sub>1</sub> を選ぶ確率は十分小さいのでが0より大ならば,プレーヤー A にとっての最適反応は確率 ''a''<sub>1</sub> = 1 でプレーすることである.変動ゲームでは定義によってこの確率は存在するので,プレーヤー A はかならず ''a''<sub>1</sub> = 1 をプレーすることになる.しかしプレーヤー A も変動ゲームでは戦略 ''a''<sub>2</sub> を正の確率でプレーしなければならない.したがってプレーヤー A の最適反応は,[[混合戦略]] <math>a_2 = a_2^{\rm min}</math>, すなわち ''a''<sub>2</sub> を最小限の確率でプレーすることである.
 
ゲームの対称性から,プレーヤー B にとっての最適戦略は,同様に <math>b_2 = b_2^{\rm min}</math> となる.