「リスク支配」の版間の差分

削除された内容 追加された内容
m 詳細の調整
m デフォルトソート、{{Cite}}、{{Harvtxt}}、{{参照方法}}、{{Math}}
22行目:
 
== 厳密な定義 ==
下の[[利得行列]]で表されたゲームが[[協調ゲーム]]であるとき、(行プレイヤーの利得に関して) <math> A > B, D > C</math>、(列プレイヤーの利得に関して)<math>a > b, d > c</math>の二つの不等式条件が成り立つ。戦略のペア<math> {{Math|(H,H)</math>}} <math> {{Math|(G,G)</math>}} の二つのみが純粋戦略[[ナッシュ均衡]]であることが分かる. 加えて一つの [[混合戦略]][[ナッシュ均衡]]が存在し、それは行プレイヤーが<math>p = (d-c)/(a-b-c+d)</math>の確率で戦略<math> {{Math|H</math>}}<math>{{Math|1-&minus;''p</math>''}} の確率で戦略<math> {{Math|G</math>}} 列プレイヤーが<math>q = (D-C)/(A-B-C+D</math>)の確率で戦略<math> {{Math|H</math>}}<math>{{Math|1-&minus;''q</math>''}} の確率で戦略<math> {{Math|G</math>}} をプレイすることである。
 
戦略の組み合わせ <math>{{Math|(H,H)</math>}} は<math> A \geq D,a \geq d</math>かつ、<math>A>D</math>または<math>a>d</math>が成り立っているとき<math> {{Math|(G,G)</math>}} を''利得支配'''する。戦略の組み合わせ <math>{{Math|(G,G)</math>}} は、ある戦略の組み合わせから逸脱したときの各プレイヤーの損失の積が、<math>(G,G)</math>の場合のときが最も高いなら<math> {{Math|(H,H)</math>}} を'''リスク支配''' する({{Harv|Harsanyi and |Selten, |1988, |loc=Lemma 5.4.4)}}。言い換えると, 不等式条件<math>(D-C)(d-c)\geq(B-A)(b-a)</math>が成り立つことである. この不等式条件が強い場合(不等号記号が<math>></math {{Math|>}})、<math>{{Math|(G,G)</math>}} <math> {{Math|(H,H)</math>}} を強くリスク支配するという{{ref|2|2}}。
 
<math>A=a, B=b</math>等となっている[[対称ゲーム]]の場合、不等式条件は以下のようなシンプルな解釈を与えてくれる。プレイヤーは他のプレイヤーがどの戦略を選んで確率を付与するか不確かであると仮定する。すると、各プレイヤーが戦略<math> {{Math|H</math>}} <math> {{Math|G</math>}} にそれぞれ確率<math> 1/2</math> を与えるとすると、G戦略 {{Math|G}} をプレイすることによる期待利得が戦略<math> {{Math|H</math>}} のそれを上回るとき(<math>1/2 B+1/2D\geq1/2A+1/2C</math>または単純に <math>B+D \geq A+C</math>)、<math>{{Math|(G,G)</math>}} <math> {{Math|(H,H)</math>}}をリスク支配する。
 
リスク支配的な均衡を導く他の方法は、全ての均衡の危険因子を計算してそれが最小となる均衡を見つけることである。 前述の2×2ゲームの危険因子を計算してみよう。プレイヤーが戦略<math> {{Math|H</math>}} をプレイするときの期待利得は <math>E[\pi_H]=p A + (1-p) C</math>である(''<math>({{mvar|p</math>''}} は他プレイヤーが戦略<math> {{Math|H</math>}} をとる確率)。 戦略<math> {{Math|G</math>}} の場合の<math>E[\pi_G]=p B + (1-p) D</math>と比較して、 二つの期待利得を等号で結びつける''<math> {{Mvar|p</math>''}} の値が均衡<math> {{Math|(H,H)</math>}} の危険因子である。当然、<math>1-p</math>は<math>(G,G)</math>の危険因子である。<math>{{Mvar|p</math>}} を他のプレイヤーが戦略<math> {{Math|G</math>}} をとる確率とすることで、戦略 <math>(G,G)</math>をプレイすることによる危険因子を同様に計算できる。 <math>p</math>は、自分がある相手の戦略を真似することで得る利得が、他の戦略をとったときより高くしたい際に、その戦略をとると最低限保証されなくてはならない相手がその戦略をとる確率である。
 
<center>
47行目:
 
== 均衡選択 ==
数々の[[進化ゲーム]]理論的アプローチはプレイヤーの数が多いとき、プレイヤーらは利得支配的な均衡をプレイすることに失敗し、被利得支配、被リスク支配的な均衡に陥ってしまうことを示唆している。ある二つの[[進化ゲーム]]モデルでは、リスク支配的な均衡がより起こりやすいとされた。そのうち[[レプリケータダイナミクス]]によるモデルは、個体群は利得支配的な均衡よりリスク支配的な均衡を選ぶことを予測している。もう一方の、 [[戦略修正ダイナミクス]] と [[突然変異]]を組み込んだ[[最適反応動学]]によるモデルはリスク支配的な均衡が唯一の[[確率的安定均衡]] であることを予測している。両モデルでは二人ゲームを要素数<math> {{Mvar|N</math>}} の個体群に複数回プレイさせている。そこではプレイヤーの相手は他の要素数<math> {{Math|''N-''&minus;1</math>}} の個体群の中からランダムに決まる(どのプレイヤーが相手になるかの確率は無差別)。全てのプレイヤーに戦略<math> {{Math|G</math>}} または<math>{{Math|H</math>}} が与えられてゲームを開始し、相手とその戦略でもって競争する。[[レプリケータダイナミクス]]では、個体群によるゲームは、集団の一部は過去にとった戦略の成功如何によって戦略を変更することを仮定し世代間で繰り返し行われる。 最適反応動学では、プレイヤーは次世代における期待利得を高くするために戦略をアップデートする。{{Harvtxt|Kandori, |Mailath & |Rob (|1993)}} Young ({{Harvtxt|Young|1993)}} の研究によればプレイヤーが突然変異して戦略を変更することが可能で{{ref|4|4}}、 突然変異する確率が漸近的に<math>0</math>に近づいていくなら、例え利得支配されていてもリスク支配均衡に到達する確率が<math> 1</math> に近づいていく{{ref|3|3}}。
 
== 注釈 ==
* {{note|1|1}} ゲームの[[ナッシュ均衡]]が一意であった場合、明らかにそれはリスク支配的かつ利得支配的である。
* {{note|2|2}} この記事に記された定義における「強く」と「弱く」の区別に差異ははそれほどないものの、必要があるときのみそれを明示する。
* {{note|3|3}} {{Harvtxt|Harsanyi and |Selten|1988}} (1988)では利得支配均衡が[[スタグハントゲーム]] において合理的な選択だとされているが、{{Harvtxt|Harsanyi (|1995)}} はリスク支配性に似た選択基準を提唱しており、この結論を撤回している。
 
== リファレンス参考文献 ==
{{参照方法|date=2017年1月|section=1}}
* Samuel Bowles: ''Microeconomics: Behavior, Institutions, and Evolution'', Princeton University Press, pp.&nbsp;45–46 (2004) ISBN 0-691-09163-3
* Drew Fudenberg and David K. Levine: ''The Theory of Learning in Games'', MIT Press, p.&nbsp;27 (1999) ISBN 0-262-06194-5
* {{cite journal |journal=Games and Economic Behavior |issn = 0899-8256 |volume=8 |issue=1 |title=A new theory of equilibrium selection for games with complete information |first1 = John C. |last1 = Harsanyi |url=//www.sciencedirect.com/science/article/pii/S0899825605800181 |year=1995 |pages = 91–122 |doi=10.1016/S0899-8256(05)80018-1 | ref=harv}}
* John C. Harsanyi: "A New Theory of Equilibrium Selection for Games with Complete Information", ''Games and Econonmic Behavior'' 8, pp.&nbsp;91–122 (1995)
* {{Cite book|first1=John C. |last1=Harsanyi|authorlink1= and ジョン・ハーサニ|first2=Reinhard |last2=Selten: ''|authorlink2=ラインハルト・ゼルテン |title=A General Theory of Equilibrium Selection in Games'', |publisher=MIT Press (|year=1988) |ISBN =0-262-08173-3 |ref=harv}}
* Michihiro{{cite Kandori,journal George|journal=Econometrica J.|volume=61 Mailath|issue=1 & [[Rafael Rob]]: "|title=Learning, Mutation, and Long-run Run Equilibria in Games", ''Econometrica''|first1 61,= pp.&nbsp;29–56Michihiro (1993)|last1 [= Kandori |first2 = George |last2 = Mailath |first3 = Rafael |last3 = Rob |url=http://econpapersEconPapers.repec.org/article/ecmemetrp/v_3A61_3Ay_3A1993_3Ai_3A1_3Ap_3A29RePEc:ecm:emetrp:v:61:y:1993:i:1:p:29-56.htm Abstract]|year=1993 |pages = 29–56 | ref=harv}}
* Roger B. Myerson: ''Game Theory, Analysis of Conflict'', Harvard University Press, pp.&nbsp;118–119 (1991) ISBN 0-674-34115-5
* [[Larry Samuelson]]: ''Evolutionary Games and Equilibrium Selection'', MIT Press (1997) ISBN 0-262-19382-5
* H.{{cite Peytonjournal Young:|journal=Econometrica |volume=61 |issue=1 "|title=The Evolution of Conventions", ''Econometrica'',|first1 61,= ppH.&nbsp;57–84 (1993)|last1 [= Young |url=http://econpapersEconPapers.repec.org/article/ecmemetrp/v_3a61_3ay_3a1993_3ai_3a1_3ap_3a57RePEc:ecm:emetrp:v:61:y:1993:i:1:p:57-84.htm Abstract]|year=1993 |pages = 57–84 | ref=harv}}
* H. Peyton Young: ''Individual Strategy and Social Structure'', Princeton University Press (1998) ISBN 0-691-08687-7
* グレーヴァ香子:「非協力ゲーム理論」、知泉書館(2011) ISBN 978-4-86285-107-9
68 ⟶ 69行目:
{{ゲーム理論|state=uncollapsed}}
 
{{デフォルトソート:りすくしはい}}
[[Category:ゲーム理論|*]]
[[Category:数学に関する記事]]