※アフィリエイト広告を利用しています

1次試験

囚人のジレンマとは?具体例で解説




参考文献・URL
マンキュー経済学ミクロ編・マクロ編

分厚いマンキュー経済学を読み解くのがめんどくさい人は、こちらをおすすめします。
スタンフォード大学で一番人気の経済学入門(ミクロ編) [ ティモシー・テイラー ]
スタンフォード大学で一番人気の経済学入門(マクロ編) [ ティモシー・テイラー ]

前回の記事ではゲーム理論におけるナッシュ均衡について
解説しました。
ゲーム理論・ナッシュ均衡の解き方をわかりやすく解説

そのときに使った例題はこちらです。

ナッシュ均衡

で、上記図でナッシュ均衡は会社Xも会社Yも
A戦略を選択した場合でしたね。

ただ、会社Xにとっても会社Yにとっても
どちらの会社にとっても望ましい状態なのでしょうか?

望ましい状態ではありませんね。
というのは、、、

囚人のジレンマ

ピンクのナッシュ均衡のときは会社Xも会社Yも
利得は3でした。

ですが青色の領域(会社Xも会社YもB戦略を選択)では
両社とも利得は4とピンクの領域の3より大きいです。

なのでピンクのところよりも青色のところの方が
両社ともにとって良い結果になったわけです。

にもかかわらずお互いにとって損である
A戦略(ピンク領域)を選択してしまった。

これを囚人のジレンマといいます。

さらに囚人のジレンマについて理解するため
具体例(例題)を使って解説していきたいと思います。

スポンサードリンク




囚人のジレンマの具体例の前にナッシュ均衡の復習

ナッシュ均衡というのはすべてのプレイヤーが
相手の戦略に対して最適な戦略を選択している状態のことでしたね。
ゲーム理論・ナッシュ均衡の解き方をわかりやすく解説

で、ナッシュ均衡って必ずしもいい均衡とは限りません。
どうしてでしょう?

たとえば、学校の授業中、先生が「20×3はいくら?」って質問したときに
生徒Aが「23です」と答えたとします。

これって間違ってますね。20×3=60ですからね。
生徒Aはかけ算を足し算だと勘違いしたわけです。

でも、みんな「お前の答え間違ってるぞ!」と言わないので
自分も言わないでおこうと思ってしまうというケースがあると思います。

それってみんなが指摘しないから自分も指摘しないということで
均衡してしまったわけです。

だけど、本当は20×3=60だから生徒Aの答えは間違っているので
誰かが指摘してあげないといけないわけです。
でも、生徒Aがキレたりしてケンカになったら面倒くさいです。

こうやって均衡してしまいます。

これもナッシュ均衡みたいなものです。

こんな感じでナッシュ均衡っていいことばかりではありません。
悪いことだってあるわけです。

それでは本題に入っていきましょう。

スポンサードリンク




囚人のジレンマとは?

囚人のジレンマとは各企業が
支配戦略をとっている状態
をいいます。

ナッシュ均衡

支配戦略とは上の利得表のような場合に、
会社YがA戦略を選んでもB戦略を選んでも、
会社Xは確実にA戦略を選ぶことをいいます。

なので、囚人のジレンマとは相手の戦略に関係なく
「こっちの戦略にする」と選択すること
をいいます。

囚人のジレンマは支配戦略均衡ともいいます。

この状態ってすごく落ち着きますね。
相手の企業がどっちを選んでも、
そんなこと気にしなくてすみますから。

ですが、この状態ってパレート最適です。

パレート最適とは社会全体の幸せの度合いが
マックスだってことです。

飽和状態だって言い換えてもよいでしょう。
自分が利益を得ようと思ったら、他の会社から利益を
奪い取るしかない状態がパレート最適です。

なので、囚人のジレンマは望ましい状態ではありません。

スポンサードリンク




囚人のジレンマの具体例

囚人のジレンマとは 具体例

以下は囚人のジレンマに関する論文の内容を
わかりやすくしたものです。

2人組で銀行強盗をしました。
ドンくさかったのかもしれません。
銀行から出た後、二人とも逮捕されてしまいました。

2人一緒に取調べしたら口裏合わせされてしまうかもしれません。
そこで別々の部屋で取り調べをしました。

ただ、証拠がありません。
かなり昔の話なので防犯カメラとかDNA鑑定とか
できないという前提で考えてください。

そこで警察は1人1人に対して
「白状しろ!白状したら、無罪にしてやろう」
といいました。

すると、逮捕された人はそれぞれ
「しゃべった方がいいかな。
でも銀行強盗の証拠がないからしゃべらない方がいいかな」
とジレンマの状態に陥っています。

こういう内容の論文だったので囚人のジレンマという
名前がついているんですね。

スポンサードリンク




囚人のジレンマの具体例(例題)

囚人のジレンマ例題

A社とB社は値上げか値下げのいずれかの戦略をとり、
その利得表は以下の通りです。
(表の各項の左側の数値はA社の利得、右側の数値はB社の利得とする)
囚人のジレンマ具体例

まずA社からみていきましょう。
もしライバルであるB社が値上げ戦略をとったとき
A社は値上げ、値下げのどちらを選択するでしょう?

囚人のジレンマ具体例

すると、A社からみると上の紫色で囲んだところのように
値下げ130、値上げ90で、130の方が90より大きいです。
なのでB社が値上げするならA社は値下げ戦略をすることになります。

次に2番目としてB社が値下げ戦略をした場合、

囚人のジレンマ具体例

A社は値上げの50か値下げの70どちらを選ぶでしょう?
70と50なら70の方が大きいので、A社は値下げの70を
選びます。

つまり、A社にとってはB社が値上げしようが値下げしようが
どちらにしても値下げを選択する
わけです。

支配戦略

したがってB社の選択に関わらず
最適な選択がA社に存在するので支配戦略となりますね。

次にB社の目線で考えてみましょう。
A社が値上げ戦略を選択したら、、、

囚人のジレンマ

B社は値上げの90か値下げの130だったら、
値下げの130の方が利得が大きいので値下げを選ぶことになります。

次にA社が値下げを選んだ時、、、

囚人のジレンマ

B社は値上げの50か値下げの70だったら
値下げの70の方が利得が大きいので値下げを選ぶことになります。
B社にとってはA社が値上げしようが値下げしようが
値下げを選ぶことになるわけです。

囚人のジレンマ

なのでB社は値下げが支配戦略となります。

ということは、A社は値下げが支配戦略で
B社も値下げが支配戦略です。

相手の戦略に関わらず必ずどちらの会社も値下げ戦略を
とりますから、

支配戦略均衡

ピンクの領域が支配戦略均衡となります。

では、ピンクの領域って
社会にとって望ましい状態なのでしょうか?

ピンクの領域の合計は70+70=140です。

でも、ピンク以外の領域はみんな合計したら180です。
だから社会的に望ましいので、ピンクの領域以外です。
このピンクの領域以外の領域をパレート最適といいます。

逆にピンクの領域を囚人のジレンマと言います。
囚人のジレンマの領域ではA社もB社も相手の戦略に関わらず
自分にとって利得の大きい戦略をとっています。
ですが、結果は社会的に望ましい結果ではないわけです。

ではどうしてこうなったのでしょう?
ゲーム理論というのは自分の利得の最大化を前提にしています。

なのでA社、B社協力して社会全体をよくしようと
考えないという前提があるんです。

その結果、囚人のジレンマみたいな残念な結果が
起こってしまうことがあります。

自分さえよかったらいいという考えでは
社会にとって悪になることもあるんですね。

スポンサードリンク




囚人のジレンマはナッシュ均衡の具体例?

ナッシュ均衡は相手の戦略に対して
お互い最適になっている状態のことです。

支配戦略均衡

すると、支配戦略均衡って必ず相手の戦略に対して
最適な選択をしているわけです。

B社が値上げしようが値下げしようが
A社は値下げしますし、
A社が値上げしようが値下げしようがB社は値下げしますから。

ということは相手の戦略に対して最適になってます。

つまり支配戦略均衡(囚人のジレンマ)は
ナッシュ均衡の一種
なんです。

だから囚人のジレンマはナッシュ均衡の具体例みたいな
感じで理解してもよいでしょう。

だから上記利得表のピンクの領域は
囚人のジレンマであり、ナッシュ均衡でもあるわけです。

スポンサードリンク




囚人のジレンマ具体例(復習)

囚人のジレンマは、銀行強盗で証拠はないけど逮捕されて
取調べされている事例から出来上がっています。

だから、同じような具体例で囚人のジレンマについて
考えていきましょう。
囚人のジレンマ具体例

被疑者Aと被疑者Bは別室で取り調べを受けています。
先ほどの例題と違うのは数字にマイナスがついているところです。

このマイナスは懲役とします。

もし被疑者Aも被疑者Bもどちらも黙秘した場合
両方とも利得は-2なので懲役2年となるってことです。

だから被疑者Aも被疑者Bもどちらも自白したら
2人とも懲役6年になってしまうってことです。

そして、被疑者Aが自白したけど、被疑者Bが黙秘した場合、
被疑者Aは司法取引によって懲役0年、
被疑者Bは懲役8年になってしまいます。

この場合、被疑者Aの視点で。
被疑者Bが黙秘したら被疑者Aはどうしたらよいでしょう?

被疑者Aは自白したら司法取引によって懲役0年
黙秘したら懲役2年。

利得表

ですから被疑者Bが黙秘したら被疑者Aは自白します。

次に被疑者Bが自白したら、
被疑者Aも自白した方が得ですね。
被疑者Aは黙秘したら懲役8年、自白したら懲役6年ですから。

利得表

といった感じで被疑者Aについてもやっていくと
上記利得表のように被疑者Aも被疑者Bも自白してしまいます。

なので、ここがナッシュ均衡となりますね。

また、

支配戦略

被疑者Aはどんなケースでも自白を選んでいるので
自白が支配戦略。

被疑者Bもどんなケースでも自白を選んでいるので
自白が支配戦略です。

被疑者Aも被疑者Bもどちらも黙秘していれば
2人とも懲役2年ですんでいたのに
両者にとって損である懲役6年という
より厳しい刑罰が科せられてしまいました。

これも囚人のジレンマの具体例になりますね。

以上で囚人のジレンマについての解説を終わります。