データサイエンス

ゲーム理論とは何か(ゲームの分類)

2023年9月1日

ゲーム理論は将棋やトランプなどの娯楽ゲームのルールや意思決定を数式で表現した理論体系です。
ゲーム理論は娯楽ゲームだけではなく、人間や組織間の駆け引きを数式でモデル化することができるため、経済学やセキュリティ、交通工学など様々な分野に応用されています。
ここでは、ゲーム理論に関わる様々な概念やゲームの分類について簡単にまとめます。
詳細な数式・理論については以下のサイトが参考になります。

参考文献:ゲーム理論|経済学|ワイズ ワイズ(WIIS) 2023/8/24閲覧

ゲーム理論とは

ゲーム理論とは、将棋やオセロ、じゃんけんのような対戦型ゲームのように、お互いの行動・選択がお互いに影響を与えあう中での意思決定(打ち手の選択)を分析するための理論です。
ゲームのルールやプレイヤーの意思決定を数式でモデル化して表現することで、合理的な選択を数理モデルを用いて決定できます。

ゲーム理論は1928年に米国の数学者のノイマン(John von Neumann)が発表し、その後に経済学者モルゲンシュテルン(Oskar Morgenstern)とともに経済学の分野に導入しました。
そのため、ゲーム理論は経済学における意思決定の分析に応用されています。
代表的なものに、囚人のジレンマや共有地(コモンズ)の悲劇などがあります。

ゲーム理論は現在では経済学だけではなく、人間が互いに影響を及ぼしあいながら意思決定を行う様々な場面に応用されています。

ゲームとは

はじめに、ゲーム理論におけるゲームについて解説します。

ゲームとは、複数の主体(人間や企業、集団)がお互いに影響を及ぼしあう状況で合理的な意思決定を行うことで自己の利益を最大化しようとする競争のことです。
ゲームでは、お互いの行動がお互いの行動に影響を与えあう戦略的相互依存性(strategic interdependence)が成立しています。

このため将棋やじゃんけんはゲームですが、パチンコや宝くじのように純粋に確率的に結果が決まるギャンブルはゲームではありません。
また、100m走や砲丸投げのように一人で完結するため他人の意思決定の影響を受けない競技もゲームではありません。

一方で娯楽ゲーム以外でも戦略的相互依存性が成り立つ場面は多数存在し、このような場面にもゲーム理論を応用できます。
たとえば、経済学における企業における販売競争、生態学では自然界における生物の生存戦略、セキュリティ分野における最適な警備方法の決定、交通工学における渋滞予測などに応用されています。

ゲーム理論ではこのように様々な状況を数理モデルとして表現するために、ゲームの様々な場面で行われる意思決定の際の拘束条件(ルール)を数式で定義します。

ゲームのルールとは

ゲーム理論におけるゲームの「ルール」は、一般的なルールという単語の意味とは異なります。

ゲームのルールとは、次のような情報の集合です。
カッコ内にじゃんけんでの具体例を書きます。

1.ゲームに参加するプレイヤーの一覧(自分と相手)
2.ゲームにおいて各プレイヤーが意思決定を行う順番(同時)
3.各プレイヤーが意思決定を行う際の行動の選択肢一覧(グー、チョキ、パー)
4.各プレイヤーが意思決定を行う際に与えられている情報一覧(自分と相手が過去に何を出したか等)
5.各プレイヤーが意思決定を行った際にどのような結果が得られるかについての情報(自分がグーを出したときに相手がパーなら負ける)
6.各プレイヤーが意思決定の結果をどのように評価するかの評価体系(じゃんけんで勝ったら+1点、負けたら-1点など)

このように、娯楽ゲームの一般的なルールに加えて、意思決定の際に知っている情報、状況までを含めて「ルール」とよびます。

ゲーム理論の用語

最後にゲーム理論で登場する用語について簡単にまとめます。

ポイント

戦略的相互依存性:複数の主体(人間や企業、集団)がお互いの行動に影響を及ぼしあう状況

ゲーム:戦略的相互依存性が成り立つ状況で合理的な意思決定を行うことで自己の利益を最大化しようとする競争

プレイヤー:ゲームに参加する独立した主体(人間や企業、集団)

利得:プレーヤーが最大化すべき利益の指標
(例:じゃんけんで勝ったら+1、負けたら-1)

ゲームの分類

ここからは、ゲーム理論に登場する様々な分類や概念について簡単にまとめます。

協力ゲームと非協力ゲーム

協力ゲームと非協力ゲームは、プレイヤーが同士を互いに拘束する強制力のある合意が存在するゲームか否かに着目した分類です。
このような強制力のある合意を拘束的な合意といいます。
現実世界における拘束的な合意の例としては、企業間の契約(違約金あり)、政府による強制(法令や指導)などがあります。
単なる口約束や一方的な宣言、パフォーマンスはプレイヤーに履行を強制できないため拘束力のある合意ではありません。

協力ゲーム

協力ゲーム(cooperative game)では、プレイヤー同士で交渉を行い、拘束的な合意を結んだ集団を形成できます。
このようにプレイヤー間で拘束的な合意を結ぶことを提携(coalition)といいます。
協力ゲームでは、プレイヤー間の相互作用だけではなく、提携間の競争が分析対象です。

協力ゲームの例としては、国際線を運行する航空会社間の競争があります。
航空会社は互いに競争しあう関係でありながら、特定の航空会社と提携してコードシェアを行ったり、航空連合に加盟してサービスの共通化を行っています。

非協力ゲーム

協力ゲームに対して、プレイヤー間に拘束的な合意が成立しないゲームを非協力ゲーム(non-cooperative game)といいます。

非協力ゲームでは、プレイヤーは他のプレイヤーから独立して意思決定を行うことができます。

非協力ゲームの例としては、各国政府をプレイヤーとした国際関係です。
現実世界では、外国政府に約束の履行を強制させることは困難です。
特に大国同士であれば、軍事力や経済制裁により相手に行動を強制させることが現実的ではないため、非協力ゲームとみなせます。

静学ゲームと動学ゲーム

静学ゲーム(同時手番ゲーム)と動学ゲーム(逐次手番ゲーム)は、プレイヤーが意思決定を行う「順番」に着目した分類です。
プレイヤーが意思決定を行うタイミングが変わると、他のプレイヤーの行動を意思決定の参考にできるか否かが変わってきます。

静学ゲーム(同時手番ゲーム)

静学ゲーム(static game)または同時手番ゲーム(simultaneous move game)とは、各プレイヤーが同時に意思決定を行うゲームです。
静学ゲームでは相手の意思決定を確認できない状況で意思決定を行うため、他のプレイヤーの動向を意思決定の判断材料に使うことができません。

静学ゲームの例としては、じゃんけんがあります。
じゃんけんでは、お互いに同時に手(グー、チョキ、パー)を出す必要があるため静学ゲームです。

動学ゲーム(逐次手番ゲーム)

動学ゲーム(dynamic game)または逐次手番ゲーム(sequential game)とは、各プレイヤーが順番に意思決定を行うゲームです。

動学ゲームの例としては、将棋やオセロ、トランプのババ抜きや7並べなどがあります。
これらのゲームでは、他プレイヤーが意思決定を行ったことを確認した上で、順番に行動していく動学ゲームです。

完全情報ゲームと不完全情報ゲーム

動学ゲームでは各プレイヤーが順番に意思決定を行いますが、他プレイヤーの意思決定の内容を確認できるとは限りません。
完全情報ゲームと不完全情報ゲームは、動学ゲームにおいて他プレイヤーの意思決定の内容を知ることができるか否かに着目した分類です。

完全情報ゲーム

完全情報ゲーム(game of perfect information)とは、自分が意思決定を行う前に行われた他のプレイヤーの全ての意思決定の内容を知ることができる動学ゲームを完全情報ゲームといいます。
完全情報ゲームでは、他のプレイヤーの意思決定の内容を自分の意思決定の参考にすることができます。
なお、過去の他のプレイヤーの意思決定の内容を一部しか知ることができない場合は不完全情報ゲームになります(例:トランプのババ抜き)。

完全情報ゲームの例としては、将棋やオセロがあります。
これらのゲームでは、他のプレイヤーの意思決定の内容はお互いに知ることができます。

不完全情報ゲーム

完全情報ゲームではない動学ゲームのことを不完全情報ゲーム(game of imperfect information)といいます。
不完全情報ゲームでは、自分が意思決定を行う前に行われた他のプレイヤーの行動選択の内容の一部または全部がわからない状態で意思決定を行います。

不完全情報ゲームの例としては、トランプのポーカーやババ抜きがあります。
ポーカーでは他のプレイヤーの打ち手がわからない状態で行動選択を行います。
ババ抜きでは、他のプレイヤーの手札や行動の結果の一部を確認することができますが、全てを知ることができません。

現実世界の例としては、各国政府間の外交交渉を不完全情報ゲームとみなすことができます(裏で外国同士がどのような交渉をしているのかわからない)。

完全記憶ゲームと不完全記憶ゲーム

完全記憶ゲームと不完全記憶ゲームは、動学ゲームにおいて自分が確認できる情報を全て記憶しているか否かに着目した分類です。

完全情報ゲームにおいては、自分と他のプレイヤー全ての過去の意思決定の内容を全プレイヤーが記憶していれば完全記憶ゲームです。
不完全情報ゲームでは、自分が確認できる範囲内の意思決定の内容(自分自身の意思決定も含む)を全プレイヤーが全て記憶していれば完全記憶ゲームです。

完全記憶ゲーム

完全記憶ゲーム(game of perfect recall)とは、自分が確認できる範囲内の全ての情報(自分と他のプレイヤーの意思決定の内容)を記憶しているゲームです。
完全情報ゲームでは、過去に観察した各プレイヤーの行動選択結果を参考にして意思決定を行うことができます。

完全情報ゲームの例としては、プロ同士の将棋やチェスが挙げられます。
プロ棋士は自分と相手の行動選択の結果を全て記憶した上で次の一手を決めるため、完全記憶ゲームです。

不完全記憶ゲーム

完全記憶ゲームではない動学ゲームを不完全記憶ゲーム(game of imperfect recall)といいます。
プレイヤーのうち誰か一人でも過去の意思決定の内容の一部を忘れてしまっていれば、そのゲームは不完全記憶ゲームになります。

先程完全記憶ゲームの例としてプロ棋士同士の将棋をあげましたが、同じ将棋でも素人同士でどちらか一方でも過去の手(棋譜)を完璧に覚えていなければそれは不完全記憶ゲームになります。

相互知識と共有知識

ここでは、次の項目(完備情報ゲームと不完備情報ゲーム)の理解のために必要な概念である相互知識と共有知識について先に説明します。

相互知識(mutual knowledge)共有知識(common knowledge)は、ゲームに参加するプレイヤー全員が知っている情報のことです。

両者は同じ意味ではなく、相互知識と共有知識には違いがあります。
相互知識は全てのプレイヤーがある情報を知っている(他プレイヤーにその情報を共有されていることを知っているとは限らない)状態にある情報です。
一方、共有知識は全てのプレイヤーがある情報を知っており、かつ全プレイヤーにその情報が共有されていることも知っている状態にある情報です。

このため、共有知識は必ず相互知識でもあるのに対し、相互知識であるからといって共有知識であるとは限りません。
相互知識だが共有知識ではない情報は、自分は知っているが他のプレイヤーがそのことを知っているかはわからない情報です。

たとえば、ある夫婦がお互いに浮気をしているが、相手にはその事実を隠している(バレていない)とします。
この場合、夫婦にとって自分たちが相思相愛ではない(少なくとも一方が浮気している)ことは相互知識ではあるが、共有知識ではありません。
夫と妻はどちらも、自分が浮気していることを知っているので相互知識です。
しかし、どちらも相手が浮気について知っているかはわからないため共有知識ではありません。

完備情報ゲームと不完備情報ゲーム

完備情報ゲームと不完備情報ゲームは、共有知識に着目した分類です。
ゲームのルール全てが共有知識であるゲームを完備情報ゲームというのに対し、それ以外のゲームを不完備情報ゲームといいます。

完備情報ゲーム

完備情報ゲーム(game of complete information)では、ゲームの全ルールが全プレイヤーに公開され、さらに全員が全てのルールを知っていることをプレイヤー全員が知っています。

将棋や囲碁、オセロは完備情報ゲームです。
プレイヤー全員にゲームルールや場の状況が共有されていないとゲームの進行に支障があるため、完備情報ゲームであることが前提になっています。

不完備情報ゲーム

不完備情報ゲーム(game of incomplete information)では、ゲームのルールの一部が共有知識になっていません。
つまり、ゲームのルールが全プレイヤーに共有されていない、または全プレイヤーに共有されていてもその事実を知らないプレイヤーがいる状態です。

たとえば、トランプの大富豪や7並べのように自分の手札を他のプレイヤーに隠した状態で進む娯楽ゲームは不完備情報ゲームです。
ゲーム理論における「ルール」は意思決定に使う情報・状況も含む広い意味の用語です。
そのため、他のプレイヤーの手札がわからない状態で意思決定を行う必要があるこれらのゲームは、ルールの一部が共有知識ではないため不完備情報ゲームです。

現実世界の例としては、コーラの販売競争において各企業は競合他社の生産量や原価を知らないため不完備情報ゲームとみなせます。

戦略型ゲームと展開型ゲーム

ここからは、非協力ゲームを記述する代表的なモデルである戦略型ゲームと展開型ゲームについて紹介します。
どちらも非協力ゲームかつ完備情報ゲームを記述するモデルですが、戦略型ゲームでは静学ゲームを対象にするのに対し、展開型ゲームは動学ゲームを対象としたモデルです。

戦略型ゲーム

非協力ゲームかつ完備情報ゲームかつ静学ゲームであるゲームのことを完備情報の静学ゲーム(static games of complete information)といいます。
戦略型ゲーム(strategic form game)または標準型ゲーム(normal form game)は、この完備情報の静学ゲームを記述するためのモデルです。
戦略ゲームでは、静学ゲームであるため複数人のプレイヤーが同時に意思決定を行います。

戦略ゲームのモデルでは、完備情報の静学ゲームを記述するために「プレイヤー」「行動」「結果」「利得」の4つの要素を数式で記述します。

展開型ゲーム

非協力ゲームかつ完備情報ゲームかつ動学ゲームであるゲームのことを完備情報の動学ゲーム(dynamic games of complete information)といいます。
展開型ゲーム(extensive form game)はこの完備情報の動学ゲームを記述するためのモデルです。
展開型ゲームでは、動学ゲームであるため複数人のプレイヤーが順番に意思決定を行います。

展開型ゲームのモデルでは、完備情報の動学ゲームを記述するために「プレイヤー」「行動」「情報」「結果」「利得」「順番」の5つの要素を数式で記述します。
前4要素は戦略型ゲームと同様ですが、動学ゲームであることから「順番」という概念を表現する必要があります。

参考文献

ゲーム理論|経済学|ワイズ ワイズ(WIIS) 2023/8/24閲覧
ゲームの理論(げーむのりろん)とは? コトバンク 日本大百科全書(ニッポニカ)  2023/8/23閲覧
ゲーム理論 ウィキペディア 2023/8/23閲覧

-データサイエンス
-,