在博弈論中,如果博弈的收益只依賴於選手所選擇的策略而不依賴於進行博弈的選手,那麼這類博弈就被稱為對稱博弈。對稱博弈存在着不同的種類。例如,在囚徒困境的博弈中,囚徒都選擇認罪的結果為都判刑5年,都選擇不認罪的結果為都判刑1年,一個選擇認罪一個不認罪的結果分別為判刑10年與釋放。在這個博弈中,囚徒最終判刑的年數隻要他選擇認罪與否有關,而與他的身份無關,這就是一個對稱博弈。用表格表示如下。
|
甲認罪
|
甲不認罪
|
乙認罪
|
5年,5年
|
0,10年
|
乙不認罪
|
10年,0 年
|
1年,1年
|
一般情況[編輯]
對於參與者
而言,博弈的收益為
,其中
為參與者
的決策集合。如果存在
,那麼對於任何排列
而言該博弈為對稱博弈。
[1]
帕薩·達斯古普塔和埃里克·馬斯金給出了以下定義,此後,這一定義在經濟學文獻中反覆出現
![{\displaystyle U_{i}(a_{1},\ldots ,a_{i},\ldots ,a_{N})=U_{\pi (i)}(a_{\pi (1)},\ldots ,a_{\pi (i)},\ldots ,a_{\pi (N)}).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2abb5bb15953ab196b6d0fd768d1cc0be918020b)
參考文獻[編輯]