佔優策略
閱讀設定
佔優策略 | |
---|---|
博弈論上嘅解析概念 | |
關係 | |
係乜嘢嘅子集 | 博弈策略 |
重要性 | |
用於 | 監犯困境 |
喺博弈論上,如果話某套策略係佔優策略(粵音:zim3 jau1 caak3 loek6)意思簡單講即係話無論對手點揀,呢套策略都能夠令到選擇者嘅報償最大化。佔優策略中文又有叫優勢策略。
類型
[編輯]博弈論研究人同人之間點樣喺決策上互動。呢套理論成日都提到佔優策略呢個概念。
想像有兩套策略 A 同 B,
- 將對手可能揀嘅選項逐個逐個攞嚟睇;
- 如果無論對手揀邊個選項,A 帶嚟嘅報償都會高過()B,
噉 A 就算係相對 B 嚟講嚴格佔優或者嚴格優於 B(參見英文:strictly dominates B)。
除此之外,博弈論亦有講到弱佔優(參見英文:weakly dominates)嘅概念:假如 A 相對 B 嚟講弱佔優,意思係話
- 揀 A 永遠會得到至少同 B 一樣咁高()嘅報償,
- 而且至少有一套對手行動,假如對手採取咗呢套行動,自己採取 A 就會帶嚟高過()採取 B 嘅報償[1]。
應用
[編輯]睇埋:博弈論
用監犯困境[2]做例。監犯困境個故事係噉嘅:兩個賊仔畀差人拉咗。每個人有兩個選擇:唔出聲(同夥伴合作)定係認罪(出賣夥伴)而差人設定以下嘅條件:
- 如果兩個都唔出聲:各判半年
- 如果一個認罪一個唔出聲:認罪嗰個無事,唔出聲嗰個判十年
- 如果兩個都認罪:各判五年
用數值表示嘅話(兩個數值分別表示兩個犯嘅得益,數值愈大就表示愈著數):
- 唔認罪 | 唔認罪:5,5
- 唔認罪 | 認罪:-4,10
- 認罪 | 唔認罪:10,-4
- 認罪 | 認罪:1,1
由賊仔 A 嘅角度睇[3]:如果同伴揀唔出聲,噉對賊仔 A 嚟講,認罪會係最著數利嘅選擇;而如果同伴揀認罪,噉對賊仔 A 嚟講,認罪依然會係最利嘅選擇;另外嗰個賊都要面對同樣嘅形勢。因此,假設兩位博弈者都淨係想令自己利益最大化,而且完全知道形勢係點,噉對佢哋嚟講,揀認罪會係嚴格嘅佔優策略:無論對手揀乜嘢選項,自己揀認罪都係最著數嘅[4]。
睇埋
[編輯]引咗
[編輯]- ↑ Leyton-Brown, Kevin; Shoham, Yoav (January 2008). "Essentials of Game Theory: A Concise Multidisciplinary Introduction". Synthesis Lectures on Artificial Intelligence and Machine Learning. 2 (1): 36.
- ↑ 監犯困境:prisoner's dilemma
- ↑ Bicchieri, C. (2004). Rationality and game theory. The Oxford handbook of rationality, 182-205.
- ↑ Tanimoto, J., & Sagara, H. (2007). Relationship between dilemma occurrence and the existence of a weakly dominant strategy in a two-player symmetric game. BioSystems, 90(1), 105-114.