一題機率遊戲中的策略設計 - 推理遊戲

Enid avatar
By Enid
at 2010-02-08T00:39

Table of Contents

誠如 ddavid 所說過的,這個問題是一個很標準的賽局理論問題。
要正確理解這個問題,就要知道什麼是純策略和混合策略。

http://en.wikipedia.org/wiki/Strategy_%28game_theory%29
http://zh.wikipedia.org/wiki/%E7%AD%96%E7%95%A5_(%E5%8D%9A%E5%BC%88%E8%AB%96)

先不要管十回合的問題,只考慮一回合,我們追求勝分的期望值就好。
(勝分 = 我方得分 - 對方得分)

首先如 ars1an 在原文的推文中所說,這題沒有純策略解, (這很好證)
而 John Nash 告訴我們平衡點一定存在,所以我們要追求的是一個混合策略。

那麼,

1.勝分是零和,所以最佳策略是 weak Nash equilibrium (頂多保證不敗)。

2.最佳策略必不敗於任何純策略 (廢話)。

3.若某策略不敗於任何純策略,則該策略不敗於任何策略。
(因為任何策略的勝分期望值都是純策略勝分期望值的加權平均)

4.由 2,3 兩點得知,我們只要檢查對所有純策略都不敗即可。



先算簡單的,若我方出 x 對方出 y, x < y 則勝分期望值為:

xy + x(1-y) - y(1-x) = x - y + xy

若 x > y 則反過來:

x - y - xy

假設在最佳策略中我方出數字 x 的機率為 p(x),而對方出 y,勝分期望值為:

∫{0~y} p(t)(t-y+ty) dt + ∫{y~1} p(t)(t-y-ty) dt
= ∫{0~1} p(t)(t-y-ty) dt + 2∫{0~y} p(t)ty dt
= (1-y)∫{0~1} p(t)t dt - y∫{0~1} p(t) dt + 2y∫{0~y} p(t)t dt
= (1-y)∫{0~1} p(t)t dt - y + 2y∫{0~y} p(t)t dt

這時候當然要令 G(y) = ∫{0~y} p(t)t dt,則

= (1-y) G(1) - y + 2y G(y)

我們的目的是找到一個 p 使得上式恆不小於零。
後面的過程我忘了,有一部分可能是湊出來的:

1. G(1) >= 1/2
2. G(y) >= 1/2 - (1/2y - 1/2) G(1)
3. 假設 G(y) >= 3/4 - 1/(4y) 則可滿足 2.
4. 假設 G(y) = 3/4 - 1/(4y) → p(t) = 1/(4t^3) when t > 1/3
5. ∫{1/3~1} p(t) dt = 1, 機率分布剛好用完, 剩下 0~1/3 間都是 0

----

(後來我想起來這裡是怎麼算的了 XD

考慮對方使用相同策略的情況,得到
∫{0~1} p(y) [(1-y) G(1) - y + 2y G(y)] = 0

但是 p(y) >= 0, (1-y) G(1) - y + 2y G(y) >= 0
所以 p(y) = 0 or (1-y) G(1) - y + 2y G(y) = 0 almost everywhere

因為 y < 1/3 時 (1-y) G(1) - y + 2y G(y) > 0,
所以 0~1/3 間 p(y) 都是零 (a.e., 不過沒差)

然後再從 1/3 往上逐步逼到 1/(4t^3) )

----

所以若 p(t) = 0, when t < 1/3
1/(4t^3), otherwise


1. ∫{0~1} p(t) dt = 1, p 是個機率分布

2. G(y) = 0, when y < 1/3
3/4 - 1/(4y), otherwise

3. G 滿足 (1-y) G(1) - y + 2y G(y) >= 0

4. 事實上當 y >= 1/3 時 (1-y) G(1) - y + 2y G(y) = 0
而 y < 1/3 時 > 0

5. 也就是說,這個策略和出 1/3 以上任何數字的純策略打平,
而對出低於 1/3 的任何數字的純策略則會勝出。

6. 也就是說,這個策略和任何只用 1/3~1 之間數字混出來的策略都打平,
對其他則勝出。

--

All Comments

Christine avatar
By Christine
at 2010-02-08T07:25
Michael avatar
By Michael
at 2010-02-12T08:21
專業推
Lucy avatar
By Lucy
at 2010-02-13T15:14
推!

誰說謊?

Rosalind avatar
By Rosalind
at 2010-02-07T15:54
※ 引述《TopoT (棄者)》之銘言: : ※ 引述《yauhh (喲)》之銘言: : : 看到一則問題,覺得好像推不出答案. 請各位看看. : : 三位教師各自說明下個學期的排課狀況. : : 戴老師說: 唐老師下學期要教作業研究,而林老師要教研究方法. : : 唐老師說: 林老師下學期要教生產管理,而唐 ...

一題機率遊戲中的策略設計

Elvira avatar
By Elvira
at 2010-02-07T02:09
※ 引述《brains (不認識)》之銘言: : 甲乙兩人在玩一個機率遊戲。 : 每一回合裡: : 甲和乙各自從[0,1]取一個實數, : 選好後一起公開, 並把自己選的x值輸入給隨機系統作評判. : 隨機系統有x的機率回傳and#34;Yesand#34;, 有(1-x)的機率回傳and#34;Noand# ...

98%的測識者無法解題材

Oscar avatar
By Oscar
at 2010-02-06T00:24
※ 引述《hsiehfat (Yanniisthebest)》之銘言: 請按Page down開始 -- ╭──┬──┬──┬──┬──┬──╮ │ │ 1│ 2│ 3│ 4│ 5│ ├──┼──┼──┼──┼──┼──┤ │屋色│ │ 藍 │ ...

98%的測識者無法解題材

Faithe avatar
By Faithe
at 2010-02-05T23:18
※ 引述《yuks (嗯)》之銘言: : ※ 引述《cheerfly (小灰灰)》之銘言: : : 題目源自於1981柏林的德國邏輯思考學院改編 : : 國內某半導體設計公司曾以此題目招考員工 : : 題目如下 : : 有五位小姐排成一列 : : 所有小姐穿的衣服顏色不一樣 : : 所有小姐姓也不同 : : ...

兩題關於馬的問題

Jessica avatar
By Jessica
at 2010-02-05T22:51
※ 引述《hsiehfat (Yanniisthebest)》之銘言: : ※ 引述《hsiehfat (Yanniisthebest)》之銘言: : : 不知道有沒有人PO過了,搜尋關鍵字好像都沒看到,重PO一次。 : : 1.遺產分馬 : : 阿拉伯有個富人有17匹名馬,他有兩個兒子,某天他過世了。 : ...