All-Pay Contests 论文定理推导(博弈论+机制设计)
生活随笔
收集整理的這篇文章主要介紹了
All-Pay Contests 论文定理推导(博弈论+机制设计)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
All-Pay Contests 論文定理推導(博弈論+機制設計)
- 一、Theorem 1 證明過程
- 二、Theorem 2 證明過程
- 三、Corollary 1 證明過程
- 四、存在的問題
- 本文針對于全支付競賽(準確來說是標準競賽)提出兩大結論:Theorem 1有關標準競賽中參賽者的均衡收益情況;Theorem 2有關標準競賽中參賽者的均衡參與情況。 Theorem1、2需依賴于均衡存在性定理(原文中Corollary 1)。因此本文證明大體分為三部分。
- 三部分的證明之間存在聯系。Corollary 1證明獨立,是Theorem1,2成立的基礎。Theorem 1證明依賴于Generic Condition。Theorem 2證明依賴于Generic Condition與Theorem 1。
一、Theorem 1 證明過程
- 總體來說:Theorem 1的證明分為四部分,提出四個Lemma并分別證明,四個Lemma組合可推出Theorem 1的內容。(基于Generic Condition+均衡存在性)
- Theorem 1內容:在標準競賽的任意均衡中,每個參賽者的期望收益都等于其power值與0之間的較大值。(NWN_WNW?中參賽者期望收益為power,NLN_LNL?中參賽者期望收益為0。)
- 選擇一個標準競賽以及一個競賽的均衡G=(G1,...,GN)G=(G_1,...,G_N)G=(G1?,...,GN?)。(任意標準競賽均衡存在+任意競賽的任意均衡滿足定理1→\rightarrow→定理1得以證明)
- LEAST LEMMA:參賽者在任意均衡GGG中的期望收益至少等于其power與0之間的較大值。
證明:初始分數的存在使得每位參賽者的收益都大于等于0(NLN_LNL?中參賽者iii選擇分數si∈[ai,ri)s_i\in[a_i,r_i)si?∈[ai?,ri?),如果獲勝那么期望收益為正,如果失敗那么不如選擇初始分數保證收益為0)。參賽者劃分為NW,NLN_W,N_LNW?,NL?兩部分,NLN_LNL?中參賽者power小于0故已滿足引理。NWN_WNW?中任意參賽者選擇分數max{ai,T+?},?>0max\{a_i,T+\epsilon\},\epsilon>0max{ai?,T+?},?>0都可以打敗NLN_LNL?中所有n?mn-mn?m位參賽者而獲勝(NLN_LNL?中參賽者reach<T,因此不會出價大于等于T)。由此可得:(參賽者iii百分百選擇最高的分數獲勝,伴隨著最大的代價,因此是期望收益的下界)
ui≥vi(max{ai,T+?})→?→0vi(max{ai,T})=wiu_i\ge v_i(max\{a_i,T+\epsilon\})\rightarrow_{\epsilon\rightarrow0}v_i(max\{a_i,T\})=w_i ui?≥vi?(max{ai?,T+?})→?→0?vi?(max{ai?,T})=wi?
由上式可得NWN_WNW?中參賽則期望收益大于等于其power(NWN_WNW?中參賽則的power>0)。綜上,LEAST LEMMA得證。
作用:證明了任意均衡中所有參賽者期望收益都至少為power與0之間的較大值(定理1的下界部分)。
- TIE LEMMA:假設在均衡GGG中兩個以上的參賽者為分數xxx分配了概率,也就是說以嚴格正值概率選擇xxx。那么為分數xxx分配了概率的參賽者們如果選擇xxx要么一定一起獲勝要么一定一起失敗。
證明:為分數xxx分配了概率的參賽者集合為N′,∣N′∣≥2N',|N'|\ge 2N′,∣N′∣≥2。事件N′N'N′中所有參賽者選擇分數xxx定義為EEE。xxx為獲獎分數并且xxx出現同分數的事件定義為DDD(m′m'm′個獎項分配給N′N'N′中∣N′∣|N'|∣N′∣個參賽者,且1≤m′<∣N′∣1\le m' <|N'|1≤m′<∣N′∣)。假設DDD有嚴格正值概率,在DDD的基礎上,至少有一位參賽者i∈N′i\in N'i∈N′可以通過選擇略大于xxx的分數從而獲勝。因此事件DDD并不滿足最優響應,換句話說任意均衡中不可能出現事件DDD。因此P(E)=P(EL)+P(EW)P(E)=P(E^L)+P(E^W)P(E)=P(EL)+P(EW),其中,P(EL)P(E^L)P(EL)表示出現事件EEE且N′N'N′中所有參賽者全部失敗,P(EW)P(E^W)P(EW)表示出現事件EEE且N′N'N′中所有參賽者全部獲勝,DDD事件不存在均衡中,因此無第三種部分獲勝部分失敗的情況。因此在EEE的基礎上,要么EWE^WEW成立要么ELE^LEL成立。TIE LEMMA得證。
作用:均衡中可能會有多位參賽者為某個分數附以概率。TIE LEMMA消除了那些平分數參賽者中部分獲勝的情況。均衡中無上述情況有助于確定哪些參賽者的期望收益為0。
(該引理說的是,在均衡中不會出現平局卡在分數xxx上,因為從結果反推的角度,平局中至少有一個參賽者可以略微提高分數從而必勝。但實際上,參賽者不會知道是否會發生平局,因此也無法做出策略調整規避掉平局的均衡?其實還是考慮博弈的過程是否會向著均衡的方向演化)
- ZERO LEMMA:在均衡GGG中,至少有n?mn-mn?m位參賽者針對于他們獲勝概率等于0或者接近于0的情況做出最優響應。這些參賽者期望收益最大是0。
證明:用JJJ表示某個m+1m+1m+1位參賽者的集合。用S~\tilde{S}S~表示JJJ中參賽者最優響應集合的聯合。用sinfs_{inf}sinf?表示S~\tilde{S}S~(笛卡爾積)的下確界。一共有三種情況:(1)JJJ有兩個及以上的參賽者針對分數sinfs_{inf}sinf?附以正值概率。(2)JJJ只有一個的參賽者針對分數sinfs_{inf}sinf?附以正值概率。(3)JJJ沒有參賽者針對分數sinfs_{inf}sinf?附以正值概率。
情況(1):用N′N'N′表示JJJ中針對分數sinfs_{inf}sinf?附以正值概率的參賽者。對于N′N'N′中每位參賽者來說不可能成立Pi(sinf)=1P_i(s_{inf})=1Pi?(sinf?)=1,由此根據TIE LEMMA得到:對于N′N'N′中每位參賽者來說一定成立Pi(sinf)=0P_i(s_{inf})=0Pi?(sinf?)=0。
情況(2):用iii來表示JJJ中唯一一個針對分數sinfs_{inf}sinf?附以正值概率的參賽者。Pi(sinf)=0P_i(s_{inf})=0Pi?(sinf?)=0一定成立(因為JJJ中其余m位參賽者選擇分數一定大于sinfs_{inf}sinf?)。由此(1)(2)可得:任意m+1位參賽者的集合JJJ中,可能選擇分數下確界的參賽者一定成立Pi(sinf)=0P_i(s_{inf})=0Pi?(sinf?)=0,并且針對獲勝概率為0的情況選擇分數sinfs_{inf}sinf?也是其最優響應。
情況(3):根據下確界sinfs_{inf}sinf?的定義,一定存在某位參賽者i其最優響應{xn}n=1∞\{x_n\}^\infty _{n=1}{xn?}n=1∞?接近于sinfs_{inf}sinf?。當nnn趨向于無窮時,Pi(xn)P_i(x_n)Pi?(xn?)接近于0。
因為JJJ是任意一個包含m+1位參賽者的集合,因此任意均衡中至少有n-m位參賽者是針對其獲勝概率等于0或接近于0做出的最優響應。(類似鴿籠原理,假設只有n-m-1個人成立,那么存在某個m+1個人中沒有人成立)獲勝概率等于0或接近于0,那么期望收益至多為0。
作用:NLN_LNL?中n?mn-mn?m位參賽者的任意均衡下期望收益為0。(LEAST LEMMA中得到NWN_WNW?中參賽者期望收益至少為Power,那么n-m個只能是NLN_LNL?中的。)
- THRESHOLD LEMMA:NWN_WNW?中的參賽者最優響應是接近或者超過threshold,因此期望收益最多為其power值。
證明:1.對于NL\{m+1}N_L\backslash \{m+1\}NL?\{m+1}中的參賽者來說,其最優響應的上確界為ssup<Ts_{sup}<Tssup?<T。為了證明NWN_WNW?中每位參賽者都為接近或者超過threshold的分數附以了概率,使用反證法。假設存在一位NWN_WNW?中參賽者,沒有為接近或者超過threshold的分數附以概率。那么marginal player可以純策略在范圍(max{am+1,s},T)(max\{a_{m+1},s\},T)(max{am+1?,s},T)中選擇分數從而百分百贏得比賽。此時marginal player期望收益為正,與上面結論相違背。(證明NWN_WNW?中參賽者的最優響應)
2.在NWN_WNW?中任選一位參賽者iii。其最優響應{xn}n=1∞\{x_n\}^\infty _{n=1}{xn?}n=1∞?接近于某個zi≥Tz_i\ge Tzi?≥T。根據LEAST LEMMA,vi(xn)>0v_i(x_n)>0vi?(xn?)>0。根據viv_ivi?的連續性,我們可以得到:(證明NWN_WNW?中參賽者的期望收益上界)
ui=ui(xn)=Pi(xn)vi(xn)?(1?Pi(xn))ci(xn)≤vi(xn)→xn→zivi(zi)≤vi(T)=wiu_i=u_i(x_n)=P_i(x_n)v_i(x_n)-(1-P_i(x_n))c_i(x_n)\le v_i(x_n)\\ \rightarrow_{x_n\rightarrow z_i}v_i(z_i)\le v_i(T)=w_i ui?=ui?(xn?)=Pi?(xn?)vi?(xn?)?(1?Pi?(xn?))ci?(xn?)≤vi?(xn?)→xn?→zi??vi?(zi?)≤vi?(T)=wi?
作用:證明了NWN_WNW?中參賽者期望收益的上界為power。 - 綜合以上引理及其證明。LEAST LEMMA與THRESHOLD LEMMA共同證明了NWN_WNW?中參賽者所有均衡下期望收益等于其power。TIE LEMMA輔助證明ZERO LEMMA,從而證明了NLN_LNL?中參賽者所有均衡下期望收益等于0。(均在標準競賽的前提下)綜合上述兩點,定理1得證。
二、Theorem 2 證明過程
- 總體來說:Theorem 2的證明采用反證法,通過假設反面推理與已證明的Theorem 1部分結論產生矛盾。(基于Generic Condition+均衡存在性+Theorem 1)
- 正常情況下,全支付競賽所有參賽者的初始分數都是0,不存在初始優勢。因此m+1以后的參賽者很少會參與。
- 每位參賽者的伯努利效用函數除以ui(ai)u_i(a_i)ui?(ai?)后并不影響均衡中所有參賽者的策略表現,(伯努利效用函數為:ui(s)=Pi(s)vi(si)?(1?Pi(s))ci(si)u_i(s)=P_i(s)v_i(s_i)-(1-P_i(s))c_i(s_i)ui?(s)=Pi?(s)vi?(si?)?(1?Pi?(s))ci?(si?))因此利用所有參賽者ui(ai)=1u_i(a_i)=1ui?(ai?)=1的競賽證明即可代表所有競賽。(這也是為何定理2中有正則化)
- 證明方法使用反證法。選擇該競賽中的一個均衡GGG,假設存在某位參賽者i>m+1i>m+1i>m+1滿足定理2的條件并且參與到了競賽中。即
cm+1(max{am+1,x})vm+1(am+1)<ci(x)vi(ai)for?all?x∈Sivm+1(max{am+1,x})vm+1(am+1)≥vi(x)vi(ai)for?all?x∈Si\frac{c_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}<\frac{c_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\ \frac{v_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}\ge\frac{v_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\ vm+1?(am+1?)cm+1?(max{am+1?,x})?<vi?(ai?)ci?(x)??for?all?x∈Si?vm+1?(am+1?)vm+1?(max{am+1?,x})?≥vi?(ai?)vi?(x)??for?all?x∈Si? - 令ti=inf{x:Gi(x)=1}<Tt_i=inf\{x:G_i(x)=1\}<Tti?=inf{x:Gi?(x)=1}<T。tit_iti?可理解為參賽者iii混合策略中所選擇分數的最大值,ti≤ri<Tt_i\le r_i<Tti?≤ri?<T。令ti~=max{am+1,ti}<T\tilde{t_i}=max\{a_{m+1},t_i\}<Tti?~?=max{am+1?,ti?}<T,那么Pi(ti)<1P_i(t_i)<1Pi?(ti?)<1(由Threshold引理證明過程可得,NWN_WNW?中m位參賽者選擇分數接近或者超過threshold,參賽者iii最高分數才為ti<Tt_i<Tti?<T,因此不可能必勝),并且對于任意δ>0:Pm+1(ti~+δ)≥Pi(ti)\delta>0:P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)δ>0:Pm+1?(ti?~?+δ)≥Pi?(ti?)(ti~+δ>ti\tilde{t_i}+\delta>t_iti?~?+δ>ti?,在獎項估值相同為1且代價函數遞增的情況下,分數越高獲獎概率越大,也稱為競賽的單調性)(競賽的單調性也是可研究的因素)。因此對于任意δ>0\delta>0δ>0使得ti~+δ<rm+1=T\tilde{t_i}+\delta<r_{m+1}=Tti?~?+δ<rm+1?=T我們有:
vm+1(ti~+δ)>0≥?cm+1(ti~+δ))v_{m+1}(\tilde{t_i}+\delta)>0\ge -c_{m+1}(\tilde{t_i}+\delta)) vm+1?(ti?~?+δ)>0≥?cm+1?(ti?~?+δ))
上式的含義是,參賽者m+1選擇分數ti~+δ\tilde{t_i}+\deltati?~?+δ時代價函數大于等于0且獲勝效用大于0。 - 我們可以得到:
um+1≥Pm+1(ti~+δ)vm+1(ti~+δ)?(1?Pm+1(ti~+δ))cm+1(ti~+δ)≥Pi(ti)vm+1(ti~+δ)?(1?Pi(ti))cm+1(ti~+δ)(根據Pm+1(ti~+δ)≥Pi(ti))u_{m+1}\ge P_{m+1}(\tilde{t_i}+\delta)v_{m+1}(\tilde{t_i}+\delta)-(1-P_{m+1}(\tilde{t_i}+\delta))c_{m+1}(\tilde{t_i}+\delta)\\ \ge P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \text{(根據$P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)$)} um+1?≥Pm+1?(ti?~?+δ)vm+1?(ti?~?+δ)?(1?Pm+1?(ti?~?+δ))cm+1?(ti?~?+δ)≥Pi?(ti?)vm+1?(ti?~?+δ)?(1?Pi?(ti?))cm+1?(ti?~?+δ)(根據Pm+1?(ti?~?+δ)≥Pi?(ti?)) - 根據定理2中的定義可得,ci(ti)>cm+1(ti~+δ),vm+1(ti~+δ)≥vi(ti)c_i(t_i)>c_{m+1}(\tilde{t_i}+\delta),v_{m+1}(\tilde{t_i}+\delta)\ge v_i(t_i)ci?(ti?)>cm+1?(ti?~?+δ),vm+1?(ti?~?+δ)≥vi?(ti?),由此可得:
Pi(ti)vm+1(ti~+δ)?(1?Pi(ti))cm+1(ti~+δ)>Pi(ti)vi(ti)?(1?Pi(ti))ci(ti)=ui(ti)≥0P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \\>P_i(t_i)v_i(t_i)-(1-P_i(t_i))c_i(t_i)=u_i(t_i)\ge 0 Pi?(ti?)vm+1?(ti?~?+δ)?(1?Pi?(ti?))cm+1?(ti?~?+δ)>Pi?(ti?)vi?(ti?)?(1?Pi?(ti?))ci?(ti?)=ui?(ti?)≥0 - 由此可得um+1>ui(ti)≥0u_{m+1}>u_i(t_i)\ge 0um+1?>ui?(ti?)≥0,即um+1>0u_{m+1}>0um+1?>0這有違定理1。(定理1表明um+1=0u_{m+1}=0um+1?=0)根據反證法可得,定理2成立。
三、Corollary 1 證明過程
- 總體來說:Corollary 1的證明通過特殊化競賽,利用一些現有結論或特殊性質找到一定存在的均衡,再證明該均衡也存在于原競賽中即可。(該部分證明獨立)
- 推論1:所有的全支付競賽中都存在均衡。
- 考慮一個競賽CCC與一個受限的競賽C′C'C′,其中每位參賽者選擇分數在Si′=[ai,K],K=maxi∈Nri<∞S_i'=[a_i,K],K=max_{i\in N}r_i<\inftySi′?=[ai?,K],K=maxi∈N?ri?<∞范圍內。(正常競賽每位參賽者的分數選擇范圍是[ai,∞)[a_i,\infty)[ai?,∞))任何C′C'C′中的均衡都是CCC中的均衡(K是所有參賽者最大的reach,選擇大于K的分數一定使得任何參賽者收益為負,不如選擇初始分數收入為0),因此我們只要證明C′C'C′中一定存在均衡即可。
- 令S?=×i∈NSi′\{(s1,...,sn)∣?i≠j:si=sj}S^*=\times _{i\in N}S_i'\backslash \{(s_1,...,s_n)|\exists i\neq j:s_i=s_j\}S?=×i∈N?Si′?\{(s1?,...,sn?)∣?i?=j:si?=sj?},換句話說S?S^*S?是所有參賽者備選分數組合然后去掉存在相同分數選擇的情況。根據Simon and Zame的研究成果,存在某種打破平局規則,從而使得C′C'C′有一個混合策略均衡GGG。將應用了該種打破平局規則的競賽表示為C~\tilde{C}C~,均衡GGG中參賽者的收益為ui~\tilde{u_i}ui?~?。我們只需證明競賽C~\tilde{C}C~中的均衡GGG也是競賽C′C'C′的均衡即可。換句話說,只需證明在C′C'C′中GGG的混合策略對每位參賽者來說都是最優響應即可。
- 證明分兩步驟進行。第一步證明在競賽C′C'C′中按照均衡GGG的混合策略決策,參賽者的效用等于ui~\tilde{u_i}ui?~?。第二步證明不存在其他分數選擇使參賽者獲得相較于ui~\tilde{u_i}ui?~?的更高收益。綜上GGG中混合策略在競賽C′C'C′中也是最優響應,即GGG也是競賽C′C'C′的均衡。從而證明了C′C'C′中一定存在均衡,從而得到任意全支付競賽中都存在均衡。
四、存在的問題
1.Corollary 1的證明過程中通過特殊化競賽以及利用現有結論證明均衡存在性,請問該方法是否是均衡存在性證明的一貫方法?
2.Tie-Breaking Rule在證明中多次出現,該因素是不是影響競賽表現的一大關鍵因素?有無文章關注于該因素?
3.最優響應為何表示為矩陣序列{xn}n=1∞\{x_n\}^\infty_{n=1}{xn?}n=1∞??n趨向于無窮的極限代表著什么?
總結
以上是生活随笔為你收集整理的All-Pay Contests 论文定理推导(博弈论+机制设计)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《人月神话》(The Mythical
- 下一篇: 计算机课包括什么东西,计算机全课程包括什