更好地学会做策略选择:博弈生存-第9部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
夏普里说:“是这样的,孩子。你们3人吃了8块饼,其中,你带了3块饼,汤姆带了5块,一共是8块饼。你吃了其中的1/3,即8/3块,路人吃了你带的饼中的3…8/3=1/3;你的朋友汤姆也吃了8/3,路人吃了他带的饼中的5…8/3=7/3。这样,路人所吃的8/3块饼中,有你的1/3,汤姆的7/3。路人所吃的饼中,属于汤姆的是属于你的的7倍。因此,对于这8个金币,公平的分法是:你得1个金币,汤姆得7个金币。你看有没有道理?”
约克听了夏普里的分析,认为有道理,愉快地接受了1个金币,而让汤姆得到7个金币。
在这个故事中,我们看到,夏普里所提出的对金币的“公平的”分法,遵循的原则是:所得与自己的贡献相等。
这就是夏普里值(Shapley value)的意思。书 包 网 txt小说上传分享
贡献与所得相等: 夏普里值在分配中的应用
如果说纳什均衡是非合作博弈中的核心概念的话,那么我们可以说,夏普里值(Shapley Value)是合作博弈(或联盟博弈)中的最重要的概念。具体地说,夏普里值是合作性博弈的解,如同纳什均衡是非合作性博弈的一个解。
理性主体往往为了利益往往与其他理性主体订立协议,形成联盟。这个联盟形成后能够获得更大的好处,即取得更大的利益。若不带来更大的利益,联盟是不可能形成的。如何分配联盟形成后获得的好处呢?这是合作性博弈所关心的。
考虑这样一个联盟博弈。有一个三人财产分配问题:假定财产为100万元,假定这100万元在三个人之间进行分配。a拥有50%的票力,b拥有40%的票力,c拥有10%的票力。规则规定,当超过50%的票认可了某种方案时,才能获得整个财产,否则三人将一无所获。
我们看到,任何单独一个人的票力都不超过50%,从而不能单独决定财产的分配。要超过50%的票力必须要形成联盟。也就是说,在这个例子中任何人的权力都不是决定性的,也没有一个人是无权力的或权力为0。
此时财产应当按票力分配吗?如果是的话,即a,b,c的财产分配为:50%,40%,10%。但如果这样分配的话,c可以提这样的方案,a:70%,b:0,c:30%。这个方案能被a,c接受,因为对a,c来说这是一个比按票力分配方案有明显的改进的方案,尽管b被排除出去,但是a,c的票力构成大多数(60%)。
在这样的情况下,b会向a提出这样一个方案:a:80%,b:20%,c:0。此时a和b所得均比刚才c提出的方案要好,但c成了一无所有,但a、b票力总和构成大多数(90%)……这样的过程可以一直进行下去。
在这个过程中,理性的人会形成联盟ab;ac或abc。但哪个联盟能够形成呢?最终的分配结果应该是怎样的呢?
夏普里()提出了一种分配方式,根据他的理论求得的联盟者的先验实力被称为夏普里值(Shapley Value)。
夏普里,一个在二战中与中国人民并肩与日本侵略者作战的老兵,对中国人民有深厚的感情。1944—1945年,他随美军部队转战于中国西南边境,笔者在2001年的一次国际博弈论大会上与他聊天时,他神秘地谈起40多年前他在中国的情形,他还记得当年学的许多中国话,如“美国兵”、“你好”、“谢谢”,等等。二战结束后,他回到美国接受高等教育,并从事数学研究。他于1953年提出的夏普里值,随着合作博弈在博弈论中的地位的提升而日显重要。
夏普里值是这样的一个值:在各种可能的联盟次序下,参与人对联盟的边际贡献之和除以各种可能的联盟组合。
在财产分配问题上,我们可以写出各种可能排列,并计算各个排列下各个参与人的边际贡献。
表4-1财产问题中各种排列下各个参与人的边际贡献(单位:万元)
排列
abc
acb
bac
bca
cab
cba
a
0
0
100
100
100
100
b
100
0
0
0
0
0
c
0
100
0
0
0
0
由表3-3,我们得出a、b、c、的夏普里值分别为:
Φa=400/6(万元),Φb=100/6(万元),Φc=100/6(万元)
夏普里值反映了“平均的”边际贡献,这样它可以用来划分财产。按照夏普里值我们可以将财产分为a:200/3,b:100/6,c:100/6,单位为万元。
海盗分宝石:公平规则下的不公平
有这样一个分配故事:5个海盗抢到了100颗宝石,他们决定对这100颗价值一样的宝石进行分配。分配规则是:(1)抽签确定分配的顺序;(2)由抽到1号签的海盗提出分配方案,然后由5个海盗(包括提出方案的1号海盗)进行表决,当且仅当半数和超过半数的人同意时,1号海盗的分配方案得以通过,并根据该分配方案进行分配,否则1号被扔入大海喂鱼;(3)如果第1号被扔到大海后,再由2号提出分配方案,然后剩余4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼;(4)依此类推。
假定每个海盗都是绝顶聪明的,即都能够进行充分推理和计算而作出策略选择。问题是:抽到1号签的海盗提出怎样的分配方案既能够不使自己被扔到海里,又能使自己得到最多的宝石?
假设海盗已经确定的顺序为(1,2,3,4,5),1号提出的方案要使其余4个人中至少2个人同意才能获得通过,因此,1号要分析,他要使两个人同意的条件是,他给这两个人的宝石要多于假若1号被抛进大海后其他人给他们的分配,即这两个人如果不同意他的方案,得到的宝石更少。同时,1号为了自己的利益,他要笼络的两个人是处于劣势的人,即在其他情况下,得到珠宝最少的两个人。现在,我们来看一下,1号是怎样提出分配方案的。
根据规则,假设前3个人均被抛下了海,只留下4号和5号,4号提出100∶0方案,表决时4号同意,5号无法改变表决结果,所以,在只有4号和5号时,分配方案是(0,0,0,100,0)。这个分配结果是任何理性人均能够预测到的。
当只有3、4、5号时,如3号提出99∶0∶1方案,表决时,3号和5号必定同意。因为5号知道,若不同意,将3号抛下海后,他将一无所得。3号知道5号所作的分析,所以他提出这样的方案,3号自己当然是同意的。因此,此时分配方案是(0,0,99,0,1)。这个结果也是理性能够预测到的。
我们再往前推。当有2、3、4、5号时,2号预测到若他被抛下海后,分配方案将是(0,0,99,0,1)。因此,2号提出的最好的分配方案是:99∶0∶1∶0,即给自己留99颗,给4号1颗。4号会想,若我不同意,将2号抛下海后我得到的将是0颗宝石,因此,我应当同意2号给我的1颗的分配。此时,2号和4号同意该方案,该方案得到了通过,尽管3号和5号不同意。此时分配方案为(0,99,0,1,0)。
现在我们来看1号的最优方案。1号被淘汰,则3号和5号一颗也得不到——这是所有海盗均能够预测到的。所以1号方案是给3号和5号各1颗,即方案为98∶0∶1∶0∶1。对该方案进行表决时,3号、5号和1号均同意,这个方案获得通过。
因此,最终的分配方案为(98,0,1,0,1),1号海盗获得了98颗!
在这个分配案例中,我们假定了海盗是理性的,他们每人均有很强的分析能力,能够作出我们上述的分析。若不如此,海盗们会不满意上述的分配方案而大打出手。
海盗分宝石的规则貌似公平:抽签决定分配顺序似乎表明每个海盗的机会相等,提出的分配方案通过表决来进行,看起来也挺*。而分配结果则出人意料,最多的为98颗,最少的为0颗!
公平规则下出现了不公平。
txt电子书分享平台
所罗门的智慧:公平不是平均
所罗门是历史上以色列国的国王,是大卫王的二儿子。他十分具有智慧。
据传说,有两个妇人争夺一个孩子,让所罗门王来裁决。所罗门王说:“既然你们都说,孩子是自己的,然而你们均没有足够的证据证明孩子确实是自己的, 那么就将孩子劈成两半,你们一人一半,这样不就公平了?”所罗门的话是严肃的。此时,所罗门的手下要执行所罗门的命令。其中一个妇人同意这个分法,认为所罗门王英明;而另一个妇人大哭,说:“亲爱的所罗门王,我不要孩子了。整个孩子归她吧。”此时,所罗门对大哭的妇人说:“你才是孩子的母亲。母亲是爱孩子的,宁愿不要孩子,也不要孩子死啊。”所罗门命令手下把那个争孩子的假母亲抓了起来,重重惩罚。
这里,结果是公平的——孩子归他的母亲,而获得这个结果的方式则是充满智慧的。
所罗门王所用的策略是不可重复的,这只有在特殊情况下才能得到:那两个妇人均是在不知道所罗门王的真正意图的情况下表达出自己的偏好的:真母亲首先希望孩子活着,其次才是孩子回到自己的身边;假母亲首先关心的是不要输掉官司,孩子的归属是次要的。
我们看到,这里的公平的分配不是指平均的分配,也不是双方均满意的分配,而是合理的分配。
六、从分蛋糕到财产分割与边界争端的解决:双赢的分配
两人分一个蛋糕,用什么方法才能分配得公平?一个公平的分法是:由其中一人持刀来分,分者后取。这样,分的人因担心后取而吃亏,他所能采用的最好办法是尽量将蛋糕分平均,即使他后拿,也不会吃亏。
分蛋糕只是对同质的东西所进行的一个简单的分配,对不同质的东西能否建立一个像“你分我先取”分蛋糕那样的一个程序,从而做到公平分配吗?美国纽约大学政治系的勃拉姆兹()教授给出了肯定的回答。他提出了一个“双赢”的分配办法。我们来看一下一个离婚的财产分割的例子。假定一对夫妇,安娜和汤姆,感情破裂,不想在一起过日子了。他们到法院进行财产分割。
法官看了他们的财产:冰箱、电脑、缝纫机、烟斗、自行车、书桌。一共有6件。法官叫他们对这6件物品进行轮流选择,所选择的归其所有。当然是女士先选。选择顺序是:安娜,汤姆,安娜,汤姆,安娜,汤姆。
选择的结果是什么呢?我们假定安娜与汤姆对不同物品的偏好不同,比如,安娜作为家庭主妇最喜欢冰箱,认为它也最值钱;而汤姆由于工作的关系更喜欢电脑,认为它更有用。他们对物品的“评价”见表4…2。
表4…2离婚分财产
排序
安娜
汤姆
1
冰箱
电脑
2
缝纫机
烟斗
3
自行车
书桌
4
书桌
自行车
5
电脑
冰箱
6
烟斗
缝纫机
于是,选择的结果是:安娜选了冰箱、缝纫机和自行车,而汤姆选了电脑、烟斗和书桌。安娜得到了6件物品中她认为价值最高的3件物品,汤姆同样得到了他希望得到的价值在前3位的物品。两人对分配均满意。
这是一个双赢分配。
勃拉姆兹的这里给出的分配方法,类似于我们小时候玩游戏时对人员的分配方法。一群小伙伴要被分成两组进行如“斗鸡”、“攻城”,或者“踢足球”等这样的游戏,两个最强的或两个最弱的小伙伴轮流“要”人,或通过“锤子剪刀布”的方式赢家先“要”人,直到人员分配完毕,两个实力大致相当的游戏队伍便形成了。
勃拉姆兹方法所实现的“双赢”分配,其基础是:我们假定了他们对不同的物品的估价“差别较大”,或者说不同物品在不同的人那里其“效用”是不同的。为了分析这里的分配是双赢的结果,我们设定他们对每件物品进行打分,假定满分为100分,安娜和汤姆分别将这100分分配给不同的物品。见表4…3:
表4…3
排序
安娜
汤姆
1
冰箱
28
电脑
30
2
缝纫机
22
烟斗
25
3
自行车
20
书桌
20
4
书桌
15
自行车
15
5
电脑
10
冰箱
5
6
烟斗
5
缝纫机
5
这样,安娜总共得到了70分,而汤姆得到了75分。两人分配得到的结果大大超过了50分。13
如此看来,这样的分配确实是双赢的。
在上述的分配中,我们假定了安娜和汤姆对不同物品的估价或者排序是不同的。如果他们的估价差不多,情形又将如何?
假定安娜和汤姆对不同物品估价后进行的排序为表4…4。与前面一样,同样是安娜先选择,然后是汤姆,接着是安娜……
在这样的选择中,如果每个人进行的选择是诚实的,即每个人进行选择时,都是从剩下的物品中选择自己认为价值最高的物品,那么结果是:安娜选择了冰箱、自行车和缝纫机;而汤姆选择了电脑、烟斗和书桌。
表4…4 诚实的选择
排序
安娜
汤姆
1
冰箱
电脑
2
电脑
烟斗
3
自行车
书桌
4
书桌
自行车
5
缝纫机
冰箱
6
烟斗
缝纫机
在这个分配中,安娜获得了她认为的价值“第一”,“第三”和“第四”的物品,而汤姆获得了他认为价值“第一”、“第二”和“第六”的物品。
这样的分配对双方来说,虽然不是最好的结果,但是双方应该对这个分配结果感到满意的。
在这个例子中,聪明的读者会想到:安娜第一次不选择冰箱,而先选择电脑,情形会怎样呢?即:安娜的选择是策略性的,而不是诚实的。因为,安娜知道在汤姆那里电脑排第一,而冰箱排倒数第二。安娜第一次选择了电脑,轮到汤姆选择时,汤姆不会选择冰箱,而选择了烟斗。结果见表4…5。
在表4…5中,安娜得到了她认为的最值钱的前三位东西。汤姆得到了他认为的第二、第三及第六位价值的物品。
表4…5 策略选择
排序
安娜
汤姆
1
冰箱
电脑
2
电脑
烟斗
3
自行车
书桌
4
书桌
自行车
5
缝纫机
冰箱
6
烟斗
缝纫机
在这个