八宝书库 > 文学其他电子书 > 无知的博弈:有限信息下的生存智慧 >

第3部分

无知的博弈:有限信息下的生存智慧-第3部分

小说: 无知的博弈:有限信息下的生存智慧 字数: 每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



这样的博弈中,胜负似乎并不太依赖谁的策略技巧更高,而取决于谁的“运气”更好。与其说你跟朋友在博弈,不如说你跟上帝在博弈。
  在现实的许多博弈中,不确定性都扮演着重要的角色。然而,在这样的博弈中,取胜仅仅是依靠运气吗?也许不是。即便在不确定的世界,如果可以发展出更好的策略,虽不能保证万无一失,但是取胜的可能性的确会增加;或者通过某些对付风险的策略,你也可以将不确定性带来的风险降低。在本章你会见到大量的此类例子。这些例子基本上不需涉及复杂的策略互动,但估计不确定环境的概率非常重要。因此本章命名为概率决策,而更为复杂的策略互动情形是以后各章的主题。
  【更新慢或者章节错误,点击举报(请详细说明)】



'11'概率与信息推断

  什么是概率
  一个试验可能存在多个潜在的结果,但究竟哪种结果会出现,则是不确定的。这些不确定的试验结果被称做随机事件。譬如,抛硬币包含两个随机事件:正面或反面;要么出现正面,要么出现反面,但究竟哪一面出现是不确定的。掷骰子包含了六个随机事件,分别为1、2、3、4、5、6点;但每掷一次骰子究竟会出现哪个点数,是不确定的。
  概率可以被看做独立随机试验中,事件出现的频率。比如,抛1万次硬币,正面向上的次数约5 000次,则抛硬币试验中正面向上的概率就是0。5。掷骰子12万次,出现每一个点数的频率大致是2万次,则掷骰子试验中每个点数出现的概率为1/6。
  任何一个随机事件,都可能发生或不发生。一定要发生的事件被称为必然事件,一定不会发生的事件被称为不可能事件。必然事件和不可能事件,都不是随机事件。随机事件最终的结果,也只能是发生或不发生两者之一,不允许出现既发生又不发生的情况。而且,我们也不允许因为随机事件后来并没有发生,而否认它在先前所具有的发生的可能性。譬如,天气预报说明天有0。3的概率会下雨,真实的情况是到了明天没有下雨,但我们不能因为明天没有下雨而否认了其原本具有的下雨的可能性。随机事件的不确定,存在于结果被确定的过程之中;一旦结果实现了,随机事件的随机性就消失了,但这并不能否认在结果实现之前的随机性。
  为了想通这个道理,不妨考虑在一个毒杀暗器飞来飞去的小屋里关进一只猫。当这只猫在屋子里时,我问你它的生死状态如何?你会回答不知道,因为这只猫可能还活着,也可能死去了。它的状态就是在生死之间徘徊、可能生可能死的状态。但是,若打开屋子发现猫还活着,这只猫会告诉你它一直是活着的,从没经历死的状态。但是,它仍活着这个事实,并不能否认它曾经面临死亡的可能性。
  我们遭遇的许多概率事件是客观的。投掷硬币,若硬币是均匀材质的话,那么当试验次数趋于无穷的时候,出现正面或反面的概率一定都是0。5。这是客观的概率。但是,生活中有很多时候,我们难以对一个随机事件进行大量的重复试验。甚至有些不确定的事件,我们一生只遭遇一次,此时我们怎么评估事件实现的概率?通常我们会对其实现的可能性进行一个主观评估。这就是主观概率。我们很难说明主观概率是否合理,或者一个人的主观概率判断是否正确,但是在决策的时候我们自觉不自觉地都使用到了主观概率。而且,确实存在这样的事实:有经验的人比没有经验的人更能准确地判断形势。或者说,经验有助于提高主观概率的合理性或准确性。经验更丰富的人所做出的决定在事后被验证为恰当的频率要比缺乏经验的人高得多。这可能是经验在决策中占据重要地位的原因。
  也许有读者还会问,为什么有经验的人比缺乏经验的人能做出更恰当的决定?对此的一个解释是,错误的决定对个人的成功多多少少会有所妨碍,恰当的决定对个人的成功多多少少会有所促进;从而,在优胜劣汰的竞争过程中,经常做出错误决定的人可能会被进化的筛子过滤掉,而那些仍能留存在筛子上的人,他们往往是能够“经常”做出恰当决定的人—他们就是经验丰富者,他们对于形势的判断本身就更可能是恰当的。这里也顺便提醒读者,博弈论是理论的科学,与他人博弈则还需要现实的经验。所以,读者不应寄希望于几本讲述策略行为的著作就能使你成为博弈高手。理论可以帮我们洞察某些局势,但是它永远都不能取代经验。
  逆概率推断
  与上帝博弈时,人们会形成对上帝之选择的主观信念(上帝选择各状态的概率分布),但是某些时候一些相关的事件发生了,导致人们需要修正对于上帝之选择的信念。或者说,人们有时会面临这样的问题:需要从观察到的结果去推断潜在信息的可能性—估计潜在状态的概率。
  理解上述问题的最佳方式是举例。比如,上帝可以选择一个人是否患上某种遗传缺陷,并且一个人患上遗传缺陷的概率是1%。某项健康检查技术有99%的精确性可以发现这种遗传缺陷,即如果一个人真有遗传缺陷,那么他只有1%的机会未发现该缺陷;如果他没有遗传缺陷,但该项检查也有1%的机会误报其有遗传缺陷。我们感兴趣的是,当检查报告一个人有遗传缺陷的时候,他真的有遗传缺陷的概率是多少?也就是说,给定我们的观察,我们在多大程度上能确定潜在条件是现实存在的?
  不妨用简单的数字运算来回答这个问题。设人口总数为10 000人,其中100人(1%)有缺陷,而9 900人没有。全部人口都做了该项检查,结果是100个有缺陷的人中被报告为确实有缺陷的人数为99人;而9 900个无缺陷的人中也有99人被(错误地)报告为有缺陷。即检查报告为有缺陷的人数是198人,而这当中实际上只有一半(99)的人是真的有缺陷,另外一半实际上是没有缺陷的。所以,有缺陷报告只意味着被报告人有50%的概率存在遗传缺陷。
  上述推理过程,是根据结果来推断概率,因此也被称为逆概率推断。逆概率推断主要用到贝叶斯公式(见页下注或本书附录)。贝叶斯公式和逆概率推断思想在有限信息博弈分析中占有非常重要的地位。因为非对称信息博弈中,人们常常会通过观察对手的言行来判断对手的类型,或者说对手的言行往往传递着对手类型的信息,每当观察到对手的言行之后,博弈参与人就可以并且应当就这些观察到的言行对对手的类型进行重新推断以更新其信念,这种信念更新的逻辑过程正是按照贝叶斯公式来的。在第3章“察觉蛛丝马迹”一节,大家可以看到从对手言行推断对手类型信息在博弈中的重要性。
  【更新慢或者章节错误,点击举报(请详细说明)】


'12'与上帝博弈(1)

  单人决策问题,一般不认为是博弈问题。但是,博弈论对于考察单人面临的不确定决策问题也是适用的。我们可引入一个虚拟的参与人—上帝,他的策略空间就是随机试验的各种状态;然后假设参与人是跟上帝进行博弈。上帝对任何结果的偏好都是一样的,所以他事先随便选择了他的策略,但你并没有观察到上帝的选择。而你,则需要考虑如何才能更好地对付上帝,使自己的(预期)赢利达到最大。正所谓与天斗,其乐无穷。现在我们来看几个与上帝博弈的例子。
  该不该改变最初的选择
  下面要讲到的例子与美国20世纪70年代的一个电视节目有关,其中的概率计算曾困扰着成千上万的大众。在节目中,节目参与者将在三扇门之间选择其中一扇。这三扇门中有且仅有一扇门的后面放着奖品,另外两扇门则放着讽刺性礼品比如鸡崽(chicken)或者笨驴(donkey)。当节目参与者选定一扇门之后,主持人就会打开另外两扇门中没有奖品的一扇。然后在剩下的两扇关闭的门中,主持人会问参与者要不要改变最初的选择。
  这里的问题就是:参与人希望获得奖品,而不是获得讽刺性礼品,那么现在仍关闭的两扇门中,他应当坚持最初的选择呢?还是改变主意选择另外一扇门?
  大多数人凭直觉认为,剩下的两扇门中,每扇门后有奖品或没有奖品的概率各占50%。因此,改变主意选择另外一扇门和坚持最初的选择不改变,预期的赢利是一样的。的确,这种思路看来是没有什么错。因为在做最初的选择时,选择“碰巧是”正确的概率为1/3;而一旦选择之后,剩下两扇门,参与者从主持人的行为中所能得到的信息就只是将信念修正为自己选择正确的概率为1/2,选择失误的概率也是1/2。此外没有任何其他的信息改善。因此,他坚持原来的选择似乎可以说得过去。
  但是,上述看法并不符合真实的情况。真实的情况是,若参与者改变自己最初的选择,那么获得奖品的概率是2/3,若不改变最初的选择,则获得奖品的概率仅为1/3。他应该改变自己最初的选择。
  奇怪的是,将这个结果告诉参与者后,他们还常常难以理解为什么会这样。一种比较浅显的解释是这样的:在最初的选择中,选择了错误门的概率是2/3。如果参与人一开始的确选择了错误的门,那么主持人随后必然打开空门,而没有被打开的那一扇就必然有奖品,此时参与人显然应该改变主意转换到自己没选择也没有被打开的那扇门。如果最初的选择中参与人的确选正确了(概率为1/3),那么他显然应该坚持,并因此获得奖品。也就是说,如果参与人一开始就选错了,则参与人应该换门并一定获得奖金,如果参与人一开始就选对了,则应该坚持并一定获得奖金—于是,转换门获得奖金的概率与不转换门获得奖金的概率实际上就是最初选择是正确和错误的概率。而一开始,选择错误的概率是2/3,正确的概率是1/3。因此,在不知自己选择是正是误的情况下,在第二阶段改变主意转换到另一扇门,的确增加了获得奖品的概率。
  对于有些喜欢做实验的读者,如果你不明白上述道理,那么我建议你做这样一个游戏:准备三张扑克和一枚硬币,让你的朋友来当节目主持人将三张牌铺在桌面上(并将那枚硬币放在其中一张之下);然后你来选择一张牌;你的朋友从你没选取的牌中拿走没有硬币的一张,再问你是否改变你当初选的牌。为了证明转换选择比不转换选择更有可能获得奖品,你可以尝试以“转换选择”为策略进行数十次(比如50次)实验,再以“不转换选择”为策略进行同样多次数(比如50次)的实验。结果你会发现什么?你将发现“转换选择”的策略中得到硬币的次数基本上是“不转换选择”策略中得到硬币的次数的两倍,而这两种策略中硬币出现的频率也基本上分别接近2/3和1/3。
  【更新慢或者章节错误,点击举报(请详细说明)】



'13'与上帝博弈(2)

  当然,在一次性节目中,并不允许这样的重复实验。而且大多数人的确也不明智地选择了“不转换选择”。我曾在学生中做过这个实验,结果32人中有20人坚持“不转换选择”。这说明大多数人不清楚这样复杂的概率思考。更有意思的是,我跟我太太玩这个游戏时,她也是坚持“不转换选择”。当我告诉她如果转换可以成倍提高获奖概率时,她却说:如果我开始选对了,转换后结果错了就会后悔,所以心理素质好的就不应该转换。当然,她说的已经不是纯粹的概率计算,但也不是没有道理的。人们的行为的确不仅受制于各种精心的算计,也往往受制于某些心理因素(比如后悔)。不过,我对她的答案疑问在于:“如果开始选择对了,那么后来转换了选择会令人后悔。但是,如果后来你知道开始的选择错了,而你又没有转换选择,你就不后悔没有转换吗?”太太的回答更经典:“一开始选择错了,我只认为是运气不好,没什么可后悔的;如果开始对了,后来转换错了,才是后悔的。”这让我立即想到人们日常生活中常提到的道理:从没得到的东西,也就不会有失去它的痛苦,而已经得到的失去了,就会深感创伤。从太太的回答中,我突然明白了为什么行为博弈理论(behavioral game theory)现在大行其道。
  乘车的最佳策略
  一名游客要去某风景区游玩。每天开往风景区的只有三辆交通车,两趟车前后的间隔时间为5分钟。三辆车票价相同,但舒适程度则有高、中、低之分。这个游客不知道哪辆车最舒适,也不知道汽车开过来的顺序。不过对于他来说,多等5分钟或10分钟时间并无所谓,关键是要坐上最舒适的那辆车。
  那么这名游客采取什么样的候车策略,才最可能搭上最舒服的那辆车呢?
  这个问题,当然是一个单人决策问题,是不确定环境下的决策问题。这里的不确定性,源于游客对于不同舒适程度的三辆车开过来的顺序并不清楚。但列举起来,行车顺序无非有如下六种状态:上中下、上下中、中上下、中下上、下中上、下上中。那么我们可以虚拟一个参与人,即上帝,他选择的策略空间就是这六种状态。而且上帝这个参与人比较奇怪的一点就是,选择任何状态对他的赢利都是一样的,所以他在这六个策略之间以相同的频率随机地选择。
  游客的目的是希望尽可能搭乘最舒适的车。他可以考虑的最简单的候车策略是:任意选择一辆车搭乘。他这样“随便”的选择,使他搭乘到最舒适的车的概率为1/3,这个结果一般的读者都能明白。
  当然,游客也可以设计复杂一点的策略:第一辆车不上,如果第二辆比第一辆好就上第二辆,如果第二辆比第一辆差就上第三辆。这样的策略会使其搭上最舒适的车的可能性是多少?不妨把上帝可以选择的六种状态全列举出来,然后看看在哪些状态下,游客的这个策略刚好使他能够搭上最舒适的车(见图2…1):
  上帝选择车序 上中下 上下中 中上下 

返回目录 上一页 下一页 回到顶部 0 0

你可能喜欢的