友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
聚奇塔 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

妙趣横生博弈论-第13部分

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



和精度,来识别出谁是最佳的象棋选手。
  我们可以通过对大量的象棋博弈和象棋选手进行观察,提炼“知识”,然后总结出规律。对此的大部分研究都集中在开局,即棋局刚走了10步或者15步时。有很多书籍对不同的开局进行了分析和比较,讨论了它们的优缺点。
  计算机是怎样做到这一点的?编制电脑象棋程序曾经被认为是新兴人工智能科学的组成部分;它的目的是为了设计出能像人类一样思考的计算机。可惜研究了很多年都没能成功。后来,人们的注意力开始转向利用计算机做它们最擅长的事情——数字运算。计算机可以向前多展望几步,而且展望得比人类更快。到20世纪90年代末,像菲兹(Fritz)和深蓝(Deep Blue)这样的象棋电脑,已经可以利用纯粹的数字运算,与人类最优秀的象棋选手进行较量了。再后来,一些中盘局面的知识也被编入电脑程序,这些知识是由一些最优秀的人类棋手所传授的。txt电子书分享平台 

公平和利他主义的演化(3)
但是,优秀的象棋选手可以利用他们掌握的知识,立即区分出哪步棋不该走,而不需要向前展望四五步棋来预测其结果,这样他们就省下了推理哪步棋比较好的时间和精力。人类棋手的等级是根据他们的业绩评定的;最高等级的电脑已经达到了相当于2800等级分的级别,这相当于世界最强的象棋大师加里·卡斯帕罗夫(Garry Kasparov)的水平。2003年11月,卡斯帕罗夫与最新版的菲兹电脑X3D进行了一场四轮赛。结果是双方各胜一局,打平两局。2005年7月,Hydra象棋电脑在一场六轮赛中,以五胜一平的成绩打败了世界排名第13位的迈克尔·亚当斯(Michael Adams)。估计在不久的将来,电脑可能会成为顶级高手,然后它们之间开始相互较量,争夺世界象棋冠军。
  大家将从中学到什么呢?它说明了考虑复杂博弈的方法,这些复杂博弈是大家可能会面临的。你应该在你的最大推理范围内,把向前展望、倒后推理的规则和引导你判断中盘局面价值的经验结合起来。成功源于对博弈论科学和具体的博弈艺术的综合,而不是来自它们其中之一。
  一心二用
  象棋策略说明了向前展望、倒后推理方法的另一个实用性特征:你必须从参与者双方的角度来进行博弈。虽然根据复杂的博弈树来估计自己的最佳行动比较困难,但预测对方的行动比这还要困难得多。
  如果你和对方真的可以分析出所有可能的行动和反行动,那么,你们俩就会事先在整个博弈的结果将会如何的问题上达成一致。但是,一旦这个分析只限于考察整个博弈树的某些分支,对方就可能获得一些你没有的或者你错过的信息。这样,接下来对方就可能采取一个你未曾预料到的行动。
  要真正做到向前展望、倒后推理,你必须预测对方实际会采取什么行动,而不是你站在他们的立场将会采取什么行动。问题在于,当你尝试站在对方的立场时,要忘掉自己的立场,这虽然不是不可能,但也是非常困难的。你太清楚自己下一步的行动计划了,而且当你从对方参与者的视角观察这个博弈时,你很难将自己的意图抹掉。的确,这解释了为什么人们不自己和自己下棋(或玩扑克)。你肯定不能向自己虚张声势,然后再出其不意地攻击自己。
  这个问题不存在完全的解决方法。当你尝试站在对方的立场上看问题时,你必须知道他们知道的信息,不知道他们不知道的信息。你的目标必须是他们的目标,而不是你所希望的他们的目标。在实践中,试图对潜在商业场景中的行动和反行动进行模拟的公司,通常都会聘请局外人来扮演其他参与者的角色。这样一来,他们可以确保他们的博弈搭档不会知道得太多。通常,最大的收获来自于看到了未预料到的行动后,找出导致这个结果的原因,以避免或者促进这一结果。
  在本章结束时,我们回到查理·布朗是否该去踢球的问题。这是足球教练汤姆·奥斯本(Tom Osborne)在锦标赛最后时刻面临的真正问题。我们认为他也做错了。通过倒后推理分析,我们可以知道他错在哪里。
  汤姆·奥斯本与1984年度橘子杯决赛的故事
  在1984年的橘子杯决赛中,战无不胜的内布拉斯加乡巴佬队(Nebraska Cornhuskers)与曾有一次败绩的迈阿密旋风队(Miami Hurricanes)狭路相逢。因为内布拉斯加乡巴佬队晋身决赛的战绩高出一筹,所以只要打平,它就能以第一的排名结束整个赛季。。 最好的txt下载网

公平和利他主义的演化(4)
在第四节,内布拉斯加乡巴佬队以17∶31落后。接着,它发动了一次反击,成功触底得分,将比分追至23∶31。这时,内布拉斯加乡巴佬队的教练汤姆·奥斯本面临一个重大的策略抉择。
  在大学橄榄球比赛中,触底得分一方可以从距离入球得分只有25码的标记处开球。该队可以选择带球突破或将球传到底线区,再得2分;或者采用一种不那么冒险的策略,将球直接踢过球门柱之间,再得1分。
  奥斯本选择了安全至上,内布拉斯加乡巴佬队成功射门得分,比分变成了 24∶31。该队继续全力反击,在比赛最后阶段,它最后一次触底得分,比分变成了30∶31。只要再得1分,该队就能战平对手,取得冠军头衔。不过,这样取胜不够过瘾。为了漂亮地拿下冠军争夺战,奥斯本认为他应该在本场比赛取胜。
  内布拉斯加乡巴佬队决定要用得2分的策略取胜。但欧文·费赖尔(Irving Fryar)接到了球,却没能得分。迈阿密旋风队与内布拉斯加乡巴佬队以同样的胜负战绩结束了全年比赛。由于迈阿密旋风队击败内布拉斯加乡巴佬队,最终获得冠军的是迈阿密旋风队。
  假设你自己处于奥斯本教练的位置。你能不能做得比他更好?
  案例讨论
  星期一出版的许多橄榄球评论文章纷纷指责奥斯本不应该贸然求胜,没有稳妥求和。不过,这不是我们争论的核心问题。核心问题在于,在奥斯本甘愿冒更大风险一心求胜的前提下,他选错了策略。他本来应该先尝试得2分的策略。然后,假如成功了,再尝试得1分的策略;假如不成功,再尝试得2分的策略。
  让我们更仔细地研究这个案例。在落后14分的时候,奥斯本知道他至少还要得到两个触底得分外加3分。他决定先尝试得1分的策略,再尝试得2分的策略。假如两个尝试都成功了,那么使用两个策略的先后次序便无关紧要了。假如得1分的策略失败,而得2分的策略成功,那么先后次序仍无关紧要,比赛还是以平局告终,内布拉斯加乡巴佬队赢得冠军。先后次序影响战局的情况只有在内布拉斯加乡巴佬队尝试得2分的策略没有成功时才会发生。假如实施奥斯本的计划,这将导致输掉决赛以及冠军头衔。相反,假如他们先尝试得2分的策略,那么,即便尝试失败,他们也未必会输掉这场比赛。他们仍然以23∶31落后。等他们下一次触底得分,比分就会变成29∶31。这时候,只要他们尝试得2分的策略成功,比赛就能打成平局,他们就能赢得冠军头衔!
  而且,这将是尝试取胜的努力失败之后导致的平局,因此没有人会因为奥斯本一心想打成平局而批评他。我们曾经听到有人反驳说,假如奥斯本先尝试了得2分的策略,却没有成功,那么他的球队就会只为了打平而努力。但这样做不是那么鼓舞人心,并且他们很有可能不能第二次触底得分。更重要的是,等到最后才来尝试这个已经变得生死攸关的得2分策略,他的球队就会陷入成败取决于运气的局面。这种看法是错的,有几个理由。记住,如果内布拉斯加乡巴佬队等到第二次触底得分才尝试得2分的策略,一旦失败,他们就会输掉这场比赛。假如他们第一次尝试得2分的策略失败,他们仍有机会打平。即使这个机会可能比较渺茫,但有还是比没有强。激励效应的论点也站不住脚。虽然内布拉斯加乡巴佬队的进攻可能在冠军决赛这样重大的场合突然加强,但我们也可以指望迈阿密旋风队的防守也会加强。因为这场比赛对双方同样重要。相反,假如奥斯本第一次触底得分后就尝试得2分的策略,那么在一定程度上确实存在激励效应,从而提高第二次触底得分的概率。这也使他可以通过两个3分的射门打平。书 包 网 txt小说上传分享

公平和利他主义的演化(5)
从这个故事中可总结的教训之一是,如果你不得不冒一点风险,通常是越早冒险越好。这一点在网球选手看来再明显不过了:人人都知道应该在第一次发球的时候冒风险,第二次发球则必须谨慎。这么一来,就算你第一次发球失误,比赛也不会就此结束。你仍然有时间考虑选择其他策略,并借此站稳脚跟,甚至一举领先。越早冒险越好的策略同样适用于生活中的大多数方面,无论是职业选择、投资还是约会。
  更多关于向前展望、倒后推理原理的实际运用,请看第14章的一些案例分析:“祝你好运”、“红色算我赢,黑色算你输”、“弄巧成拙的防鲨网”、“硬汉软招”、“三方对决”和“糊涂取胜”。妙趣横生博弈论第3章囚徒困境及其克服第3章囚徒困境及其克服
  多种情景,一个思想
  以下的情景有何共同点?
   位于同一个街角的两家加油站,或者同一片街区的两家超市,有时会彼此展开激烈的价格战。
   在美国大选活动中,*党与共和党通常都会采取中间政策,以吸引那些处于政治光谱中翼的选民,却忽略了他们那些分别持极“左”或极右态度的核心支持者。
   “新英格兰渔业的多样性和生产力曾经是无可匹敌的。然而在过去的一个世纪,由于过度捕捞而最终导致物种相继灭绝已成为一种趋势。大西洋比目鱼、海鲈、黑线鲟和黄尾比目鱼……(均被列入了)商业灭绝的物种行列。”
  答对了也没有奖励——毕竟,囚徒困境是本章讨论的主题。但是,正如我们在第2章中所做的,我们借此机会指出,博弈论的一般概念性框架,可能有助于我们理解各种各样的变体以及看似无关的现象。我们还应该指出的是,毗邻的商店并不经常忙于打价格战,政党们也并非总是围绕权利中心而战。事实上,分析和说明这类博弈中的参与者如何能避免和解决困境,才是本章的一个重要部分。 在约瑟夫·海勒(Joseph Heller)的著名小说《第22条军规》结尾,第二次世界大战胜利在望。尤塞里安不想成为胜利前夕最后一批牺牲者,因为这对于战争结果毫无影响,他向上司丹比少校解释道。丹比问:“可是,尤塞里安,如果大家都这么想呢?”尤塞里安答道:“那么,我若是不这么想,岂不就成了大傻瓜?”
  答案:这些都是囚徒困境的实例。就像《冷血》第1章中讲述的对迪克·赫克考克和佩里·史密斯的审讯,当人人都按照自己的个人利益行事时,每个人都有其个人动机,最终采取了对各方都不利的行为。若其中一个人坦白,那么另一个人最好也坦白,以免因抗拒从严而遭到严厉判决;反之,若其中一个人坚持沉默,�
返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!