生活中的博弈论-第6部分

小说：生活中的博弈论字数：每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

　　当然，那种素不相识一对男女，偶尔在酒吧中相遇，于是宾馆订房、春梦一场，拂晓之后就各自分道扬镳的一夜情，是理所当然的一次性囚徒困境博弈。
　　我们在这里要注意的是，重复博弈与我们前面所提及一般性的动态博弈是不同的。在多轮动态博弈中，参与者能够了解到博弈的每一步中其他参与者在这个参与者选择某种策略下的行动，而重复博弈的参与者无法了解到在任何一个步骤中，其它参与者的策略选择。
　　囚徒困境一旦从一次性博弈转变为重复博弈，情况会发生非常大的变化，博弈的结局也就是纳什均衡点可能会完全不同。
　　举个例子，大家都知道国外的黑手党组织严密，对待背叛者的惩罚非常残忍。一个黑手党成员告发别的黑手党成员，一定会被组织谋杀。我们假设前面的囚徒困境故事不是发生在中国，而是意大利，囚犯A和B都是黑手党成员。他们很可能宁愿被判处终生囚禁，也不愿意出狱之后被同伙干掉。
　　实际上，在重复型的囚徒困境中，并不是签订合作协议很困难，困难的是这个协议对博弈各方是否具有很强的约束力。一个合作契约建立的困难在于任何协议签订之后，博弈参与者都有作弊的动机。
　　因为至少在作弊的这一局博弈中，作弊者可以得到更大的收益。还是用爱情来打比方，常言道：“婚姻是走向爱情的坟墓”，但从博弈论的角度来看，婚姻恰恰是男女双方签订的一种协议，具有一定约束力的协议，因为一旦对方背叛婚姻，就会受到家庭的压力与社会舆论的谴责。
　　在博弈理论中，博弈专家已经用数学证明出，在无限次重复博弈的情况下，合作可能是稳固的。如果博弈无穷次，双方就会逐渐从互相背叛走向互相合作。
　　因为任何一次背叛都会招致对方在下一次博弈时的报复；而双方都采取合作态度会带来合作收益。但是在现实社会生活中又不完全这样，人总是要死的，因而人与人之间的博弈不是无限次的。当一个人知道他终将退出博弈时，他就可能不再害怕此后别人对他的报复，从而可以在博弈结束前做损害他人的事情，这就回复到有限次重复博弈的境况。
　　对于有限次囚徒困境博弈，美国密西根大学的罗伯特爱克斯罗德教授（Robert　Axelrod）曾经做过一个著名的博弈论试验。这个试验的思路非常简单：任何想参加这个计算机竞赛的人都扮演“囚徒困境”模型中一个囚犯。他们把自己的策略编入计算机程序，然后这些程序会被成双成对地融入不同的组合。分完组以后，参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间作出选择。试验参与者连续玩上200次，于是这就更逼真地反映了日常人际关系。
　　试验的结果表明，囚徒困境在同样重复数十次或一百次的情况下，只要两个参与者仍然还是理性人（这可以在该试验的参加者所编程序中反映出），博弈的结果仍然是囚徒A和B都把对方招供出来。为了解释这个问题，我们不妨讨论一个博弈两次的模型。
　　我们首先考虑第二次博弈的情况，由于这是最后一次博弈，自然没有后面的博弈对这次博弈的影响，因此也就不必为将来打算，个人都只追求这次博弈的最大利益，于是第二次博弈的结果应该和一次囚徒困境博弈完全一样，自然是囚徒A和B都坦白，达到纳什均衡。
　　现在再来考虑第一次博弈的情况，博弈参与者A已经很清楚最后一次博弈时，B一定会招供，那么即使囚徒A不坦白，在下一次博弈时，B也一定会招供，这次博弈A不坦白对下一次博弈没有任何好的影响，那么作为理性人的A一定仍然选择坦白。对于B，也是一样的道理。由此可见，第一次博弈自然也和一次性囚徒困境博弈完全一样。
　　其实不论是两次博弈，还是3次，4次，甚至是上百次，只要是有限次数的重复囚徒困境博弈，其思路方法都是一样的。这种方法就是我们在前文中提到的倒推法（Backward　induction），这在博弈论中，对于重复博弈与动态博弈是一种重要的分析方法，当然这对我们在日常生活中分析问题也不无裨益。
　　比如，汽车企业之间的价格战往往不是一次性降价，而是一轮一轮地降价，这种类似的问题都可以用有限次囚徒困境模型来分析，事实情况和我们前面的分析完全相同，汽车企业之间每一次的价格博弈的纳什均衡只有一个，那就是全体降价。
　　笔者在这里最后还要补充一个问题，就是多人重复囚徒困境的博弈。实际上，生活中的两人博弈毕竟是特例，绝大部分的情况还是多人博弈，比如上面提到的汽车价格战。在多人博弈中，只有其它所有参与者在第k－1次博弈中都是合作的，某个参与者才会在k次博弈中采取合作策略。
　　然而，这一策略会带来一个协调问题，任何人的一个小小失误都会导致采取背叛策略的其他参与者的数量如同滚雪球一样地愈演愈烈，最终导致所有人的背叛。更糟糕的是，一旦出现这种情况，没有任何人会主动开始合作。因此，我们可以这么说，多人重复囚徒困境（无论有限或无限）中稳定的合作几乎是不可能的。
　　比如1992年英镑事件前后，可以明显感觉到有关游戏各方的思路与分析、行为模式。游戏中的德国、英国、意大利等的共同利益是建立统一的欧洲共同体；而它们在考虑统一货币的利益时，均在强调自己的利益；德国在其中的地位很特殊，它具有双重身份，既是欧洲汇率机制的基础，也是德国货币稳定的保证。这就形成了“囚徒困境”的博弈模型。
　　索罗斯的量子基金发起攻击的主要原因在于：德国联邦银行总裁“暗示”不会放弃德国的利益。而英国、意大利等国家在本国利益受到损害时，也必然倾向于自保。而在这种分歧加剧的背景下，无疑会加重有关各方拒绝承认错误的立场，这又进一步加重了分歧，索罗斯正是利用这套机制获利的。
　　这个结论似乎是一个令人绝望的，但绝望之处必有希望，欧元已经成功地在欧洲大陆通行，成为可以与美元相抗衡的硬通货。这其中的道理，笔者在后面将告诉读者，什么样的游戏规则可以保证博弈各方稳定合作。

威胁、承诺、作弊与惩罚

　　西方哲学家卢梭说过，“究竟是什么不可思议的艺术，使人类找到一种法，通过强迫人们服从，从而使他们获得自由？”
　　其中最著名的一个答案是由托马斯霍布斯给出的。霍布斯是现代英国君主立宪政体的理论奠基人，其代表作是政治学名著《利维坦》（Leviathan）。所谓“利维坦”，是《圣经》中的一种力大无穷的巨兽名字的音译，在书中意指一个强大的国家。
　　霍布斯说：“人的自然本性是自私自利、恐惧、贪婪、残暴无情，人对人互相防范、敌对、争战不已，像狼和狼一样处于可怕的自然状态中。于是出于人的理性，人们相互间同意订立契约，放弃各人的自然权利，把它托付给某一个人或一个由多人组成的集体（如议会、董事会、法院等），这个人或集体能把大家的意志化为一个意志，能把大家的人格统一为一个人格；大家都服从他的意志，服从他的判断。这个人或这个集体就是主权者，而像这样通过社会契约而统一在一个人格之中的一群人就组成了国家。这就是伟大的利维坦的诞生，用更尊敬的方式来说，这就是活的上帝的诞生。”
　　按照他的观点，没有集权的合作是不可能产生的。因此，一个有力的政府是必要的。
　　霍布斯对合作协议的观点是：“不带剑的契约不过是一纸空文。它毫无力量去保障一个人的安全。”这就是说，没有权威的协议并不是导致民主，而是导致无政府状态。最后，霍布斯总结道，“在一切政体中，最坏的政体并不是专制而是无政府状态。”
　　霍布斯的观点虽然有些偏激，但却不无道理。根据博弈论的观点，无论是一次性或有限次重复博弈，“囚徒困境”产生这种结局的原因是两个囚犯都基于自身利益的角度考虑，这最终导致合作协议无法稳定遵守。
　　实际上，决定合作协议是否能够被囚徒双方执行的最关键的基本要素有两个，即承诺与威胁。所谓承诺，在囚徒困境中就是囚徒向对方相互许诺，在下一次博弈时会采取让对方有利的行为，也就是不坦白与对方合作；所谓威胁，就是某个囚徒告知对方如果下一次博弈时其采取招供策略而不合作，在第三次博弈时就会采取不利于对方的策略，即招供。
　　其实，在社会生活中，承诺与威胁是非常常见的现象。比如女生告诉她的男朋友，如果他敢结交其他的女生，只要被发现一次，就立刻分手，这是威胁；而她男朋友向她发誓绝对自己是个专一的情圣，决不会背叛爱情，这就是承诺。
　　再如在外交中，美国经常向中国承诺只承认一个中国的原则，我国政府向国际社会承诺中国强大也决不会采用霸权政策。很多常见的耳熟能详的俗语都是承诺与威胁，比如“人不犯我，我不犯人”、“坦白从宽，抗拒从严”、“以眼还眼，以牙还牙”等。
　　合作的关键是承诺与威胁的可信度有多大。因为承诺与威胁都是在博弈者进行策略选择之前作出的，如果承诺与威胁对博弈者的约束力越小，那么合作的可能性就越小。比如很多手慈心软却遇人不淑的妻子，一次又一次地原谅胡作非为的丈夫，希望用真情感动他回心转意。但结果却往往是丈夫反而得寸进尺，因为他知道无论如何，只要用一些花言巧语假装可怜的承诺就会获得宽恕。在这种情况下，妻子的威胁对丈夫是毫无作用的。
　　假想一个可信度很小的承诺与威胁。比如参加考试的学生承诺在没有老师监考的时候决不作弊，但却不难想象监考老师不在的时候，考场中将会是一种什么样的景象。
　　学生并不都是道德高尚、具有很强自制能力的人。即使在有老师监督考场，并威胁如果有学生敢于顶风作案，必然严惩不怠，比如考卷直接判零分。设想一下，如果这种威胁仅仅是威胁，在学生作弊后并未真地采取什么严惩的行动，那么学生作弊的风险非常小，考场纪律依然与没有老师一样。由此可见，监考老师在一定程度上不得不要做一个霍布斯所说的“利维坦”式的专制者。
　　从实际的整个社会生活说来，对于有限次重复博弈合作问题的解决主要有两个典型方法，那就是社会道德与国家法律。至于其他解决方法在本质上并不会超脱于它们。

猴子的故事与道理约束

　　亚当斯密在写完《国富论》与市场这只“看不见的手”之后，转而又写了本《道德情操论》，专门论述个人道德与社会道德是维持市场经济的基本要素之一。
　　亚当斯密告诉我们：最商业化的社会，也是最讲究道德的社会，比如16世纪时荷兰人就比英国人值得信赖，当时荷兰的商业比英国发达，反之亦然。
　　人类道德的产生一般有两种解释：
　　一是纯文化因素起作用，有些国家道德程度高，有些国家则低。如北欧人之间的道德感高于意大利人的道德感。
　　二是宗教信仰的原因，怕上帝惩罚你，所以有宗教信仰的人道德感就要强于一般人。如在美国，教会的人道德感比较强，因为他们认为若不道德，将来会进地狱。在这种解释中，道德是外界强加于人们的，使人们不违约。而笔者主要想给出的是第二种解释，即博弈论是如何解释道德的。
　　道德可以打破囚徒困境的难题，化解个人理性与社会群体理性的矛盾，维系整个社会经济体系的稳定与发展。关于这一点，我们来看一个猴群博弈的故事。近两年这个故事一直流传于中文网络各大论坛与社区。
　　有一群猴子被关在笼子里。在笼子里的上方有一条绳子，绳子拴着一个香蕉，绳子连着一个机关，机关又与一个水源相连。
　　猴子们发现了香蕉，有猴子跳上去够这个香蕉，当猴子够到时，与香蕉相连的绳子带动了机关，于是一盆水倒了下来，尽管够到香蕉的猴子吃到了香蕉，但其他猴子被淋湿了。这个过程一直重复着。
　　猴子们发现，尽管有猴子吃到香蕉，但吃到香蕉的猴子是少数，而其余的大多数猴子都被淋湿。经过一段时间，有一伙猴子自觉地行动起来，当有猴子去抓香蕉时，它们便揍那个猴子。每当有猴子去取香蕉，就有其他的猴子因愤怒而自动地去撕咬那个猴子，久而久之，猴子们产生了合作，再也没有猴子敢去取香蕉了。
　　在这个故事里，猴子间产生了“道德”。如果这群猴子构成一个社会，它们也繁衍下一代，它们会将它们的经历告诉下一代，渐渐地猴子们便认为取香蕉的后果对其他猴子不利，从而认为去取这个香蕉是“不道德的”，它们也会自动地惩罚“不道德的”猴子。当然这只是一个故事，但这个博弈故事却反映了人类的道德的产生过程。
　　霍布斯认为人类在没有任何约束的自然状态中，就是“人与人之间像狼与狼一样”，是“每个人对每个人的战争”。在这种状态中，每个人都力图保护自己的利益，并企图占有别人的东西，此时，每个人是每个人的敌人。此时没有任何规则，没有财产，没有正义或不正义，只有战争。武力与欺诈是战争中的两大基本德性。因此人类在自然状态下无法产生文明。
　　与国家一样，道德也是对某些不合作行动的惩罚机制。这种机制的出现使得人类从囚徒困境中走出来。人的正义与非正义的观念产生了道德感。
　　道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人采取不合作，从而使得不道德的人遭受损失。这样，社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道德，正义或非正义的观念，就自动地产生了调节作用。
　　当然，道德约束有其自身的局限性。它对不道德的行为的抑制是有限度的，当不道德的

返回目录上一页下一页回到顶部赞（0）踩（0）

第6部分

生活中的博弈论-第6部分

你可能喜欢的