博弈论的诡计(1)-第6部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
量去保障一个人的安全。”这就是说,没有权威的协议并不能导致民主.而是
导致无政府状态。
囚徒困境扩展为多人博弈时,暴露了一个更广泛的问题——“社会悖论”,
或“资源悖论”。人类共有的资源是有限的.当每个人都试图从有限的资源中
多拿一点儿时,就产生了局部利益与整体利益的冲突。人口问题、资源危机、
交通阻塞,都可以在社会悖论中得以解释。在这些问题中,关键是制定游戏
规则来控制每个人的行为。
另外,学者爱克斯罗德所著的《合作的进化》一书暗含着一个重要的假
定,即个体之间的博弈是完全无差异的。但对局者之间绝对的平等是不可能
达到的,因而某些博弈对一方来说是典型的高成本、低回报:一方面,对局
者在实际能力上存在不对称.双方互相背叛时,可能不是各得1分,而是强
者得5分,弱者得0分,这样,弱者的报复就毫无意义;另一方面.即使对
I z日
重复博弈:一夜情与地老天荒
局双方确实旗鼓相当,但某一方可能怀有赌徒心理,认定自己更强大,采取
背叛的策略能占便宜。爱克斯罗德的分析忽视了这种情形,而这种事实或心
理上的不平等恰恰在社会上引发了大量零和与负和博弈。
在这种情况下,应通过法制手段。以法律的惩罚代替个人之间的“一报
还一报”,才能规范合作行为。事实上.从博弈论的角度看,法律就是通过第
三方实施的行为规范,其功能是或者通过改变当事人的选择空间改变博弈的
结果,或者不改变博弈本身而改变人们的信念或对他人的行为预期,从而改
变博弈的结果。
用道德来保证均衡
带剑的契约对于保证合作关系是有效的,但是在更多的情况下,我们根
本找不到,或者不值得用“剑”也就是法律来保证合作。那么在这时,有没
有其他办法来达到均衡呢?答案是肯定的。如果法律是保证人与人关系之间
的唯一武器,那么博弈策略也就没有什么价值了。作家吴思在《潜规则》中
曾经讲了这样一个故事,可以作为一个引子。这个故事来自《明史》,是一个
监察官员的故事。
崇桢元年(1628年),朱由检刚刚当上皇帝,发出了“文官不爱钱”的号
召。户科给事中韩一良对这种号召颇不以为然.就写了份上疏,说道:如今
何处不是用钱之地?哪位官员不是爱钱之人?本来就是靠钱弄到的官位.怎
么能不花钱偿还昵?…··我这两个月辞却了别人进我的出书费用五百两银
子,我交往少尚且如此,其余的可以推想了。伏请陛下严加惩处,逮捕处治
那些做得过分的家伙。崇祯读了韩一良的上疏。立刻召见群臣.让韩一良当
众念他写的这篇东西。读罢,崇祯对大臣们说:“一良忠诚耿直,可以当佥都
御史。”
这时,吏部尚书王永光请求皇帝,让韩一良点出具体人来.究竟谁做得
过分.又是谁送他银子。韩一良吞吞吐吐,显出一副不愿意告发别人的样子。
于是崇桢让他密奏。等了五天,韩一良谁也没有告发。崇祯再次把韩一良和
一些大臣召来,当面追问。然而韩一良就是不肯点名。崇桢让韩一良点出人
。9 l
壤
莲‰{}:掣——一
名,本来是想如他所请的那样严加惩处,而韩一良最后竞推说风闻有人要送。
祟祯训斥韩一良前后矛盾,撤了他的职。
韩一良宁可叫皇帝撤掉自己的官职,断送了自己的前程.甚至顶着被治
罪的风险,硬是不肯告发那些向他送礼行贿的人,他背后必定有强大的支撑
力量。这是一种什么力量々难道只是怕得罪人?作为给事中,检举起诉和得
罪人乃是他的分内事。因此,恐怕还是一种外在规则的压力,或者说外在规
则在其内心中形成的“道德”在起作用,使其坚决不肯背叛向他行贿的人。
上面这个历史故事讽刺性地告诉我们:在现实环境中,确实存在着一些
道德因素,可以化解个人理性与群体理性的矛盾,维系整个社会的稳定。
有一群猴子被美在笼子里,从笼子上方垂下一条绳子,绳子末端拴着一
个香蕉,上端连着一个机关,机关可以开启水源。猴子们发现了香蕉。纷纷
跳上去够这个香蕉.当猴子够到香蕉时,相连的绳子带动了机关,于是一盆
水倒了下来,尽管够到香蕉的猴子屹到了香蕉,但大多数猴子被淋湿了。
这个过程重复着,猴子们发现.吃到香蕉的猴子是少数,而其余的大多
数猴子都被淋湿。于是,每当有猴子去取香蕉,就有其他的猴子主动地去撕
咬那个猴子。久而久之,猴子们产生了默契,再也没有猴子敢去取香蕉了。
在这个故事里,猴子问产生了“道德”。猴子们认为取香蕉的后果对其
他猴子不利,因而取香蕉是“不道德的”,它们便会主动地惩罚“不道德的”
猴子。
与法律一样,道德也是对某些不合作行动的惩罚机制。这种机制的出现
使得人类从囚徒困境中走出来。道德感自然地使得人们对不道德的或不正义
的行为谴责或者对不道德的人采取不合作,从而使得不道德的人遭受损失。
这样,社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道
德、正义或非正义的观念,就自动对行为产生了调节作用。
但是在日常生活的交际中,单纯依靠对手的道德自律来达成合作是不
保险的。针对这个问题.我们可以通过对道德因素的考虑,对博弈策略进
行相应的调整.把交际变成长期的、多边的,从而形成诚实守信的动力与
压力。
l 5。
壤
莲‰{}:掣——一
名,本来是想如他所请的那样严加惩处,而韩一良最后竞推说风闻有人要送。
祟祯训斥韩一良前后矛盾,撤了他的职。
韩一良宁可叫皇帝撤掉自己的官职,断送了自己的前程.甚至顶着被治
罪的风险,硬是不肯告发那些向他送礼行贿的人,他背后必定有强大的支撑
力量。这是一种什么力量々难道只是怕得罪人?作为给事中,检举起诉和得
罪人乃是他的分内事。因此,恐怕还是一种外在规则的压力,或者说外在规
则在其内心中形成的“道德”在起作用,使其坚决不肯背叛向他行贿的人。
上面这个历史故事讽刺性地告诉我们:在现实环境中,确实存在着一些
道德因素,可以化解个人理性与群体理性的矛盾,维系整个社会的稳定。
有一群猴子被美在笼子里,从笼子上方垂下一条绳子,绳子末端拴着一
个香蕉,上端连着一个机关,机关可以开启水源。猴子们发现了香蕉。纷纷
跳上去够这个香蕉.当猴子够到香蕉时,相连的绳子带动了机关,于是一盆
水倒了下来,尽管够到香蕉的猴子屹到了香蕉,但大多数猴子被淋湿了。
这个过程重复着,猴子们发现.吃到香蕉的猴子是少数,而其余的大多
数猴子都被淋湿。于是,每当有猴子去取香蕉,就有其他的猴子主动地去撕
咬那个猴子。久而久之,猴子们产生了默契,再也没有猴子敢去取香蕉了。
在这个故事里,猴子问产生了“道德”。猴子们认为取香蕉的后果对其
他猴子不利,因而取香蕉是“不道德的”,它们便会主动地惩罚“不道德的”
猴子。
与法律一样,道德也是对某些不合作行动的惩罚机制。这种机制的出现
使得人类从囚徒困境中走出来。道德感自然地使得人们对不道德的或不正义
的行为谴责或者对不道德的人采取不合作,从而使得不道德的人遭受损失。
这样,社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道
德、正义或非正义的观念,就自动对行为产生了调节作用。
但是在日常生活的交际中,单纯依靠对手的道德自律来达成合作是不
保险的。针对这个问题.我们可以通过对道德因素的考虑,对博弈策略进
行相应的调整.把交际变成长期的、多边的,从而形成诚实守信的动力与
压力。
l 5。
假装不知道有尽头
《笑林广记》中记载这样一则笑话。
有一个人去理发铺剃头,剃头匠给他剃得撮草率。剃完后,这人却付给
剃头匠双倍的钱,什么也没说就走了。一个多月后的一天,这人又来理发铺
剃头。剃头匠还记得他上次多付了钱,觉得此人阔绰大方,为讨其欢心,多
赚点钱,便竭力上心,周到细致.多用了一倍的工夫。剃完后.这人便起身
付钱,反而少给了许多钱。剃头匠不愿意,说:“上次我为您剃头,剃得很草
率.您尚且给了我很多钱;今天我格外用心,为何反而少付钱呢?”这人不
慌不忙地解释道:“今天的剃头钱,上次我已经付给体了;今天给你的钱,正
是上次的剃头费。”说着大笑而去。
这个故事说明,有限次的囚徒困境.情况不同于无限次的囚徒困境的重
复博彝。当临近博弈的终点时,采取不合作策略的可能性加大。即使参与人
以前的所有策略均为合作策略,如果被告知下一次博奔是最后一次,那么肯
定采取不合作的策略。
当合作关系存在某种自然而然的缚点时,博弈反复进行的次数是一定的。
运用向前展望、倒后推理的原则,我们可以看到,一旦再也没有机会可以进
行惩罚,合作就会告终。但是,谁也不愿意落在后面,在别人作弊的时候继
续合作。假如真的有人仍然保持合作,最后他就只能自认倒霉。
既然没人想倒霉。合作也就无从开始。实际上,无论一个博弈将会持续
多长时间。只要大家知道终点在哪里,结果就一定是这样。因为从一开始,
两位参与者就应该向前展望,预计最后一步会是什么。在这最后一步,再也
没有什么“以后”需要考虑,优势策略就是作弊。这最后一步的结果是一个
不可避免的结论:既然没有办法影响这个博弈的最后一步,那么,在考虑对
策的时候,倒数第二步实际上就会成为最后一步。而在这一步.作弊再次成
为优势策略。理由是,位于倒数第二的这一步对最后阶段的策略选择毫无影
响。因此.倒数第二步可以视为孤立阶段,单独进行考虑。对于任何孤立阶
段,作弊都是一种优势策略。
I 52
重复博奔:一夜情与地老天荒
深诸策略思维者懂得瞻前顾后,避免失足于最后一步。假如他预计自己
会在最后一轮遭到欺骗,他就会提前一轮中止这一关系。不过.这么一来,
倒数第二轮就会变成最后一轮.还是没法摆脱上当受骗的问题。
现在,最后两个阶段的情形已经确定。早期进行合作根本无从实现.因
为两个参与者已经决心在最后两个阶段作弊。这么一来,在考虑对策的时候,
倒数第三步实际上就会成为最后一步。遵循同样的推理,作弊仍是一种优势
策略。这一论证一路倒推回去.不难发现,从一开始就不存在什么合作了。
但是在上面的故事中,剃头匠为什么会上当呢?在现实世界里.所有真
实的博弈只会反复进行有限次.但正如剃头匠不知道客人下一次是否还会光
顾一样,没有人知道博弈的具体次数。既然不存在一个确定的结束时间.那
么这种合作关系就有机会继续下去,实现阶段性的成功合作。要想避免信任
瓦解.千万不能让任何确定无疑的最后一轮出现在视野所及的地方。只要仍
然存在继续合作的机会,背叛就会被抑制。
不可否认,这个世界存在一些“善良的”人.不管作弊可能带来什么样
的物质利益,他们仍然选择合作。但是多数人都没有那么善良,而是按照自
己的理性行事,在一个反复进行有限次的囚徒困境博弈里,他们会从一开始
就作弊。这会使其他参与者很快看清楚其本质.并对之加以提防。于是,为
了掩盖真相,或者是至少掩盖一会儿真相,他们不得不装出“善良”的样子。
剃头的客人一开始为质量低劣的服务付很多的钱,就出于这种考虑。
在博弈中.假设他一开始就按照善良人的方式行事,其他参与者就会认
为他大约属于周围少有的几个善良人之一。合作一段时闯将会带来实实在在
的好处。而且其他参与者也会打算仿效他的善良做法,换取这些好处,从而
带来合作的收益。当然,他和其他参与者一样,仍然打算在博弈接近尾声
的时候偷偷作弊。但这并不妨碍在最初一个阶段进行互利互惠的合作。因
此.在各人假装善良等待占别人便宜的时候.大家已经从这种共同欺骗中得
到好处。
能在一个反复进行的囚徒困境中使信任出现的条件,就是作弊所得晚于
合作破裂的代价之前出现。这么一来,作弊与合作相比哪一个更划算.就取
决于现在与将来相比哪一个更重要。
藏
越譬型
在商界,比较现在与将来的利润的时候,会用一个合适的利率进行折算。
而在政界,现在与将来的重要性的比较更加带有主观色彩。不过,一般而盲,
如果下一次竞选之后的时间看起来无关大局.政治人物间的合作更容易破裂。
即便是在商界.若是遇到不景气的年份,整个产业处于崩溃边缘,管理层觉
得已经走到山穷水尽,没有明天了,那么,竞争就有可能变得比正常年份更
加激烈。同样地,由于战争迫在眉睫,伊朗和伊拉克会认为现在的利润比将
来的利澜更重要,由此加深了协调限制石油产量以保持长期稳定利润的难度。
但是隐瞒终点或者说假装没有终点的博弈策略,仍然是以背叛为基础的.
其目的无非是在相互背叛之前得到更多的收益。当然也有例外,比如说在多
数恋人之间的博弈,其目的并非是为了在分手时得到更多的“好处”,而是希
望能更好地维持合作的稳定性,从而缔结连理,自首偕老。
第4章
一报还一报:出来混迟早要还的
出来混迟早耍还的
不是不还只分早晚
是你的递也选不摔的
出采混迟早妻还的
熙熙攘攘利柬利往
到头来还不是尘归尘土归土
——《出来混.迟