八喜电子书 > 经管其他电子书 > 博弈论的诡计(1) >

第6部分

博弈论的诡计(1)-第6部分

小说: 博弈论的诡计(1) 字数: 每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



量去保障一个人的安全。”这就是说,没有权威的协议并不能导致民主.而是
导致无政府状态。
    囚徒困境扩展为多人博弈时,暴露了一个更广泛的问题——“社会悖论”,
或“资源悖论”。人类共有的资源是有限的.当每个人都试图从有限的资源中
多拿一点儿时,就产生了局部利益与整体利益的冲突。人口问题、资源危机、
交通阻塞,都可以在社会悖论中得以解释。在这些问题中,关键是制定游戏
规则来控制每个人的行为。
    另外,学者爱克斯罗德所著的《合作的进化》一书暗含着一个重要的假
定,即个体之间的博弈是完全无差异的。但对局者之间绝对的平等是不可能
达到的,因而某些博弈对一方来说是典型的高成本、低回报:一方面,对局
者在实际能力上存在不对称.双方互相背叛时,可能不是各得1分,而是强
者得5分,弱者得0分,这样,弱者的报复就毫无意义;另一方面.即使对
I z日
重复博弈:一夜情与地老天荒
局双方确实旗鼓相当,但某一方可能怀有赌徒心理,认定自己更强大,采取
背叛的策略能占便宜。爱克斯罗德的分析忽视了这种情形,而这种事实或心
理上的不平等恰恰在社会上引发了大量零和与负和博弈。
    在这种情况下,应通过法制手段。以法律的惩罚代替个人之间的“一报
还一报”,才能规范合作行为。事实上.从博弈论的角度看,法律就是通过第
三方实施的行为规范,其功能是或者通过改变当事人的选择空间改变博弈的
结果,或者不改变博弈本身而改变人们的信念或对他人的行为预期,从而改
变博弈的结果。
用道德来保证均衡
    带剑的契约对于保证合作关系是有效的,但是在更多的情况下,我们根
本找不到,或者不值得用“剑”也就是法律来保证合作。那么在这时,有没
有其他办法来达到均衡呢?答案是肯定的。如果法律是保证人与人关系之间
的唯一武器,那么博弈策略也就没有什么价值了。作家吴思在《潜规则》中
曾经讲了这样一个故事,可以作为一个引子。这个故事来自《明史》,是一个
监察官员的故事。
    崇桢元年(1628年),朱由检刚刚当上皇帝,发出了“文官不爱钱”的号
召。户科给事中韩一良对这种号召颇不以为然.就写了份上疏,说道:如今
何处不是用钱之地?哪位官员不是爱钱之人?本来就是靠钱弄到的官位.怎
么能不花钱偿还昵?…··我这两个月辞却了别人进我的出书费用五百两银
子,我交往少尚且如此,其余的可以推想了。伏请陛下严加惩处,逮捕处治
那些做得过分的家伙。崇祯读了韩一良的上疏。立刻召见群臣.让韩一良当
众念他写的这篇东西。读罢,崇祯对大臣们说:“一良忠诚耿直,可以当佥都
御史。”
    这时,吏部尚书王永光请求皇帝,让韩一良点出具体人来.究竟谁做得
过分.又是谁送他银子。韩一良吞吞吐吐,显出一副不愿意告发别人的样子。
于是崇桢让他密奏。等了五天,韩一良谁也没有告发。崇祯再次把韩一良和
一些大臣召来,当面追问。然而韩一良就是不肯点名。崇桢让韩一良点出人
。9 l

莲‰{}:掣——一
名,本来是想如他所请的那样严加惩处,而韩一良最后竞推说风闻有人要送。
祟祯训斥韩一良前后矛盾,撤了他的职。
    韩一良宁可叫皇帝撤掉自己的官职,断送了自己的前程.甚至顶着被治
罪的风险,硬是不肯告发那些向他送礼行贿的人,他背后必定有强大的支撑
力量。这是一种什么力量々难道只是怕得罪人?作为给事中,检举起诉和得
罪人乃是他的分内事。因此,恐怕还是一种外在规则的压力,或者说外在规
则在其内心中形成的“道德”在起作用,使其坚决不肯背叛向他行贿的人。
    上面这个历史故事讽刺性地告诉我们:在现实环境中,确实存在着一些
道德因素,可以化解个人理性与群体理性的矛盾,维系整个社会的稳定。
    有一群猴子被美在笼子里,从笼子上方垂下一条绳子,绳子末端拴着一
个香蕉,上端连着一个机关,机关可以开启水源。猴子们发现了香蕉。纷纷
跳上去够这个香蕉.当猴子够到香蕉时,相连的绳子带动了机关,于是一盆
水倒了下来,尽管够到香蕉的猴子屹到了香蕉,但大多数猴子被淋湿了。
    这个过程重复着,猴子们发现.吃到香蕉的猴子是少数,而其余的大多
数猴子都被淋湿。于是,每当有猴子去取香蕉,就有其他的猴子主动地去撕
咬那个猴子。久而久之,猴子们产生了默契,再也没有猴子敢去取香蕉了。
    在这个故事里,猴子问产生了“道德”。猴子们认为取香蕉的后果对其
他猴子不利,因而取香蕉是“不道德的”,它们便会主动地惩罚“不道德的”
猴子。
    与法律一样,道德也是对某些不合作行动的惩罚机制。这种机制的出现
使得人类从囚徒困境中走出来。道德感自然地使得人们对不道德的或不正义
的行为谴责或者对不道德的人采取不合作,从而使得不道德的人遭受损失。
这样,社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道
德、正义或非正义的观念,就自动对行为产生了调节作用。
    但是在日常生活的交际中,单纯依靠对手的道德自律来达成合作是不
保险的。针对这个问题.我们可以通过对道德因素的考虑,对博弈策略进
行相应的调整.把交际变成长期的、多边的,从而形成诚实守信的动力与
压力。
l 5。

莲‰{}:掣——一
名,本来是想如他所请的那样严加惩处,而韩一良最后竞推说风闻有人要送。
祟祯训斥韩一良前后矛盾,撤了他的职。
    韩一良宁可叫皇帝撤掉自己的官职,断送了自己的前程.甚至顶着被治
罪的风险,硬是不肯告发那些向他送礼行贿的人,他背后必定有强大的支撑
力量。这是一种什么力量々难道只是怕得罪人?作为给事中,检举起诉和得
罪人乃是他的分内事。因此,恐怕还是一种外在规则的压力,或者说外在规
则在其内心中形成的“道德”在起作用,使其坚决不肯背叛向他行贿的人。
    上面这个历史故事讽刺性地告诉我们:在现实环境中,确实存在着一些
道德因素,可以化解个人理性与群体理性的矛盾,维系整个社会的稳定。
    有一群猴子被美在笼子里,从笼子上方垂下一条绳子,绳子末端拴着一
个香蕉,上端连着一个机关,机关可以开启水源。猴子们发现了香蕉。纷纷
跳上去够这个香蕉.当猴子够到香蕉时,相连的绳子带动了机关,于是一盆
水倒了下来,尽管够到香蕉的猴子屹到了香蕉,但大多数猴子被淋湿了。
    这个过程重复着,猴子们发现.吃到香蕉的猴子是少数,而其余的大多
数猴子都被淋湿。于是,每当有猴子去取香蕉,就有其他的猴子主动地去撕
咬那个猴子。久而久之,猴子们产生了默契,再也没有猴子敢去取香蕉了。
    在这个故事里,猴子问产生了“道德”。猴子们认为取香蕉的后果对其
他猴子不利,因而取香蕉是“不道德的”,它们便会主动地惩罚“不道德的”
猴子。
    与法律一样,道德也是对某些不合作行动的惩罚机制。这种机制的出现
使得人类从囚徒困境中走出来。道德感自然地使得人们对不道德的或不正义
的行为谴责或者对不道德的人采取不合作,从而使得不道德的人遭受损失。
这样,社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道
德、正义或非正义的观念,就自动对行为产生了调节作用。
    但是在日常生活的交际中,单纯依靠对手的道德自律来达成合作是不
保险的。针对这个问题.我们可以通过对道德因素的考虑,对博弈策略进
行相应的调整.把交际变成长期的、多边的,从而形成诚实守信的动力与
压力。
l 5。
假装不知道有尽头
    《笑林广记》中记载这样一则笑话。
    有一个人去理发铺剃头,剃头匠给他剃得撮草率。剃完后,这人却付给
剃头匠双倍的钱,什么也没说就走了。一个多月后的一天,这人又来理发铺
剃头。剃头匠还记得他上次多付了钱,觉得此人阔绰大方,为讨其欢心,多
赚点钱,便竭力上心,周到细致.多用了一倍的工夫。剃完后.这人便起身
付钱,反而少给了许多钱。剃头匠不愿意,说:“上次我为您剃头,剃得很草
率.您尚且给了我很多钱;今天我格外用心,为何反而少付钱呢?”这人不
慌不忙地解释道:“今天的剃头钱,上次我已经付给体了;今天给你的钱,正
是上次的剃头费。”说着大笑而去。
    这个故事说明,有限次的囚徒困境.情况不同于无限次的囚徒困境的重
复博彝。当临近博弈的终点时,采取不合作策略的可能性加大。即使参与人
以前的所有策略均为合作策略,如果被告知下一次博奔是最后一次,那么肯
定采取不合作的策略。
    当合作关系存在某种自然而然的缚点时,博弈反复进行的次数是一定的。
运用向前展望、倒后推理的原则,我们可以看到,一旦再也没有机会可以进
行惩罚,合作就会告终。但是,谁也不愿意落在后面,在别人作弊的时候继
续合作。假如真的有人仍然保持合作,最后他就只能自认倒霉。
    既然没人想倒霉。合作也就无从开始。实际上,无论一个博弈将会持续
多长时间。只要大家知道终点在哪里,结果就一定是这样。因为从一开始,
两位参与者就应该向前展望,预计最后一步会是什么。在这最后一步,再也
没有什么“以后”需要考虑,优势策略就是作弊。这最后一步的结果是一个
不可避免的结论:既然没有办法影响这个博弈的最后一步,那么,在考虑对
策的时候,倒数第二步实际上就会成为最后一步。而在这一步.作弊再次成
为优势策略。理由是,位于倒数第二的这一步对最后阶段的策略选择毫无影
响。因此.倒数第二步可以视为孤立阶段,单独进行考虑。对于任何孤立阶
段,作弊都是一种优势策略。
I 52
重复博奔:一夜情与地老天荒
    深诸策略思维者懂得瞻前顾后,避免失足于最后一步。假如他预计自己
会在最后一轮遭到欺骗,他就会提前一轮中止这一关系。不过.这么一来,
倒数第二轮就会变成最后一轮.还是没法摆脱上当受骗的问题。
    现在,最后两个阶段的情形已经确定。早期进行合作根本无从实现.因
为两个参与者已经决心在最后两个阶段作弊。这么一来,在考虑对策的时候,
倒数第三步实际上就会成为最后一步。遵循同样的推理,作弊仍是一种优势
策略。这一论证一路倒推回去.不难发现,从一开始就不存在什么合作了。
    但是在上面的故事中,剃头匠为什么会上当呢?在现实世界里.所有真
实的博弈只会反复进行有限次.但正如剃头匠不知道客人下一次是否还会光
顾一样,没有人知道博弈的具体次数。既然不存在一个确定的结束时间.那
么这种合作关系就有机会继续下去,实现阶段性的成功合作。要想避免信任
瓦解.千万不能让任何确定无疑的最后一轮出现在视野所及的地方。只要仍
然存在继续合作的机会,背叛就会被抑制。
    不可否认,这个世界存在一些“善良的”人.不管作弊可能带来什么样
的物质利益,他们仍然选择合作。但是多数人都没有那么善良,而是按照自
己的理性行事,在一个反复进行有限次的囚徒困境博弈里,他们会从一开始
就作弊。这会使其他参与者很快看清楚其本质.并对之加以提防。于是,为
了掩盖真相,或者是至少掩盖一会儿真相,他们不得不装出“善良”的样子。
剃头的客人一开始为质量低劣的服务付很多的钱,就出于这种考虑。
    在博弈中.假设他一开始就按照善良人的方式行事,其他参与者就会认
为他大约属于周围少有的几个善良人之一。合作一段时闯将会带来实实在在
的好处。而且其他参与者也会打算仿效他的善良做法,换取这些好处,从而
带来合作的收益。当然,他和其他参与者一样,仍然打算在博弈接近尾声
的时候偷偷作弊。但这并不妨碍在最初一个阶段进行互利互惠的合作。因
此.在各人假装善良等待占别人便宜的时候.大家已经从这种共同欺骗中得
到好处。
    能在一个反复进行的囚徒困境中使信任出现的条件,就是作弊所得晚于
合作破裂的代价之前出现。这么一来,作弊与合作相比哪一个更划算.就取
决于现在与将来相比哪一个更重要。

越譬型
    在商界,比较现在与将来的利润的时候,会用一个合适的利率进行折算。
而在政界,现在与将来的重要性的比较更加带有主观色彩。不过,一般而盲,
如果下一次竞选之后的时间看起来无关大局.政治人物间的合作更容易破裂。
即便是在商界.若是遇到不景气的年份,整个产业处于崩溃边缘,管理层觉
得已经走到山穷水尽,没有明天了,那么,竞争就有可能变得比正常年份更
加激烈。同样地,由于战争迫在眉睫,伊朗和伊拉克会认为现在的利润比将
来的利澜更重要,由此加深了协调限制石油产量以保持长期稳定利润的难度。
    但是隐瞒终点或者说假装没有终点的博弈策略,仍然是以背叛为基础的.
其目的无非是在相互背叛之前得到更多的收益。当然也有例外,比如说在多
数恋人之间的博弈,其目的并非是为了在分手时得到更多的“好处”,而是希
望能更好地维持合作的稳定性,从而缔结连理,自首偕老。
第4章
一报还一报:出来混迟早要还的
出来混迟早耍还的
不是不还只分早晚
是你的递也选不摔的
出采混迟早妻还的
熙熙攘攘利柬利往
到头来还不是尘归尘土归土
——《出来混.迟

返回目录 上一页 下一页 回到顶部 0 0

你可能喜欢的