八喜电子书 > 经管其他电子书 > 博弈论的诡计(1) >

第7部分

博弈论的诡计(1)-第7部分

小说: 博弈论的诡计(1) 字数: 每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



不是不还只分早晚
是你的递也选不摔的
出采混迟早妻还的
熙熙攘攘利柬利往
到头来还不是尘归尘土归土
——《出来混.迟早是要还的》歌词
以牙还牙,以眼还眼
    一天半夜,某教授正在熟睡之际,电话铃突然响了起来。他睡跟惺忪拿
起电话,听筒里传来女邻居怒气冲冲的声音:“麻烦你管一下你的狗,不要再
让它叫了。”说完,电话就挂了。这位教授十分生气。第二天他定好闹钟,半
夜两点钟准时起床.拿起电话拨通了这位女邻居家。过了半天,对方才章起
听筒,带着睡意恼怒地同:“哪一位?”这位教授彬彬有礼地告诉她:“夫人,
昨天我忘记告诉你了。我们家没有养狗。”
    在这个反映现实人际关系的小笑话中,我们可以发现在没有法规和道德
的约束,也没有其他力量从外部对双方进行强制时,对自己最有利的一种策略:
一报还一报。这一策略的提出,应归功于美国密西根大学的学者罗伯特·爱
克斯罗德。他是一个政治科学家.研究方向是人与人之间的合作关系。
赢材譬鲨型
    在开始研究合作之前,爱克斯罗德设定了两个前提:一.每个人都是自
私的;二,没有权威干预个人决策。也就是说,个人可以完全按照自己利益
最大化的目标进行决策。在此前提下,要研究的问题是:第一,人为什么要
合作;第二,人什么时候是合作的,什么时候又是不合作的;第三.如何使
别人与你合作。
    在研究的过程中,爱克斯罗德组织了一场计算机模拟竞赛。思路非常简
单:任何参加这个竞赛的人都扮演囚徒困境案例中一个囚犯的角色.把自己
的策略编成计算机程序,进行捉对博弈,在合作与背叛之间做出选择。但与
囚徒困境案例有个不同之处:他们不止玩一次这个游戏,而是以单循环赛的
方式玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”.它更逼真地
反映了具有经常而长期性的人际关系。
    这个游戏还允许程序在做出合作或背叛的抉择时,参考对手程序前几次
的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。
但如果两个程序已经交手过多次,则双方就建立了各自的历史档案.用以
记录与对手的交往情况。同时,它们也通过多次的交手树立了或好或差的
声誉。
    虽然如此,下一步将会如何行动却仍然极难确定。实际上,这也是该竞
赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一:一个程序能够总
是不管对手做何种举动都采取合作的态度吗9或者,它能总是采取背叛行动
吗,它是否应该对对手的举动报之以更为复杂的举动7如果是.那会是怎么
样的举动呢?
    第一轮游戏有14个程序参加,其中包含了各种复杂的策略。再加上爱克斯
罗德自己的一个随机程序(即以50%的概率选取合作或背叛)。使爱克斯罗德和
其他人深为吃惊的是.竞赛的桂冠属于一个被称为“一报还一报(Trr FOR
TAT)”的策略.它是由多伦多大学的数学教授阿纳托·拉波波特提交上来的。
    有意思的是,在科学家们上交的14个程序中有8个是“善意的”,但正是
这些永远不会首先背叛的善意程序.轻易地赢了6个非善意的程序。
    因为参与竞赛的程序为数不多,一报还一报策略的胜利也许只是一种侥幸。
为了进一步验证上述结论.爱克斯罗德决定举行第二轮竞赛.邀请更多的人
I M
一报还一报:出来混迟早要还的
再做一次游戏,并把第一次的结果公开发表。这一次有62位科学家递交了改
进的程序,其中包括多个以上一次的策略为基础的改良品种。加上爱克斯罗
德自己的随机程序.63个程序又进行了一次竞赛。竞赛结果表明.在63个程
序的前15名里.只有第8名的哈灵顿程序是“非善意的”;在最后15名中,
只有1个总是合作的程序是“善意的”。而且,夺魁的仍然是一报还一报策略。
    这种让几十位科学家的智慧相形见绌的神奇策略到底是怎样的呢?
    说起来很简单,简单到有些不可思议:第一步合作,此后每一步都重复
对方上一步的行动:合作或背叛。如此简单的程序之所以反复获胜,是因为
它奉行了以其人之道还治其人之身的原则,并且用如下特征最有效地鼓励其
他程序同它长期合作:善良、可激怒、宽容、简单、不妒忌别人的成功。
    ·善良,是指它第一步总是向对方表达善意。它坚持永远不首先背叛对
    方,开始总是选择合作,而不是一开始就选择背叛或主动作弊。
    ·可激怒,是指对方出现背叛行动时,它能够及时识别并一定要采取背
    叛的行动来报复。不会让背叛者遣遥法外,
    ·宽容.是指它不会因为别人一次背叛。长时间怀恨在心或者没完没了
    地报复.而是在对方改过自新、重新回到合作轨道时,能既往不咎地
    恢复合作;
    ·简单.是指它的逻辑清晰.易于识别.能让对方在鞍短时间内辨识出
    来其策略所在:
    ·不妒忌,是指它不耍小聪明,不占对方便宜,不在任何双边关系中争
    强好胜。
    其他各种策略输就输在上述五个方面做得不够好。在比赛结果中,所有
恶意程序(第一步背叛)都未进前10名;而某些程序太过好脾气。被对方背
叛之后不立即反应,结果鼓励菜些狡猾的程序反复占它的便宜;某些程序对
于过往关系的“好坏”太过执著,一旦被别人欺骗就很难宽容,结果使得很
多本来可能恢复的合作关系永久性断绝;还有一些程序把自己搞得太复杂,
总是试图通过某种机巧来占人便宜.尽管在与某些“傻”程序接触中得了高
分,但一旦碰到个性“刚烈”的程序就会搬起石头砸了自己的脚。而从最后
的总分来看,它们的小聪明得不偿失。
〃I
一报还一报:出来混迟早要还的
再做一次游戏,并把第一次的结果公开发表。这一次有62位科学家递交了改
进的程序,其中包括多个以上一次的策略为基础的改良品种。加上爱克斯罗
德自己的随机程序.63个程序又进行了一次竞赛。竞赛结果表明.在63个程
序的前15名里.只有第8名的哈灵顿程序是“非善意的”;在最后15名中,
只有1个总是合作的程序是“善意的”。而且,夺魁的仍然是一报还一报策略。
    这种让几十位科学家的智慧相形见绌的神奇策略到底是怎样的呢?
    说起来很简单,简单到有些不可思议:第一步合作,此后每一步都重复
对方上一步的行动:合作或背叛。如此简单的程序之所以反复获胜,是因为
它奉行了以其人之道还治其人之身的原则,并且用如下特征最有效地鼓励其
他程序同它长期合作:善良、可激怒、宽容、简单、不妒忌别人的成功。
    ·善良,是指它第一步总是向对方表达善意。它坚持永远不首先背叛对
    方,开始总是选择合作,而不是一开始就选择背叛或主动作弊。
    ·可激怒,是指对方出现背叛行动时,它能够及时识别并一定要采取背
    叛的行动来报复。不会让背叛者遣遥法外,
    ·宽容.是指它不会因为别人一次背叛。长时间怀恨在心或者没完没了
    地报复.而是在对方改过自新、重新回到合作轨道时,能既往不咎地
    恢复合作;
    ·简单.是指它的逻辑清晰.易于识别.能让对方在鞍短时间内辨识出
    来其策略所在:
    ·不妒忌,是指它不耍小聪明,不占对方便宜,不在任何双边关系中争
    强好胜。
    其他各种策略输就输在上述五个方面做得不够好。在比赛结果中,所有
恶意程序(第一步背叛)都未进前10名;而某些程序太过好脾气。被对方背
叛之后不立即反应,结果鼓励菜些狡猾的程序反复占它的便宜;某些程序对
于过往关系的“好坏”太过执著,一旦被别人欺骗就很难宽容,结果使得很
多本来可能恢复的合作关系永久性断绝;还有一些程序把自己搞得太复杂,
总是试图通过某种机巧来占人便宜.尽管在与某些“傻”程序接触中得了高
分,但一旦碰到个性“刚烈”的程序就会搬起石头砸了自己的脚。而从最后
的总分来看,它们的小聪明得不偿失。
〃I
报还一报:出来混迟早要还的
    在香港电影《无间道》有一句广为流传的台词:出来混.迟早要还的。
就是这句台词决定了剧中不少人物的命运,无论是黑道还是白道.警还是匪,
很多人物在以为自己胜券在握或进出生天时,猝不及防地死去.用一条命来
还了。
    在博弈论中,“还”也是早晚的事,不过这不是什么宿命,而是“一报还
一报”策略的出发点和立足点,也是它的胜利基点。
地老天荒的胜利者
    在博弈论中,我们可以得到很多有趣而富于哲理的启示,一报还一报策
略就是其中之一。它那种善意、宽容、强硬、简单明了的合作策略无论对个
人还是对组织的行为方式来说,都有十分重要的指导意义。
    人们通过接受及回报.形成了社会生活的秩序。这种秩序即使在最无指
望的环境中,例如相互隔绝、语言不通的人群之间也是最易理解的东西。哥
伦布登上美洲大陆时.与印第安人最初的交往就开始于互赠礼物。有些看似
纯粹的利他行为,比如无偿馈赠,也通过某些间接方式,比如社会声誉的获
得,得到了回报。研究这种行为,对我们理解社会生活有很重要的意义。
    爱克斯罗德通过进一步研究,发现合作的必要条件是:第一。关系要持
续,一次性的或有限次的博弈中,对局者是没有合作动机的;第二,对对方
的行为要做出回报,一个永远背叛的对局者是不会有人跟他合作的。
    那么,如何提高合作性呢?
    (1)要建立持久的关系。即使是爱情,也需要建立婚姻契约以维持双方
的合作。
    (2)要增强识别对方行动的能力。如果不清楚对方是合作还是不合作。
就没法回报他了。
    (3)要维持声誉。说要报复就一定要做到,人家才知道你是不好欺负的,
才不敢不与你合作。
    (4)能够分步完成的对局不要一次完成.以维持长久关系。比如,贸易、
谈判都要分步进行,以促使对方采取合作态度。
∞I
飘譬鲨型
    (5)不要嫉妒人家的成功。一报还一报正是这样的典范。
    (6)不要首先背叛,以免担上罪魁祸首的道德压力。
    (7)不仅对背叛要回报,对合作也要做出回报。
    (8)不要耍小聪明,占人家便宜。
    友善、有原则、宽容、简单、不妒忌朋友的成功,其实这些信条本来就
是我们生活中应有的为人处世之道。只是很少人会用博弈论模型的科学结论
作指导.将这些信条连接起来作为一种策略组合行事。
    一报还一报的策略的目标,就是要同尽可能多的人形成井巩固互惠关系.
而且发展为信任和友谊。说得通俗点,就是尽可能多交朋友,并且鼓励这些
朋友向你提供帮助。为了达到这个目标,它的手段归结为一个词就是“回报”,
就是要对别人的各种行为进行相称的反应。有意思的是,这一策略不怕曝光.
而且恰恰需要别人知道你的基本原则,这样才能更好地实现台作双赢。
    根据上述结论,我们可以回答很多交际方法问题.比如恋人如何博弈才
能走上红地毡。
    每对恋人都要承受未来不确定性的折磨:如果双方都不变心,那是最好
的结局.在天成为比翼鸟,在地成为连理枝;如果都变了心.效果也不坏,
你走你的阳关道。我过我的独木桥;如果一方变了心,另外找到了更好的情
侣,另一方却还傻乎乎地忠贞不贰,那么,另觅新欢的一方是最幸福的.比
两人都不变心的结果还幸福.因为他找见了更好的情人;而被抛弃的一方是
最不幸的,比两人都变心的结果更为不幸,因为他承担的压力既来自于自己
的太不幸福,也来自于对方的太幸福。
    人生发誓最多的时期大概就是恋爱时期。发什么誓呢?无非是什么非你
不娶非你不嫁一类誓言罢了.日的只有一个,就是让对方相信自己海枯石烂
此情不渝。他们希望彼此忠诚.从而换来一个好的博奔结果。但一对恋人相
互之间的忠诚,靠的不是这种情深爱笃的誓言,而是需要一定的博弈策略。
在恋爱这场不太好玩的“游戏”中,谁能熟练地驾驭博奔规则,谁就是爱情
的赢家。
    很明显,胜利将总是属于那些采取善意、宽容、强硬和简单明了策略的
恋人们。反之,恶意的、尖刻的、软弱的、复杂的恋人们往往会两败俱伤。
I们
报还一报:出来混迟早要还的
所以,对于正在恋爱中的人们来说,获得幸福爱情的博弈原则应该是:
    (I'善意而不是恶意地对待恋人。这个道理很简单了.无须多说。
    (2)宽容而不是尖刻地对待恋人。幸福的恋人可能并不是忠贞不贰的,
当然也肯定不是见异思迁的,他们能够生活得愉快,关键是能够彼此宽容.
既宽容对力的缺点,甚至也宽容对方偶尔的不忠贞。而尖刻地对待彼此的恋
人.往往都不会幸福。
    (3)强硬而不是软弱地对待恋人。就是要在我永远爱你的前提下.做到
有爱必报,有恨也必报;以眼还眼,以牙还牙;以其人之道。还治其人之身。
比如对恋人与其他异性的亲热行为,要有极其强烈的敏感与斩钉截铁的回报。
当然,每次发脾气都是有限度的,而且还要能宽容对方。
    (4)简单明了丽不是山环水绕地对待恋人。爱克斯罗德的实验证明.在
博弈过程中,过分复杂的策略使得对手难于理解,无所适从,因而难以建立
稳定的台作关系。
    事实上.在一个非零和的环境里,“城府深沉”、“兵不厌诈”、“揣着明白
装糊涂”往往并非上策。相反,明晰的个性、简练的作风和坦诚的态度倒

返回目录 上一页 下一页 回到顶部 0 0

你可能喜欢的