30天让你精通博弈学-第6部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
从中找出尺寸最接近的一个说,就按这个尺寸做。结果,装
修公司不能以重做模子作砝码,最终以 元的价格成交,
只赚了 元,老张省了 元 。
现在,两个局中人是老张和装修公司。老张的博弈策略
有两个,要求看存根和不要求看存根。装修公司的博弈策略
也有两个,一个是给看,一个是不给看。
看来,“不说 白不说”,不要求看装修存根是老张的劣势策
略。装修公司呢?如果老张不要求看存根,无论装修公司是
否预备给他看,结果都是老张没有看存根,装修公司都可以
… 页面 49…
赚 元,但是如果老张 “来者不善”要求看存根,那么
着眼于这一次的交易机会,装修公司给他看存根可 以赚
元,不给他看就会什么也赚不到,所 以 “只要老张要求,就
给他看存根”应该是优势策略,不给看应该是劣势策略。那
么,形式上运用前面讲过的劣势策略消去法,可以得到这个
博弈的一个均衡:老张要求看存根,装修公司给老张看存根,
结果老张省了 元,装修公司赚了 元 。
装修公司赚了 元,虽然没有赚 元,但毕竟 比
没钱赚好;老张则因为有博弈论思想,节省了 元,把事
情做得几乎一样好。
前面讲过的囚徒困境,是数据对称的博弈,即如果把 甲
乙的位置对调,双方的支付数字都没有变化。这个博弈讲的
是不对称的博弈,即双方的得失数 目不对称。现在,如果把
老张和装修公司的位置对调,支付矩阵就要有改变,所 以是
不对称博弈。
需要说明的是,这里说的劣势策略,不是指被全面的严
格的优势策略压住的严格劣势策略。全面的严格的优势策略
要求:不论对方采取什么策略,我采取这个策略总比采取任
何别的策略都好,而且要确实显出其优势来。可是在 “老张
博弈”中没有这样的严格优势策略。 “要求看”不是全面的严
格的优势策略要求,因为如果对方采用 “横竖不给看”策略,
老张采用 “要求看”策略的博弈结局并不比采用 “不要求看”
策略的博弈结局好。所以, “不要求看”不是前面讲的被全面
… 页面 50…
的和严格的优势策略压住的严格劣势策略。同样,对于装修
公司来说, “不给看”也不是前面所讲的被全面的和严格的优
势策略压住的严格劣势策略。
必须指出,这个博弈其实有两个纳什均衡。一个是:老
张不要求看存根,装修公司不给看存根。请注意,要是已经
处于这样的对局形势,那么如果老张单独改变策略变成 “要
求看”,装修公司没改变策略仍然 “不给看”,结果老张之所
得仍然是 ,没有得到额外的好处,所 以老张没有单独改变
策略的激励;如果装修公司单独改变策略变成 “给看”,老张
并没有改变策略仍然不要求看,那么装修公司之所得仍然是
,也不会得到什么额外的好处,所 以装修公司也没有单
独改变策略的激励。
在上面这一段的分析中,读者想必对于 “单独改变不会
得到额外的好处”中 “额外”二字和 “没有单独改变策略的
激励”中 “单独”二字的分量,有了新的体会。
无论站在老张方面还是站在装修公司方面,都没有一个
策略全面地严格地劣于另一个策略。站在老张方面 ,虽然
“不要求看”存根比 “要求看”劣,但不是全面的劣,因为如
果对方采用 “不给看”策略,那么老张不要求看和要求看存
根的赢利都是 ,比不出优劣来。站在装修公司方面,虽然
“不给看”存根比 “给看”存根的策略劣,但同样不是全面的
劣,因为如果老张采取 “不要求看”存根的策略,装修公司
“不给看 ”和“给看 ”的赢利都是 ,同样比不出优劣来。
… 页面 51…
这个博弈中,双方策略的选择,我们把它叫做普通劣势
策略消去法:面对乙的所有策略来比较 甲的两个策略,如果
甲的一个策略的赢利总是不超过另一个策略,而且确实有一
个乙的策略使 甲的这个策略的赢利小于另一个策略,就把 甲
的这个策略删去。
与此类似,纳什均衡也有严格纳什均衡和普通纳什均衡
之分。普通纳什均衡只是说在均衡状态单独改变策略没有好
处,不会得到好处。但是,没有好处也不一定有坏处,不会
得到好处也不一定会得到坏处。所 以在老张博弈中,装修公
司不给看、老张也不要求看的这个纳什均衡,就是一个普通
纳什均衡。严格纳什均衡则是不仅单独改变没有好处,而且
谁单独改变策略谁就要倒霉的纳什均衡。在老张博弈中,另
一个纳什均衡,即老张要求看存根、装修公司也给看的这个
纳什均衡,就是一个严格纳什均衡,因为处于这个均衡时,
老张要是单独改变策略,得益将从 降为 ,装修公司要
是单独改变策略,其得益将从 降为
普通劣势策略消去法的杀伤力比较大,它可能把普通纳
什均衡删掉。但如果是严格纳什均衡,杀伤力大的普通劣势
策略消去法对它也会手下留情。你只要知道严格劣势策略消
去法和普通劣势策略消去法的区别,知道严格纳什均衡和普
通纳什均衡的区别,就很容易想清楚这个关系。
… 页面 52…
这里要解释一下何谓帕累托效率和帕累托优势 。帕累托
是意大利经济学家,帕累托效率准则的含义是:经济的效率
体现于配置社会资源 以改善人们的境况,主要看资源是否已
经被充分利用。如果资源 已经被充分利用,要想再改善我就
必须损害你或别的什么人,一句话,要想再改善任何人都必
须损害别的人,这时候就说一个经济已经实现了帕累托效率。
相反,如果还可以在不损害别人的情况下改善任何人,就认
为经济资源 尚未充分利用,就不能说已经达到帕累托效率。
设想在古代的一个村庄有两个猎人。为了简化 问题,假
设主要的猎物只有两种:鹿和兔子。在古代,人类的狩猎手
段比较落后,弓箭的威力也有限。在这样的条件下,我们可
以假设,两个猎人一起去猎鹿,才能猎获 只鹿。如果一个
猎人单兵作战,他只能打到 只兔子。从填饱肚子的角度来
说, 只兔子可以维持 天 ,而 只鹿却差不多能够解决
天的问题。这样,两个人的行为决策就可以写成以下的博弈
形式:要么分别打兔子,每人得 要么合作 ,每人得
… 页面 53…
(平分鹿之后的所得)。
两个纳什均衡,就是两个可能的结局。那么,究竟哪一
个会发生呢?是一起去猎鹿还是各 自去打兔子呢?这就和情
侣博弈一样,不能完全由纳什均衡本身来确定。
比较 ( 和 ( 两个纳什均衡,明显的事实
是,两人一起去猎鹿的赢利比各 自去打兔子的赢利要大得多。
按照长期合作研究的两位博弈论大师美国的哈萨尼教授和德
国的泽尔腾教授的说法,甲乙一起去猎鹿得 ( 的纳
,
什均衡,比两人各 自去打兔子得 ( 的纳什均衡,具有
帕累托优势。猎人博弈的结局,最大可能是具有帕累托优势
的那个纳什均衡:甲乙一起去猎鹿得 ( , )。
比起 ( )来 , )不仅是总额的改善,而且每
个人的收益都得到很大改善。这就是 对于
具有帕累托优势的意思。
在 “猎人博弈 ”中,两人合作猎鹿的收益 ( 对
于分别猎兔 ( 具有帕累托优势。这是因为如果比较原
来的境况 ,现在的 ( )我们说境况得到了帕累
托改善。帕累托改善是各方的境况都不受损害的改善。
可是上面的情况的前提是假设双方平均分配猎物,也就
是说,两个猎人的能力和贡献差不多,但是实际上并不一定
如此 。
如果一个猎人能力强、贡献大,他就会要求得到较大的
一份,这样分配的结果就可能是 ( 或 ( ,但
… 页面 54…
有一点是确定的,那就是能力较差的猎人的所得,至少要多
于他独 自打猎的收益,否则他就没有合作的动机。如果合作
的结果是 ( ,相对于分别猎兔 就没有帕累托
优势,这是因为 比 小,乙受到损害。这样,我们就不能
说境况得到了帕累托改善 。虽然 比 大得多,改善了很
多, 也比 大很多,改善了很多,但是 比 小 ,
乙没有改善反而恶化。所以站在乙的立场, 没有原来
的 那么好。如果合作的结果如此,那么,乙一定不愿
合作。可见,帕累托改善是一种各方都认同的改善,不是要
求任何一方作出牺牲的改善。
进入 世纪,人类经历了两次世界大战、经济的高速增
长、科技的进步、全球一体化以及 日益严重的环境污染之后,
“零和”观念正逐渐被 “双赢”所取代,人们认识到 “利己”
不一定要建立在 “损人”的基础上,通过有效合作,皆大欢喜
的结局是可能出现 的。“你扒我的口袋,我扒你的口袋”远不如
“你搔我的背,我搔你的背”更可取。然而,在为人类 “合作
时代 ”欢呼的同时,我们应注意到,“零和游戏 ”在人类生活 的
许多领域依然适用,而且,当它可能对我们 自身有利时,我们
也乐于接受它。(股市就是一个很好的例子。人们投资股市,很
少是为了获得投资的回报,而是渴望在炒买炒卖中赚取差额,
这样,当一个人在股市上赚到钱时,意味着别人因此受了损
失。)而且,如何在合作中找到各方满意的方法,并不是一件
容易的事。我们距离真正的 “合作时代”,还有很长的一段路。
… 页面 55…
择优去劣:
获得最佳行动策略
… 页面 56…
博弈论著作中有一个常见的例子 “笼中猪”博弈,通
过 “笼中猪”博弈案例我们可以对优势策略和劣势策略有更
清晰的了解。
笼子里面有两只猪,一只比较大,一只比较小。笼子很
长,一头有一个按钮,另一头是饲料的出口和食槽。按一下
按钮,将有相当于 份的猪食进槽,但是按按钮 以后跑到食
槽所需要付出的 “劳动”,加起来要消耗相当于 份的猪食。
问题是按钮和食槽分置笼子的两端,按按钮的猪付出劳动跑
到食槽的时候,坐享其成的另一头猪早已吃了不少。如果大
猪先到,大猪呼啦啦吃到 份,小猪只能吃到 份 ;如果同
时到达,大猪吃到 份,小猪吃到 份;如果小猪先到,小
猪可以吃到 份,而大猪吃到 份 。
“笼中猪”博弈的具体情况如下:
如果两只猪同时按按钮,同时跑向食槽,大猪吃进 份,
得益 份 ,小猪吃进 份,实得