博弈论案例 分析

2024-05-17 04:15

1. 博弈论案例 分析

博弈论分析
  一、经济学中的“智猪博弈”(Pigs’payoffs) 
          这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 

          那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 

          原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 

           “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。 
           如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。 
           改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。 

           如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。 
           改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。 

          对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。 
              改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 

            对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。 
            原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 

              比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。 

              许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。 

              二、囚徒困境博弈 
              在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’ 
            dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 

              表 囚徒困境博弈 [Prisoner's dilemma] 
             B 坦白   B 抵赖  
            A  坦白 –8, –8  0, –10  
            A  抵赖 –10, 0  –1, –1  
              我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 

              要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。 

              博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。 

              话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。 

              检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判 
            10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。 
              这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。 

              不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。 

              从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境” 
            这样的例子。如价格战博弈、军奋竞赛博弈、污染博弈等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略 
            (strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。 

            美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”。 

              “重复的囚徒困境”更逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。实际上,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗?或者,它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢? 

              事实上,竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是,竞赛的桂冠属于其中最简单的策略:一报还一报。我把它叫做“以其人之道,还治其人之身”。 

              “一报还一报”的策略是这样的:它总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略。也就是说,一报还一报的策略实行了胡萝卜加大棒的原则。它永远不先背叛对方,从这个意义上来说它是“善意的”。它会在下一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它),从这个意义上来说它是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是“强硬的”。而且,它的策略极为简单,对手程序一望便知其用意何在,从这个意义来说它又是“简单明了的”。
              三、价格战博弈 
              现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论 
            (vivalry 
            game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。 

              四、贸易战博弈论 
              这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。 

 博弈论案例分析 
案例一:博弈论在企业人力资本投资中的应用[1] 
              一、引言 
              一个企业能否在市场中取得经济优势,依赖于企业科技优势、产品的市场适应性等等,而这一切又源于人才优势。因此,一个企业面临着如何尽可能地保持自己人力资源的优势,如何吸引优秀人才加入企业添加新动力,如何有效培训使己有员工获得技能的提高,如何使员工适应外部环境变化的要求,如何有效挽留公司的核心人才等等。但是统计调查显示,我国的培训现状不尽如人意。总体来看,我国企业培训管理的制度化、规范化程度有待加强,培训计划执行不力,培训效果跟踪与评价环节薄弱,培训对改善员工绩效的效用没有发挥,培训结果与员工晋升没有太大影响等。造成这种现状的原因固然是多方面的,其中一个主要原因就是人力资本投资收益的滞后性和不确定性,担心员工“硬了翅膀就飞走”,得不偿失。企业是否增加人力资本投资,员工是否留任企业,都是利益的博弈,结果是选择有利于自己的战略。本文用博弈论对企业人力资本投资作分析,说明企业应当进行人力资本投资和投资后应采取措施保证人力资本投资收益的获取。 

              二、概念和假定 
              1.概念界定 
              ①人力资本。人力资本是通过投资于已有人力资源而形成的、以复杂劳动力为载体的、能实现价值增值的可变资本。 
              ②企业人力资本投资。企业人力资本投资是指企业通过一定的投入(货币、资本或实物)获得人力资源,增加企业员工的知识、技能、健康水平,提高企业管理、文化水平和企业形象,从而提升企业人力资本存量,使企业经济效益提高的一种投资行为。 

              2.基本假设 
              ①经济人。经济人假设是指无论是组织还是个人,追求自身利益的最大化。 
              ②完全信息。完全信息是指信息是完全通畅的,不存在滞塞,而且客观存在的信息的获取是不需要成本的。 
              ③物质资本充足。商品的生产总是物质资本和人力资本结合在一起进行的。 
              要使生产高效率的进行,物质资本和人力资本必须保持适当的比例。 
              三、人力资本投资与员工个人的博弈分析 
              本文从企业与员工之间的角度作人力资本投资的完全信息静态博弈分析,重点分析企业是否增加人力资本投资以及投资后如何行动。 
              假定在完全信息的条件下,企业和员工都是理性的。企业可以选择对员工培训或不培训。根据企业的选择,员工会做出留下或是转投其他企业的选择。假设企业不对员工进行培训是员工的收入为d,当企业选择培训,假设分摊到员工个人的培训费用为c,经过培训后多支付员工的薪水为e(e可以为零,即经过培训后不增加员工薪水),经过培训后员工为企业带来的收益增加值为b。又假设员工离职去另一单位获得的报酬为a。这里为了分析更简单一些,假设员工经过培训与未经过培训跳槽的收入一样,都为a。有时候培训后由于员工技能提高跳槽会获得更多的收入,但是并不影响下面的分析。企业培训博弈分析如表1所示:  当b-c-e<0时,即企业对员工培训后得到的收益增加值小于支出时,不管员工做出如何决策,企业都不会得到任何的收益增加值,因此企业是不会对员工进行培训投入的。 

              当b-c-e>0时,该博弈成立并可能会出现两种均衡:如果此时员工选择留下所获得的收益d+e大于其选择跳槽时所获的收益a时,理性的员工必定会留在原来的企业,企业也必然会选择培训投入,这也是这个博弈中双方的最优决策;如果此时员工选择留下所获得的收益d+e小于其选择跳槽时所获的收益a时,理性的员工必定选择跳槽,此时企业损失为c,损失最惨重。对企业而言,如果知道这样做令员工跳槽的话,那么企业还不如刚开始就不培训,那样蒙受的损失会少些。这里需要指出的是,一个员工是否跳槽并不简单的取决于对方企业开出的薪酬。影响因素有很多,比如员工个性是否与企业匹配、员工个人发展前景、员工兴趣与岗位的匹配等等。上述表格中,企业如果不对员工进行培训,那么员工留下或离职取决于现有收入d和跳槽企业的薪酬a。 

              如果d>a,员工留下:反之员工跳槽 
             
            总之,员工是否留任企业,是一种利益的博弈,并且企业与员工之间存在着信息的不对称,企业必须采取先发行动传递信号减弱员工离任的动机,只要企业能留住员工,人力资本投资就会给企业带来巨大的经济效益。 

            [编辑]案例二:博弈论在企业经营活动的应用策略[2] 
              哈佛商学院波特教授的竞争五种力量,给出了我们思考行业市场竞争状况和态势时一种全面而详细的分析方法,其中一种力量是潜在进入者的威胁。 
              那么,根据市场类型(完全竞争市场、垄断竞争市场、完全垄断市场和寡头垄断市场),由于多数行业市场属于垄断竞争市场,就存在现有企业和新进入者之间的进入和退出博弈,这取决于彼此结构性的进入障碍、对关键资源的控制度、规模经济效应及现有企业的市场优势的因素。 

              如果你是现有行业的垄断者和一定程度的影响者,阻止潜在进入者进入市场或遏止现有企业恶性竞争的博弈策略有: 
              1.扩大生产能力策略 
              垄断者为阻止潜在进入者进入市场,垄断者可能对潜在进入者进行威胁。但垄断者的这种威胁是否能达到阻止进入的目的,取决于其承诺。所谓承诺(Promise),是指对局者所采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。那么,一种威胁在什么条件下会变得令人可信呢?一般是,只有当对局者在不实行这种威胁会遭受更大损失的时候,与承诺行动相比,空头威胁无法有效阻止市场进入的主要原因是,它是不需要任何成本的。发表声明是容易的,仅仅宣称将要做什么或者标榜自己是说一不二的人也都缺乏实质性的意义。因此,只有当对局者采取了某种行动,而且这种行动需要较高的成本或代价,才会使威胁变得可信。 

              2.保证最低价格条款的策略 
              所谓“保证最低价格”条款策略,即可采取限制性定价策略,通过收取低于进入发生时的价格来防范进入。如某商店规定,顾客在本商店购买这种商品一定时期内(如一个月),如果其他任何商店以更低的价格出售同样的商品,本店将退还差价,并补偿差额的一定百分比(如10% 
            )。例如,如果你在该商店花5 
            000元购买了一架尼康相机,一周后你在另一家商店发现那里只卖4500元,那么你就可以向该商店交涉,并获得550元的退款。 
              又如假定一个将存在两期的市场。在第1期只有一个厂商,面临两种选择: 
              ①制定一个垄断高价60元,可获1 
            000元的利润,但会使潜在企业认为该行业有利可图,从而选择在第2期进入;而一旦该市场有两个企业存在,将会使市场价格下降到30元,企业利润降为200元。这样,两期的总利润是1000+200=1200元。 

              ②制定低价40元,潜在企业如果进来,价格降到20元,两个企业的利润都将是0。 
              故此时潜在企业将不会进入。这样,第二期的价格可以确定一个垄断高价60元,因此总利润将为600+1000=1600元。 
              对消费者来说,保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买,但这种条款对消费者是承诺,对竞争者是警告,无疑是企业之间竞争的一种手段。 

              保证最低价格条款是一种承诺,由于法律的限制,商店在向消费者公布了这一条款之后是不能不实行的,因此它是绝对可信的。这一承诺隐含着企业A向企业B发出的不要降价竞争的威胁,并使这种威胁产生其预期的效果。 

              3.限制进入定价策略 
              限制进入定价是指现有企业通过收取低于进入发生的价格的策略来防范进入,潜在进入者看到这一低价后,推测出进入后价格也会那么低甚至更低,因而进入该市场终将无利可图而放弃进入。 

              4.掠夺性定价策略 
              掠夺性定价是指将价格设定为低于成本来达到驱逐其他企业的目的,而期望由此发生的损失在新进入企业或者竞争对手被逐出市场后,掠夺企业能够行使市场权力时可能得到补偿,即在驱逐其他企业后,再制定垄断高价以弥补前期的损失。这也是一种价格报复策略。掠夺性定价与限制定价之间的差异在于限制定价是针对那些尚未进入市场的企业,是想较长一段时间内维持低价来限制新企业的进入,而掠夺性定价则将矛头指向已经进入的企业或即将来临之际。如你产能过剩,在新企业进入时可以进行产能扩张,将商品大幅降价防堵其进入。 

              5.广告战博弈 
              有些商品只有在使用后才知道其质量真正如何,我们把这种商品称为经验品。只有生产那些高质量经验品的企业才会选择做巨额广告,而低质量的企业将不会做广告。原因是高质量经验品会有大量的回头客,而低质量经验品则鲜有人再次光顾。 

              另外现有厂商之间产量、价格竞争的博弈,尚有古诺模型、伯川德模型可以描述。博弈理论在宏微观层面对企业参与竞争、制定竞争策略均有指导意义。著名营销专家希顿曾说,企业家的艺术就是对企业的策略性经营和管理,博弈作为策略,企业在当今激烈的市场竞争中需要博弈!

博弈论案例 分析

2. 博弈论的几个简单概念

 最近学习了得到万维刚老师的精英日课,发现很有意思,有点风陵渡口一见杨过误终身的感觉,原来看世界的视角有这么多种。
   1. 纳什均衡 
   如果博弈各方都足够聪明,大家最终的策略选择一定是这么一个局面:在这个局面里大家都认命了,谁也无法单方面改变策略去谋求一个对自己更好的结局。
   如果一个现象能够在社会中长期稳定地存在,它对参与的各方来说就一定是个纳什均衡。纳什均衡告诉我们,评价一个局面不能只看它是不是对整体最好,它必须得让每个参与者都不愿意单方面改变才行。
   我们生活中的交通规则就是纳什均衡,如果有人改变了这个规则就会增加受伤的几率。
   在双方有强烈的合作意愿,而博弈不止一个钠什均衡时,可以寻找“聚焦点”。聚焦点就是在众多可能的纳什均衡中最显眼的那一个,人们会自动在这一点上达成合作。聚焦点的作用是协调。
   聚焦点可以是生活习惯,可以是历史传承,可以是传统文化,可以是先下手为强,可以是政府指导,可以是随便找到的什么借口,实在不行还可以抽签。
    2.帕累托最优 
   帕累托是一位意大利经济学家,帕累托改进了纳什均衡,在不伤害任何一个人利益的同时,使得至少一个人的境遇变得更好。如果一个局面已经好到没有帕累托改进的余地了,这个局面就叫“帕累托最优”。
   理想青年喜欢纳什均衡,理想青年喜欢帕累托最优。帕累托原则也叫“二八原则”,也很出名。
    3.囚徒困境 
   合作则两利、背叛则两伤。经济学中的“负的外部性”、“公地悲剧”、价格战,国际政治中的军备竞赛,动物世界中的互助行为,体育比赛中的使用禁药,医学中的抗生素滥用,包括心理学中的上瘾现象,其实都是囚徒困境。
   囚徒困境中合作利益不大,背叛对自己有很大好处是当然选择背叛,也企图先发制人,这也称为压倒性策略。
   采取策略:如果博弈是可重复的,应该寻求对背叛者进行惩罚。防止背叛,最直观的办法就是把单次博弈变成重复博弈。重复博弈之所以有效,是因为背叛者会受到惩罚。以牙还牙是最经典的做法,但适当的宽容更能促成合作。
   有效的惩罚必须得满足3个条件:   你得能发现背叛行为;   惩罚必须得是可信的,对方知道他一定会受到惩罚;   惩罚的力度得足够。
   威胁和承诺都是在博弈双方都没有采取实质性行动之前,一方通知另一方的声明。所谓威胁,就是我要求你不要去做某件事——我说如果你做了,我就会对你进行惩罚。所谓承诺,就是我要求你去做某件事——如果你做了,我就会给你一个奖励。
   只有可信的威胁和承诺才有意义。
   可信=别无选择。发出可信的威胁或者承诺有三个办法:给别人惩罚你的权力;主动取消自己的选项;建立声望。
   像网上买东西,7天无理由退款,这是给出承诺,无理由退款就是卖家给出的惩罚自己的权利,以此建立良好的声望,赢得更多的顾客。
   我觉得在教育孩子时也是个囚徒困境,悉心教导,则对双方又有利,如果放任自流,那么最终会害人害己。在教育过程中家长要有威信,也就是可信度,让孩子知道做错事会受到惩罚,但也要注意适用边界,不能太过严厉,不近人情。
    4.压倒性策略 
   在博弈局面中,你有一个策略压倒其他一切策略,不管对手怎么做,这个策略对你来说都是最好的。反之,“被压倒性策略(Dominated Strategy)”,就是不管别人怎么做,你这么做对你都是不好的。
    5.KMRW定理 
   用四个经济学家名字的首字母命名。在不完全信息博弈中,参与者不知道对方是好人还是理性人,那么只要博弈重复的次数足够多,合作能带来足够的好处,双方都会愿意维护自己是好人的这样一个声誉,前期尽可能地保持合作,到最后才选择背叛。
   6. 先发制人与后发的优势 
   小鸡博弈:西方世界的一个游戏,双方开车相向,谁先打方向盘谁就输,就是小鸡。先发制人的做法就是卸掉方向盘,那么对方就只能选择做小鸡。
   只要你能确定对手的底线,那么先发制人,造成既成事实,就能逼迫对手就范。
   悬崖策略是动态进行的小鸡游戏。虽然对方卸掉方向盘,但是你可以选择加速,那么对方必须采取措施。双方每一步都在推动危机升级,这是一个危险的边缘游戏。
   最好的办法给对方一个威慑,让他根本不敢出手。美国国务卿基辛格说威慑有三个要素:实力、决心和让对手知道。
   虽说先发制人,但是先发者暴露信息,后发者利用信息。
   后发优势=先发者的信息+后发者的出手权。信息是模仿机会,出手权是创新机会。   创新的都是落后的,因为不创新就没有机会突围,如果创新成功就会后来居上。
   博弈论不是数学游戏,我们不需要掌握复杂的公式,这只是给了我们看世界的又一视角,会发现生活中更多的乐趣。

3. 博弈论概念

博弈论(Game Theory),博弈论是指研究多个个体或团队之间在特定条件制约下的对局中利用相关方的策略,而实施对应策略的学科。有时也称为对策论,或者赛局理论,是研究具有斗争或竞争性质现象的理论和方法,它是应用数学的一个分支,既是现代数学的一个新分支,也是运筹学的一个重要学科。目前在生物学、经济学、国际关系学、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构(游戏或者博弈(Game))间的相互作用。
  
 合作博弈和非合作博弈
  
 合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
  
 静态博弈和动态博弈
  
 从决策行为的时间序列来看,博弈可以分为静态博弈和动态博弈。静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。
  
 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数(也叫支付)有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。
  
 1纳什均衡(Nash Equilibrium)
  
 在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此
  
 
  
 2纳什定理
  
 任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。
  
 3智猪博弈/完全信息静态博弈(Boxed pigs Game)
  
 智猪博弈是纳什提出的,假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。
  
 在这个过程中,小猪有占优策略,大猪木有,小猪等待对它自己是最优的。
  
 
  
 4囚徒困境/非合作博弈(完全信息的静态博弈、纳什均衡)
  
 1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。
  
 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:若对方沉默时,背叛会让我获释,所以会选择背叛;若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。

博弈论概念

4. 能举些通俗易懂的博弈论例子吗求大神帮助

最精彩的博弈论故事  目标 一条猎狗将兔子赶出了窝,一直追赶它,追了很久仍没有捉到。  牧羊看到此种情景,讥笑猎狗说:“你们两个之间小的反而跑得快得多。”  猎狗回答说:“你不知道我们两个跑的目的是完全不同的 !我仅仅为了一顿饭而跑,他却是为了性命而跑呀!”  动力 这话被猎人听到了,猎人想:猎狗说的对啊,那我要想得到更多的猎物,得想个好法子。  于是,猎人又买来几条猎狗,凡是能够在打猎中捉到兔子的,就可以得到几根骨头,捉不到的就没有饭吃。这一招果然有用,猎狗们纷纷去努力追兔子,因为谁都不愿意看着别人有骨头吃,自己没的吃。就这样过了一段时间,问题又出现了。大兔子非常难捉到,小兔子好捉。但捉到大兔子得到的奖赏和捉到小兔子得到的骨头差不多,猎狗们善于观察,发现了这个窍门,专门去捉小兔子。慢慢地,大家都发现了这个窍门。猎人对猎狗说最近你们捉的兔子越来越小了,为什么猎狗们说反正没有什么大的区别,为什么费那么大的劲去捉那些大的呢?  长期的骨头  猎人经过思考后,决定不将分得骨头的数量与是否捉到兔子挂钩,而是采用每过一段时间,就统计一次猎狗捉到兔子的总重量的方法。按照重量来评价猎狗,决定其在一段时间内的待遇。  于是猎狗们捉到兔子的数量和重量都增加了。  猎人很开心。但是过了一段时间,猎人发现,猎狗们捉兔子的数量又少了,而且越有经验的猎狗,捉兔子的数量下降的就越利害。于是猎人又去问猎狗。  猎狗说:“我们把最好的时间都奉献给了您,主人,但是我们随着时间地推移会变老,当我们捉不到兔子的时候,您还会给我们骨头吃?”  骨头与肉兼而有之  猎人做了论功行赏的决定。分析与汇总了所有猎狗捉到兔子的数量与重量,规定如果捉到的兔子超过了一定的数量后,即使捉不到兔子,每顿饭也可以得到一定数量的骨头。猎狗们都很高兴,大家都努力去达到猎人规定的数量。一段时间过后,终于有一些猎狗达到了猎人规定的数量。这时,其中有一只猎狗说:“我们这么努力,只得到几根骨头,而我们捉的猎物远远超过了这几根骨头,我们为什么不能给自己捉兔子呢”于是,有些猎狗离开了猎人,自己捉兔子去了。五有权分享猎人意识到猎狗正在流失,并且那些流失的猎狗像野狗一般和自己的猎狗抢兔子。情况变得越来越糟,猎人不得已引诱了一条野狗,问他到底野狗比猎狗强在那里。野狗说:“猎狗吃的是骨头,吐出来的是肉啊!”接着又道:“也不是所有的野狗都顿顿有肉吃,大部分最后骨头都没的舔!不然也不至于被你诱惑。”于是猎人进行了改革,使得每条猎狗除基本骨头外,可获得其所猎兔肉总量的n%,而且随着服务时间加长,贡献变大,该比例还可递增,并  有权分享猎人总兔肉的m%。就这样,猎狗们与猎人一起努力,将野狗们逼得叫苦连天,纷纷强烈要求重归猎狗队伍。  故事还在继续  只有永远的利益,没有永远的朋友  日子一天一天地过去,冬天到了,兔子越来越少,猎人们的收成也一天不如一天。而那些服务时间长的老猎狗们老得不能捉到兔子,但仍然在无忧无虑地享受着那些他们自以为是应得的大份食物。终于有一天猎人再也不能忍受,把它们扫地出门,因为猎人更需要身强力壮的猎狗……  Birth of Micro Bone Co. (骨头公司的诞生)  被扫地出门的老猎狗们得到了一笔不菲的赔偿金,于是他们成立了Micro Bone公司。他们采用连锁加盟的方式招募野狗,向野狗们传授猎兔的技巧,他们从猎得的兔子中抽取一部分作为管理费。当赔偿金几乎全部用于广告后,他们终于有了足够多的野狗加盟。公司开始赢利。一年后,他们收购了猎人的家当。  Development of Micro Bone Co. (骨头公司的发展)  Micro Bone公司许诺给加盟的野狗能得到公司n%的股份。这实在是太有诱惑力了。这些自认为是怀才不遇的野狗们都以为找到了知音:终于做公司的主人了,不用再忍受猎人们呼来唤去的不快,不用再为捉到足够多的兔子而累死累活,也不用眼巴巴地乞求猎人多给两根骨头而扮得楚楚可怜。这一切对这些野狗来说,比多吃两根骨头更加受用。于是野狗们拖家带口地加入了Micro Bone,一些在猎人门下的年轻猎狗也开始蠢蠢欲动,甚至很多自以为聪明实际愚蠢的猎人也想加入。好多同类型的公司像雨后春笋般地成立了,Bone Ease,Bone.com,China Bone……一时间,森林里热闹起来。  明星的诞生  猎人凭借出售公司的钱走上了老猎狗走过的路,最后千辛万苦地要与Micro Bone公司谈判的时候,老猎狗出人意料地答应了猎人,把Micro Bone公司卖给了他。老猎狗们从此不再经营公司,转而开始写自传《老猎狗的一生》,又写:《如何成为出色的猎狗》、《如何从一只普通猎狗成为一只管理层的猎狗》、《猎狗成功秘诀》、《成功猎狗500条》、《穷猎狗,富猎狗》,并将老猎狗的故事搬上屏幕,取名《猎  狗花园》,3只老猎狗成了家喻户晓的明星。收版权费,没有风险,利润更高

记得采纳啊

5. 请简单地介绍一下博弈论

博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博弈论是个非常重要的理论概念。 
  什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…

请简单地介绍一下博弈论

6. 博弈论的案例分析,求解答

1、博弈的参与人是两位乘客,我们以A、B来表示,
第一种策略组合:A、5000, B、  5000,   在这种情况下,A和B的收益都是5000。
第二种策略组合:A、5000-20000, B、 5000, 在这种情况下, A的收益是4500,B的收益是5500
第三种策略组合:A、5000, B、5000-20000  在这种情况下, A的收益是5500,B的收益是4500
第四种策略组合:A、B、都是5000-20000,其中A大于B   B的收益比A多1000,且大于5500
第五种策略组合:A、B、都是5000-20000,其中B大于A   A的收益比B多1000,且大于5500
2、两个人的劣势策略都一样,即报价为20000。
这个博弈的结果应该是第一种策略组合,因为双方都要比对方的开价少,才会使自己的收益最大化。
3、答案还是一样的。
4、如果是我的话,就选择5000。

7. 博弈论概念问题

假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1]),则此策略组合被称为纳什均衡
纳什均衡
。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。
 
子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。 
  对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。 
  博弈论专家常常使用“序惯理性”(Sequential rationality):指不论过去发生了什么,参与人应该在博弈的每个时点上最优化自己的策略。子博弈精练纳什均衡所要求的正是参与人应该是序惯理性的。对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。因为有限完美信息博弈的每一个决策结都开始一个子博弈。求解方法: 最后一个结点上的子博弈(纳什均衡)→倒数第二个(纳什均衡) → ······ → 初始结点上的子博弈(纳什均衡)。 
 
纳什均衡(Nash Equilibrium)和子博弈完美纳什均衡(Subgame perfect Nash equilibrium)所反映的博弈都包括了一个基本假设:即博弈的结构、博弈的规则、所有局中人的策略空间和支付函数(payoffs)都是共同知识(common knowledge)。满足这样一个假设的博弈称为“完全信息博弈”(games of complete information)。但在现实生活中这一假设往往得不到满足。在非合作博弈论中,局中人对博弈的结构以及其他局中人的特征并没有准确的知识的情况叫“不完全信息博弈”(games of incomplete information)。在1967年以前,博弈论专家对不完全信息博弈是束手无策的。 Harsanyi(1967—1968)的贡献解决了这个问题,填补了博弈论乃至经济学的一大空白,他也因此而获得了诺贝尔经济奖。John C.Harsanyi引入了一个虚拟的局中人——自然(nature)。与一般的局中人不同,“自然”没有自己的支付和目标函数,即所有结果对它而言是无差异的。自然首先行动,决定局中人的特征。被选择的局中人知道自己的真实特征,而其他局中人并不清楚这个被选择的局中人的真实特征,仅知道各种可能特征的概率分布。另外,被选择的局中人也知道其他局中人心目中的这个分布函数,也就是说,分布函数是一种共同知识(common knowledge)。John C.Harsanyi的这项工作被为“Harsanyi转移”(the Harsanyi transformation),通过这个转换,John C. Harsanyi把“不完全信息博弈”转换成“完全但不完善信息博弈”(complete but imperfect information)。这里“完全但不完美信息” 指的是,自然作出了它的选择,但其他局中人并不知道它人具体选择是什么,仅知道各种选择的概率分布。这样一来,不完全信息博弈就变得可以进行分析了。在这个基础上,John C.Harsanyi定义了贝叶斯纳什均衡(Bayesian-Nash equilibrium)。 
 
精炼贝叶斯均衡是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态均衡的贝叶斯(纳什)均衡的结合。有些书上或论文中也写成精炼贝叶斯纳什均衡。 
  具体来说,精炼贝叶斯均衡是所有参与人策略和信念的一种结合。它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的。第二,每个参与人关于其他参与人所属类型的信念,但是使用贝叶斯法则从所观察到的行为中获得的。 
  完美贝叶斯纳什均衡的要点是在于当事人要根本所观察到的他人的行为来修正自己的有关后者特征的“信念”(主观概率),并由此选择自己的行动。完美贝叶斯纳什均衡是所有局中人策略和信念的一种结合,它满足如下条件:(a)给定每个局中人关于其他局中人特征的概率分布的信息,他的策略选择应该在每一个子博弈都构成贝叶斯均衡,也就是说,给定每个人有关其他人特征的信息的情况下,他的策略等待是最优的;(b)每个人有关他人特征的信念都是使用贝叶斯法则从所观察到的行为中获得的。

博弈论概念问题

8. 求博弈论的案例。。。。

  博弈论经典案例“囚徒困境”及其实证分析
  北京工商大学  刘 健

  最近三四十年,经济学经历了一场“博弈论革命”,就是引入博弈论的概念和方法改造经济学的思维,推进经济学的研究。诺贝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的3位博弈论专家,可以看作是一个标志,这自然也激发了人们了解博弈论的热情。博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。
  博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。


  物价方面
  假如几个店铺联合起来
  自然能够把东西卖的比较贵
  但只要其中一个降价
  其他店的客人就会全跑到那家去
  那另外几家也会被迫降价
  店铺联合本来是最好的赚钱方法
  但店铺间一般是敌对关系
  为防备有人订低价,引走客人
  所有的店铺都会尽可能低价


  在经济学中,“智猪博弈”(Pigs’payoffs)是一个著名博弈论例子。

  这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

  那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

  原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

  “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。

  如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。

  改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

  如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

  改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

  对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

  改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。


  笨蜗居

  Ross和Rachel是一对情侣,暗地里都有过不忠的行为。但他们并不想分开,而是希望能继续生活在一起,于是不得不面对一个问题:是否应该向对方坦白自己的不忠行为?对于Ross来说,他有两个战略,“坦白”或者“隐瞒”。如果他向Rachel坦白自己的过错,Rachel作为“清白”的一方(Ross并不知道Rachel的不忠行为,当Rachel选择“隐瞒”)将在二人关系中占据心理优势,从而使得Ross处于弱势状态。如果他决定隐瞒,则将背负良心上的谴责。这个博弈是对称的,因此对于Rachel来说同样存在这样的两难抉择。
  我们引入经济学的收益概念来衡量博弈中战略的优劣,设收益上限为10分。如果Rachel选择“隐瞒”而Ross选择“坦白”的话,Rachel将占据“我是清白的”的心理优势,从而获得9的收益,而劣势一方的Ross的收益只有5。反过来对Ross来说也是一样。如果两人都不约而同地选择“坦白”,虽然彼此都会感到被背叛的痛苦,但是能够将心比己地互相原谅,二人的收益都是8。如果两人都选择“隐瞒”,他们之间感情得以维系的信任基础已经在事实上消失了,对双方来说都是非常大的损失,收益都只有6。下表列出了四种情况下双方的收益,Rachel在前。
最新文章
热门文章
推荐阅读