关于子博弈精炼纳什均衡衡中投硬币案例的解释,有两个地方不明白??加分求助

请问什么是纳什均衡?_百度知道
请问什么是纳什均衡?
又称为非合作博弈均衡来源  约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。编辑本段定义  假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的
纳什均衡最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。   纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。编辑本段标准定义  纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。编辑本段纳什均衡经典案例:囚徒困境  (1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)   假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证
纳什均衡据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。   表2.2 囚徒困境博弈   A╲B 坦白 抵赖 坦白 -8,-8 0,-10 抵赖 -10,0 -1,-1   关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。   基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原
纳什均衡本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。编辑本段另一个简单的例子  你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?   每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。   n\m 美女出正面 美女出反面 你出正面 +3,-3 -2,+2 你出反面 -2,+2 +1,-1   假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是   3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )   解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x= 3/8代入到收益表达式 3*x + (-2)*(1-x) 中就可得到每次的期望收入,计算结果是 -1/8元。   同样,设美女出正面的概率是y,反面的概率是1-y,列方程   -3y + 2( 1-y )= 2y + (-1) * ( 1-y )   解得y也等于3/8,而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。   其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任 何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。编辑本段重要影响  纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面   1.改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。   2.扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。   3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。   4.形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。   5.扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。   6.改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。
通俗地说,纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。
在纳什均衡中,每一个理性的参与者都不会有单独改变策略的冲动。
处类似“囚徒困境”这样的博弈中,背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡结果,就是双方...
其他类似问题
为您推荐:
纳什均衡的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁论纳什均衡与生活_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
论纳什均衡与生活
经​济​博​弈​论​ ​论​文
阅读已结束,如果下载本文需要使用
想免费下载本文?
你可能喜欢原创:对纳什最好的纪念 是理解纳什均衡_新浪深圳金融
原创:对纳什最好的纪念 是理解纳什均衡
新浪深圳金融评论
 ——“三步”理解纳什均衡
  认识约翰·纳什教授是在大学一年级微观经济学的课堂上,“囚徒困境”是我整个课程中印象最为深刻的理论。
  之所以被它所吸引,现在回想起来应该是在各种以曲线图形为模型的经济学理论中,突然出现一种与社会心理学科相结合的学说,挑动起了我的好奇心。
  毕业进入到社会中,才发现“纳什均衡”可以应用的领域不仅在经济学,其范围之广可以说是无处不在。
  有人说:“对纳什最好的纪念,是理解纳什均衡。”
  为此,“新浪深圳金融”收集到一些关于纳什均衡的理论及案例,望与大家分享。
  【简单来说】
  纳什均衡的指导思想就是在每一种博弈行为中,人们建立在理性假设前提下的决策行为是怎样的。
  这里需要先解释下“博弈行为”是什么,概念之前,先看例子:
  一美元的特别拍卖方案
  “如果将一美元进行拍卖,出价最高的竞拍者用他所报的数目换得这个美元,但是,出价次高的竞拍者也要交出他所报数目相应的美元,并且什么也得不到。”
  ——这是马丁·苏毕克设计的一个“博弈行为”课堂案例。
  最后的实验结果是,学生们最终常常会为这个美元出价超过1美元。而在有些试验中,“获胜”学生最后为该美元付出超过3美元。
  为什么会出现这样的情况呢?
  通过分析发现,在典型的情况下,一方出价20美分,而另一方则出价30美分。出价低者眼看要损失20美分,他想到提高出价能赚到那一美元,因此再次报价40美分。这样逐步升级,直到双方的出价是1美元对90美分。然后,出价90美分的竞拍者必须在出价1.1美元还是付90美分什么也得不到之间作选择。最常见的是,他会提高他的出价,而使出价进一步升级。
  以此推演,有人会出价到3美元,也确实没那么奇怪了。
  大概明白何谓“博弈行为”之后,就已经迈出解纳什均衡第一步了。但在介绍理论之前,还需要一些铺垫:
  第二步:理论中的名词解释,博弈的概念解释及分类。
  【名词解释】
  博弈:考虑到其他人的行为和反应情况下的各博弈方(参与者)的策略决策。
  支付:和某一具体结果相联系的价值。
  策略:参与者在博弈中遵循的行动规则或者计划。
  最优策略:最大化期望支付的策略。
  支付矩阵:在考虑到竞争者的情况下,各个博弈方(参与者)独立做它所能做的最好的决策时,为方便清晰显示各方的选择将结果以矩阵图表的形式呈现。如下表一:
 &【博弈和决策】
  一个博弈(game),就是参与者(participant)在其中作出策略性决策的情景——在考虑到每个其他参与者的行动和反应后作出的决策。
  简而言之,我们关心如下问题:如果我相信我的竞争者是理性的和追求最大收益的,那么在作我自己的收益最大化决策时,我应该如何考虑到他们的行为?
  【博弈的分类】
  合作博弈和非合作博弈
  合作博弈:参与者可以谈判并能使它们设计共同策略的有约束力的合同的博弈。一个典型的例子是在购物时客户与商家讨价还价。
  非合作博弈:不可能谈判并执行有约束力的合同的博弈。在商业中的典型的例子是,两个因法律等各种因素无法进行谈判的厂商相互考虑到对方可能的行为,并独立确定价格或广告策略,以夺取市场份额的情况。
  第三步:在了解“博弈行为”,博弈与决策的关系,以及博弈分类的基础上,下面我们便来介绍“纳什均衡”。
  【纳什均衡】
  纳什均衡是非合作博弈均衡。
  一个纳什均衡就是一组当给定对手的行为时,各参与者所做的是他所能做的最好的策略(或行为)。
  如上图表一中,
  首先,我们从右下角的表格中可以看出,如果厂商1和厂商2选择合作,它们都要定价6美元,才可以达到两个厂商在合作状态下的最大化利润水平各16000美元。而事实上,因为共谋是非法的,所以无论是厂商1还是厂商2都不可以彼此谈判共谋。在这个非合作博弈模型中,4美元定价均是两个厂商在理性状态下的最优选择。如支付矩阵显示,如果厂商2定价4美元,厂商1定价4美元是最优选择,而如果厂商2定价6美元,厂商1定价4美元仍然是最优选择。同样,厂商2也是一样的。
  所以,结果是除非这两个厂商能签订一份6美元的强制实施协议,否则哪一个厂商都不敢期望它的竞争者会定价6美元,并都定价4美元。
  【海滩选址博弈】
  在日常生活中,如果你仔细观察,可以发现纳什均衡是无处不在的。
  炎炎夏日,你看到一个商机——在海滩上销售软饮料。与此同时,你的竞争者(称为甲)也看到了这个商机。假如沙滩有200米长,游玩的人群均匀地分布在海滩上,你和甲以同样的价格销售同样的饮料,而顾客都会选择最近的售点购买。
  那么问题来了,你将选择在海滩的什么地点销售呢?甲又会作出怎样的选择呢?
  假设下面这条线a是你要销售饮料的沙滩:
  a: __________________________·______________·______________
   & & & & & & & & & & & & & & B & & & & & & & A
  开始时,甲将他的摊点设在接近海滩终点位置3/4的地方(如上点“A”)。
  这种情况中,你的最优选择是什么?在如上均匀分布的假设前提下,你的理性将告诉你应该将摊点摆在靠近A的地方,具体为紧靠在甲的左边,这样你可以获得从起点至A相当于全程的3/4的销售额,你的竞争者甲将仅得剩余的1/4。
  但这并不是一种均衡,当甲发现他的位置使他丧失掉销售份额,同样会出于理性的选择,将他的摊点移至海滩的中点B处,你也一样。
  生活中类似于这样的案例还有很多,商场在同一地理位置集聚,除了因为集聚效应外,也有出于距离消费者等距的考虑。而当大选来临,各个党派的候选人在表明政治立场时往往选择中立。
  【占优策略中极大化极小策略的纳什均衡——囚徒困境】
  想必很多人都听说过纳什均衡中“囚徒困境”这个名词,那它究竟是什么呢?
  见下表二:
  内容是这样的:两囚徒被指控是一宗罪案的同案犯,被拘留之后分别关在不同的牢房且无法互通信息。接下来,各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,则很难对他们提起刑事诉讼,两囚徒可以期望被从轻发落为入狱2年;另一方面,如果一个囚徒坦白而另一个不坦白,坦白的这个囚徒就只需入狱1年,而另一个将被判入狱10年。如果你是这两个囚徒之一,你会怎么做——坦白还是不坦白?
  如表二矩阵显示,AB两个囚徒面对一种困境,即虽然坦白对他们两个人来说是整体的最优策略,但却都要承担一个非常大的风险:如有其中一方被对方出卖,而他选择不坦白,则会被判刑10年。而在矩阵中也可以看出,不论囚徒B怎么选择,囚徒A在考虑到极大风险的情况下,最优选择都是坦白。囚徒B也一样。最有可能的结果,是两个囚徒都会担心被利用,而均选择坦白,各入狱五年。
  显然,在这个“囚徒困境”中,坦白对于两个囚徒来说都是占优策略(不管对手作什么,对参与者都是最优的策略)。而在这种有损失可能的模型中,为了确定可收益的确定性,参与者会选择最大化的最小收益,这种策略称为极大化极小策略。
  显而易见,这种策略是保守的,并非收益最大化。
  【纳什均衡的反向运用——认罪减刑之所以被禁止】
  囚徒困境带来的结论是:如果有两个人被认定为罪犯,而实际上只有一人犯罪,另外一人是无辜的,犯罪者会为了减刑而坦白一切甚至冤枉清白者(单独背叛)。最糟糕的情况是,如果他们二人都被判入狱,坦白的犯罪者刑期少,坚持无罪的冤枉者刑期反而更多。所以,已经有许多国家将“认罪减刑”条例禁止。
  【结语】
  纳什均衡之所以伟大,或许就因为它普通,而且普通到几乎无处不在。
& & (新浪深圳金融 杨阳/文)

我要回帖

更多关于 纳什均衡理论 的文章

 

随机推荐