纳什均衡定义 的定义是什么

君,已阅读到文档的结尾了呢~~
纳什均衡定义定义,概念,纳,纳什均衡,纳什均衡点
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
纳什均衡定义
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口【图文】第二讲纳什均衡_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
第二讲纳什均衡
上传于||暂无简介
大小:430.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢纳什均衡(Nash equilibrium)
滑稽的诺贝尔奖·笑谈纳什均衡
1950年和1951年纳什的两篇关于非合作博弈论的论文,他谎称证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。。但是他骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终于,有一个博弈取胜的幻想在没有验证之前,由于各种意外与巧合,诺贝尔委员会首先创造了一个博弈的奇观,把纳什捧为博弈大师。
瑞典皇家科学院的一名成员斯塔尔说:博弈取胜毫无进展,把奖颁给他,相当于颁给一个普通人一样荒唐,未来在博弈领域博弈取胜的理论一旦被证明,评委会的声誉就受到打击。 “一个错误的选择可能损害这个奖的声誉,大家担心整个事情可能一败涂地,若干年后将变成一大丑闻”。 ”。      
无效的纳什均衡
&纳什是一个数学家,他的“纳什均衡”既不是数量的平均,又是什么呢?“纳什均衡”的概念。经过半个多世纪的研究,他和全世界的人都没找到理由解释“纳什均衡”,??
回忆日在科学院的投票中,纳什与诺贝尔经济学奖的另外两名候选人勉强以微弱多数胜出,这是历史上最接近失败的一次评选。纳什是他们最后一个通知的人。电话铃响的时候,通知人雅各布森,“最难以置信的时刻”,发现纳什出人意料的平静,但他心中很害怕。他在事后说,“。”
日晚,诺贝尔北京论坛在故宫东侧菖蒲河公园内的东苑戏楼闭幕。热闹的晚宴结束后,纳什没有搭乘主办方安排的专车,而是一个人夹着文件夹走出了东苑戏楼。他像一个普通老人一样步行穿过公园,绕到南河沿的人行横道等待红绿灯。绿灯亮起,老人独行的背影在暮色中渐行渐远,终于消失不见。纳什一直害怕见人,他最怕有人问他 纳什无法解释难堪的日子还在后头呢。  
纳什看*粒子基因的映射均衡理论,博弈单方占优理论,一旦被验证,“纳什均衡”怎么均衡?
博弈论的意义
中《人类未知的蓝色档案》一文中写道:
《*》(新加坡)经济学世界十部经典著作之一
“谁能让现代的博弈行为接近野蛮,谁能让友善与凶残之间的距离大到令人不解,谁就在博弈中取胜。”
博弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。 基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。&
国务院的经济战略版本
中说:"一个民族博弈知识的落后,也会落后其他民族。无论是穷国和富国,还是穷人和富人,都会要求改善博弈的结果。""穷富的区别就在于分享的多少。";整合人才、知识、科技、创新的一切优势,推进着国家的富强,并向未来发出挑战 。一个国家的高端人群和各界精英如果掌握了更多的博弈知识,掌握了博弈方法论,就会表现出令人难以置信的经济成就。也许在某一时期,他们参与世界博弈的混战,世界经济也会为此颤抖。 。
博弈论对纳什的嘲讽
我们用高熵赛棋认识粒子行为,就是认识人的行为,它和各单元之间的相互作用就是提示我们认识人和社会的关系,就不是部分之和那样简单。其实,它包含了无数个体单元性质的主题,它们相互嵌套在一起,是实体的概念。科学发展观就是这个博弈实体的概念,《*》上说:“实体一元论在数目上的同一性,发生的因果次序不属于个人的部分本性,这种属性是实体的性质。”由此看出,人是代表了实体。如果认识科学发展观是用博弈实体的理论,就可以确定人性与物的对局是,也是大自然的平行法则。如果我们用科学发展观的定义,理解科学发展观和博弈实体相关联的许多事物并把它应用到社会中的具体事件上,用四种量具作出的区分,那才是完美的知识论。 由此,我们也看出了三笔糊涂账: 一,中国的孙子兵法:运筹帷幄,审时度势,权衡利弊,知己知彼,至今却没有形成标准化的尺度,也没严格的数据。如果我们用科学发展观的定义度量它们,它是一笔糊涂账。 二,现代人对社会的认识:什么是各部门之间加强沟通、协调与综合平衡,什么是精确思维和模糊思维的对立统一,什么是个人目标与组织目标综合思考,什么是定性定量相结合,什么是相互合作又相互竞争,什么是单极思维与综合思维。我们对每一句话进行追踪,发现它们抽象、空洞,没有具体内容。谁也不知道表述的一大半一小半是什么结构,没有实体,就没有性质,没办法定性就没办法区分,没办法量化就没办法计算。如果我们用科学发展观的定义度量它们,它又是一笔糊涂账。 三, 近代科学家的理论:广义相对论和狭义相对论、牛顿的力学和绝对时空观、弯曲时空、坐标对应、平衡对称、四维时空、场属性等这些概念,如果我们用科学发展观的定义度量它们,它是科学家的一笔糊涂账。 无论他们用什么方法,都是在用不同的方式进行排列,也是在进行博弈的重组。几百年来,人类探索博弈取胜之道毫无进展,理论思维极度混乱。从纳什发表他的文章60多年以来,并没有带来纳什热,他的纳什均衡取胜理论,一定不是量的平均,他自己就不知道纳什均衡是博弈实体里的大自然特性,他不知道实体与性质的结构,所以纳什就根本不知道在博弈中怎样取胜,因此,他在世期间不会向世人做出博弈取胜的解释。今日我们用科学发展观的定义再看博弈论、矛盾论、概率论,还有所谓的经济学名著,无论多么伟大的经济学天才,使用上述的这些理论,都不知道怎么占优,不知道怎么能赢。 既然他们在预测未来上毫无进展,那么在科学发展观的时代,就应该对研究博弈单方占优的理论有所关注。即使总统竞选也是使用了高熵赛棋二人对局的博弈机制。以往谈囚徒困境和纳什均衡的人都是用一个模糊的概念搬来搬去,坐在办公室里凭空假想,对天论道,从无知到无聊争论了半个多世纪。博弈论是赌徒理论,是真正赌徒的矛盾对决,用筹码表现输赢与均衡结果的语文学理论那才是真正有价值的经济学理论。看看《*》,怎样区分决策人和对抗者的先后次序,为什么对它们进行了不同的称呼,满足了托马斯•谢林多年的困惑,实现了它们的单方占优。更为讽刺的是,一本本博弈论著作,古老的内容千篇一律,里面没有几句精彩的话,没有几个经典的词,更没有定理、定律、定义和法则。至今一个个博弈论专家、矛盾论专家、概率论专家和外行知道得一样多。从的出版,人们才知道博弈的二人对局中一个是,一个是,《*》在166节中写道:“那些身穿黑色礼服,年迈的绅士们,为博弈的进步捧走了人类最高的诺贝尔奖,这是人类博弈的最高水平,假如他们进入娱乐场,在百家乐的赌台上搏击,我想他也会像拳击运动员一样被击败在拳台上,这一定是一个事实,他必须接受这个事实,一定会被裁判渎秒。” 以往经济学家为了降低风险,建议投资多元化,“不要把鸡蛋放在一个篮子里”。这种分散投资的经济思想,实在是经济学家对博弈取胜的无奈。我们把科学发展观的理论特征和高熵赛棋的实际相结合,从实际操作的输赢结果中得出结论:一个资深的经济学家在高熵赛棋上的表现比一个智力不全的人还占弱势,这是无情的博弈事实在453节有一段风趣的表述:“我们根本不能完全理解大自然,在寻找食物时能选择最近的路程,那是大自然的拓扑几何图像的捷径。”
博弈论 西方死亡的博弈论
非白即黑的矛盾论辩证法已经受到时间、空间和博弈实体特性的极大限制,而博弈论、矛盾论、概率论和西方经济学一样都不是完美的理论,已经不能指导博弈实体向更高文明的发展,更不能指导未来。科学发展观的博弈实体知识论、国正论哲学辩证法、矛盾论经验对决,它们共同的结构可以构筑未来科学、自然哲学。 我们应用科学发展观的博弈哲学思想,阐明了博弈论、矛盾论、概率论的战术性质。 博弈论是二人对局,一个叫,一个称。 矛盾论是两个同性质的二人对决。 概率论则是通过二人对局的个数之比得出。 博弈论、矛盾论、概率论各自都是两个相同性质的对决只能提供经验,只有对实体与性质的区分才能称为知识。西方文化大宗教理论都是极其渺小的个体性质的战术属性,决不能处理博弈实体里的战略。在任何博弈实体的系统里,在具体事件中,用矛盾论建立的二人博弈对局都是在悖论中自圆其说,都不能通达博弈实体的事实真相。博弈论、矛盾论、概率论这些文化大宗教理论已经不能解决未来博弈实体里的文明,到了极不正常的历史死亡阶段。因为这些抄来抄去的非物质文化概念,界定模糊,无法定性,无法区分,无法操作,无法验证,不能证明,又不能证伪。它让人没有自在,没有自我,没有哲学,更没有科学。科学不是为哪个阶级服务的,科学是大自然前进的规则,科学又像似监工,《*》中说:“。”任何邪恶和迷信都会后退,科学的任务是如实地让人们认识自然本来的面貌。粒子行为论、国正论、国边常数1.992187是对政府和人民的提醒,也是让怀疑论者百口难辨。*著作人在他的另一部一书中写到:“。”博弈取胜的理论会引发更多人对战略文化的思考。
博弈论单方占优模型
高熵赛棋这个单方占优的理论模型,把百家乐赌台当棋盘,把赛棋“红方、蓝方”转换成“庄、闲”,一旦特性移植的取胜理论被验证,那些无知又无聊的一维思想,那些忽悠人的博弈论、矛盾论、概率论将被彻底否决。 一书中说:“哪里有生命,哪里就有事件的开端。哪里有矛盾,哪里就有死亡。哪里有非绝对对对立的国正论,哪里就有粒子行为的碰壁而终结,哪里就有新体制、新结构和新事物的创生。” 21世纪是科学发展观的时代,与此同时各种错误的观念都在转变。未来的专家不必用围棋、象棋和多米诺骨牌表示博弈对局,这些都不是博弈的实战模型。那些在媒体上拿着棋子在棋盘上比来比去做广告的人,没有一个人能讲出什么是战略,什么是战术,什么是决策人和对抗者,他们怎么能单方占优,怎么才能赢。更为滑稽的是,一个博弈论专家、矛盾论专家、概率论专家,竟没有创造一个词,也没发明一句经典的话,更不要说定理、定律、定义和法则,所以没有一个人敢公开说怎么赢。 未来的政治家、军事家不能仅仅喊几句博弈口号或知道一点散落在民间的博弈小常识和几个博弈词汇,也不是讲几个博弈的小故事。如果不知道高熵赛棋具有极其重要的军事战略文化价值,没有真正用的二人对局对其进行深入地实战性研究,就不知道在二人对局中如何战胜对手,更不知道在未来的大博弈中取胜,对一个国家的各级CEO,那将是一个灾难性的未来。《*》上说:“21世纪博弈的大事是精确地测量,科学家可以对未来100年的科学进行预测,没有一个人敢预测博弈的未来,可见难度非同一般。不经过测量的东西是粗糙的、杂乱的、不符合意愿的、难以控制的。”《*》阐述的理论和高熵赛棋,这不是虚构的文学故事,也不是官员的形式空话,更不是大学里抄来的论文,这是公开于世的发现,它所有的理论都受到知识产权的法定保护。
博弈论 成语:1024连胜法则
成语:() 高熵赛棋是一个大发明,它是一个博弈的取胜模型, 总统候选人用它获得竞选宝座,科学家用它有所发现,傻子用它改变智力的结果 麻将店老板得知这一消息,就买了几套高熵赛棋放到店里,结果很少有人玩,该店就决定通过一次竞赛让人们了解高熵赛棋。当竞赛信息发出后,奇怪的是前来报名参赛的人有总统候选人、科学家、还有一些傻子。由于赛期和总统竞选日期冲突,候选人就不来了,科学家担心自己发现的成果会泄漏,科学家也不来了,最后有参加竞赛,他们使用末尾淘汰制,经过八轮淘汰之后,剩下四个傻子连续八次不败,让人无奈的是他们遵照了“1024连胜法则”,其中的一个傻子对麻将店老板说:“。”
《*》中的映射均衡
《*》里《人类未知的蓝色档案》一文中说:“想赢得未来,不是数学家的映射方程,而是映射均衡。”在高熵赛棋上每一次发生的事件分别用红蓝粒子进行记录,可以看成是一个粒子行为的一次涨落,也是自己的智慧作出与大自然竞赛结果的记录。当同色粒子连续出现三次之后就另外加上一个粒子,通过这样一个粒子插值,有可能产生一个基本粒子单元,也就相当于结束了一个事件或一个阶段。这个虚拟的粒子插值组成了一个粒子大分子,这个插值相当于正常机体里的癌细胞,它的增值会使这个健康的大分子染上与它同样的性质,已经失去真实大分子的价值,根据国正论系统的辩证法原理,人们把这个虚拟癌化的大分子看成“国”,把它映射均衡的空间看成一个“正”的稳定区间,这是博弈取胜的空间,在事件发生之前一大半的信息可以被人掌握。 博弈论人的行为表现自然科学一切创新的文化,借用高熵赛棋这个二人博弈对局的模型认识粒子行为基因的原理,它证明了自然界的一切事物不可约化的复杂性,科学家越来越多的努力在这里遭到了莫名奇妙的失败。我们从科学的定义里可以看出,任何一个人在博弈实体中发生的事件都是前所未有的,也不可预测。谁通过观察高熵赛棋上的粒子状态,谁用历史上自然显示出来的粒子规律和经验预测未来,谁将失败。创新的设计和预测没有固定的章法,也没有不变的模式。 经验是个人可复制的历史文明行为。 规律是领袖对未来秩序的文化思考。
博弈论是博弈实体里的兵法
20世纪缺少的理论,实体是战略,性质是战术。实体是组织,性质是个人,实体是宏观,性质是微观。博弈实体的文化结构只是知识论的区分,不是两个性质的矛盾对决。哪里使用矛盾论绝对平等,哪里就有纠缠;哪里把矛盾论看成是哲学的思辨,哪里就有争吵;哪里用矛盾论解决两国实体观念的静止,哪里就有战斗。 过去的东德和西德,现在的中国大陆和台湾,南韩和北朝鲜,都是实体分离不变的性质,只是区分,不是对决。任何三者插手他们的政治主权,都有博弈的动机,这种战术行为,只能得到阶段性利益,当然也会留下博弈“囚徒困境”的后患。 我下面的表述,是战略和战术,也是宏观经济学和微观经济学,相当于实体与性质的混合性表述,这给理解带来困难;未来战争的目的不是占领,而是毁灭性打击。减少对手,独自掠夺,这是未来战争的博弈取胜法则。博弈的理论告诉我们,未来战争是最短时间的战斗行为。核弹的相互威胁,也不是无止境地威胁下去,只要有,就会发生,因为小规模的冲突与发展不是一个梯度的边界,而是一个射度现象。人们在处理恐怖和危机时,没有一个博弈高手敢说在射度的未来会发生什么,人对未来的判断都是决策人的性质,没有人懂得对抗者的空间才是最终占优,所以决策人的一大半行为都是错误的,都是以不愿看到的一大半失败而告终。 假如一个强大的国家受到他国的威胁,这时就要用《*》的博弈理论把来自威胁的地方看成,应该做出对抗者的行为,先发制人,一举毁灭。《*》的博弈哲学思想表明:如果一个弱小的国家利用博弈的战术能够拥有与大国同归于尽的战争意识,并拥有同归于尽的能力,他们将成为伙伴。 《*》中说:“优先预测悲剧后作出的忍让是道德。优先预测胜利前作出的竞争是博弈。”这种博弈协同将转为,道德协同也会上升为博弈协同。 战争发生——当可利用的能量和自信超越对死亡的恐惧,战争就不可避免。 贪污腐败——当自信超越对意外发生的恐惧,贪污就不可避免。 执法犯罪——当利益与卖法超越对犯罪的恐惧,执法犯罪就不可避免。 国家领导人应该对道德与博弈的配比完全根据现实临时进行调整,让每一个人建立博弈实体世界观,让每一个人懂得,未来的政治是,接受实体特性与两灵性的分离不变性学说,体现科学发展观时代执政的科学理念。未来世界评比各国领袖的治国战略,就是看他应用道德与博弈的水准作为他个人的综合竞争力,无论他是显示人性的和平或者发动残酷的战争,都是文明与野蛮的创作,它们同是博弈的性质,都可能得到好评。 大自然的秩序就是博弈实体外在于个体的一个整体结构,大自然的实体已经内化到了个体的人性。 人的理性就是来源于自然实体瘾魂的秩序,自然的秩序高于理性。 如果理性符合自然的要求,自然的要求就自然地实现 假如理性违反自然的秩序,自然的秩序就强制地实现 这就是在博弈实体中解释人与自然的意图。 这些军事价值应用的博弈理论属于首脑和防长的智库理论,未来每一个国家的最高司令部都要秘密地成立战略博弈司令部,这是未来博弈实体政治之上的政治博弈。 其实,所有的问题都具有非绝对对立的结构。国正论的上一级为实体特性,国正论的下一级为矛盾性质,博弈实体、国正论、矛盾论都是在相对比较时产生的结论。人们在观察世界时临时凝结成的一个组织可能是博弈实体,可能是国正论,可能是矛盾论。 博弈实体是世界观,国正论是系统论,矛盾论是辩证法,它们都是哲学的范式。
博弈实体经济学
《*》博弈实体经济学的定义: 。” 人们看到的兴起,把宏观经济学和微观经济学合为一体,用知识论对所谓的宏观经济学和微观经济学进行特性的的区分,建立博弈实体经济学。人们看到国正论非绝对对立性,是哲学认识事物。人们看到矛盾论同性质的斗争和娱乐会产生两大不同特性,这将是人类走向文明进步首先遇到的最新文化课题。科学理论家、优秀的政治家、银行家、军事家、法学家,对它们不同层次的相对性进行完整的思考和语文学表达,一定会形成科学的统一理论,让人们看到真实世界的本质。
世界十部经典著作
1、亚当.斯密(英国)《》。斯密此书是现代经济学的奠基之作,也是最伟大的经济学著作。他的劳动价值论,分工与专业化是经济效率之源的理论,“看不见的手”经济自由主义理论,都睥睨古人,下开百世。对经济学的贡献堪比牛顿对物理学的贡献。    
2、(新加坡) 。独创了国正论、国正双赢理论和粒子行为论,是一部影响人类的非物质文化的经济学高级学术著作,它的的理论,理论,引起世界、、自然哲学、博弈论界的极大关注。   
3、大卫·李嘉图 (英国)。《政治经济学与赋税原理》(第一卷)。李嘉图是伦敦交易所里成功的投机商人,又能在理论经济学领域做出不朽贡献,真是绝顶的天才。本书中他阐明的比较优势理论是现代自由贸易政策的理论基础。索罗斯在投机之余,也写些《全球资本主义危机》之类的书,不过其理论造诣比之李嘉图,则相距太远。   
4、马克思(德国)《》。马克思的剩余价值理论撇开学理而言,就其改变世界的力量之大,够入选最重要的经济学著作。   
5、瓦尔拉斯(法国)《纯粹经济学要义》。现代经济学的主观价值(效用)论、边际革命、经济学数理化的转向通过本书而系统化,熊彼特曾赞誉此书为经济学作为严密科学所取得的最高成就。    
6、费雪(美国)《利息理论》。在我看来,此书是迄今为止最伟大的关于资本理论的研究,在马克思发现剩余价值的地方,他看见的是放弃当前消费而承担未来的不确定性的风险的报酬。张五常认为本书驳倒了《资本论》。    
7、(英国)《就业、利息和货币通论》。在我看来,尽管被称为宏观经济学的奠基者,他最重要的贡献也许是对个人理性通过自由竞争自然产生社会理性(斯密“看不见的手”理论的核心)这一理论的质疑和批判,只是其建设性的部分即国家干预政策争议很大。   
8、(英国)《经济学原理》。马歇尔的最主要著作是1890年出版的《经济学原理》。该书在西方经济学界被公认为划时代的著作,也是继《国富论》之后最伟大的经济学著作。该书所阐述的经济学说被看作是英国古典政治经济学的继续和发展。以马歇尔为核心而形成的新古典学派在长达40年的时间里在西方经济学中一直占据着支配地位。   
9、萨缪尔逊(美国)《经济学》。把一本教科书选为最重要的经济学著作,会遭到很多人的质疑。本书作为最成功和发行量最大的经济学教科书,在把经济学知识标准化、体系化方面的贡献比当代任何一个人都多。就其改变经济学知识的传播和复制方式的力量之大,入选最重要的经济学著作。    
10、布坎南(美国)《同意的计算》。本书开创的“公共选择”理论,使宪政民主制可以用数理工具定量分析,为经济和政治的制度研究开辟了全新的路径。
 无聊的纳什均衡
  纳什均衡,又称为非合作博弈均衡,是的一个重要术语,以命名。
  在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
再看人大经济论坛的博弈论文章,都是抄来的垃圾,没有一句经典理论。
博弈论栏目里大堆大堆的文章,都是博弈门外汉的胡说八道。
  一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡忽悠人的例子
  一个无聊的例子就是,囚徒困境是一个。 大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。 于是,两人同时陷入招供还是不招供的两难处境。其实如果两人均不招供,将最有利,只被判刑三个月。
博弈矩阵 囚犯甲
甲判刑十年;乙判刑一年
甲判刑一年;乙判刑十年
判刑三个月
  基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三个月就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。
本词条由以下会员参与贡献
→如果您认为本词条还有待完善,请
词条内容仅供参考,如果您需要解决具体问题(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
暂无同义词
关于本词条的评论 (共0条)5366人阅读
三十分钟理解系列(1)
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld。
技术交流QQ群:,欢迎对算法、技术感兴趣的同学加入。
纳什均衡(或者纳什平衡),Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要策略组合,以约翰·纳什命名。
约翰·纳什,生于日。著名经济学家、博弈论创始人、《美丽心灵》男主角原型。前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家(经济学家,约翰·C·海萨尼和莱因哈德·泽尔腾)在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。
纳什的人生非常曲折,一度学术成果不被认可,甚至换上严重的精神分裂症,在爱的力量下在很多年后奇迹般地恢复,并最终获得诺内尔经济学奖。影片《美丽心灵》(A Beautiful Mind)是一部改编自同名传记而获得奥斯卡金像奖的电影,影片以约翰·纳什与他的妻子艾莉西亚(曾离婚,但2001年复婚)以及普林斯顿的朋友、同事的真实感人故事为题材,艺术地重现了这个爱心呵护天才的传奇故事。
年轻时的Nash,很帅噢
纳什均衡定义
经济学定义[3]
所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。
注:经济学定义从字面上还是相对比较好理解的;这里稍微解释一下数学定义,博弈论也称Game Theory,一场博弈用G表示,Si表示博弈方i的策略,ui表示收益。因此,纳什均衡的意思是:任何一方采取的策略都是对其余所有方采取策略组合下的最佳对策;当所有其他人都不改变策略时,为了让自己的收益最大,任何一方都不会(或者无法)改变自己的策略,这个时候的策略组合就是一个纳什均衡。
纳什证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,纳什均衡一定存在。以两家公司的价格大战为例,纳什均衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash均衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。
纳什均衡案例
以下介绍几个经典的纳什均衡案例[2][4],因为本文主要是以科普为主,所以案例不会涉及到复杂深奥的经济学问题(事实上,我也不懂,哈~)。
(1)囚徒困境
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
此时产生了两个嫌疑人之间的一场博弈:
表中的数字表示A,B各自的判刑结果。博弈论分析中一般都用这样的表来表示。
该案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
注:亚当·斯密的理论(“看不见的手”原理),在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。
(2)智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
(3)普通范式博弈
GOO公司和SAM公司是某手机产品生态的两大重量级参与者,双方在产业链的不同位置上各司其职且关系暧昧,有时也往往因商业利益和产品影响力的争夺而各怀异心。二者的收益也随着博弈的变化而不断更替。
上图表格模拟了两家公司的博弈现状,双方各有两个可选策略“合作”与“背叛”,格中的四组数据表示四个博弈结局的分数(收益),每组数据的第一个数字表示GOO公司的收益,后一个数字表示SAM公司的收益。
博弈是同时进行的,一方参与者必须站在对方的角度上来思考我方的策略选择,以追求收益最大化。这在博弈论里称作Putting yourselves into other people’s shoes。
现在我们以GOO公司为第一人称视角来思考应对SAM公司的博弈策略。假如SAM公司选择合作,那么我方也选择合作带来的收益是3,而我方选择背叛带来的收益是5,基于理性的收益最大化考虑,我方应该选择背叛,这叫严格优势策略;假如SAM公司选择背叛,那么我方选择合作带来的收益是-3,而选择背叛带来的收益为-1,为使损失降到最低,我方应该选择背叛。最后,GOO公司的分析结果是,无论SAM公司选择合作还是背叛策略,我方都必须选择背叛策略才能获得最大化的收益。
同理,当SAM公司也以严格优势策略来应对GOO公司的策略选择时,我们重复上述分析过程,就能得出结论:无论GOO公司选择合作还是背叛策略,SAM公司都必须选择背叛策略才能获得最大化收益。
最后我们发现,本次博弈的双方都采取了背叛策略,各自的收益都为-1,这是一个比较糟糕的结局,尽管对任何一方来说都不是最糟糕的那种。这种局面就是著名的“囚徒困境”。
但是,博弈的次数往往不止一次,就像COO与SAM公司双方的商业往来也许会有很多机会。当二者经历了多次背叛策略的博弈之后,发现公式上还有一个(3,3)收益的双赢局面,这比(-1,-1)的收益结果显然要好很多,因此二者在之后的博弈过程中必然会尝试互建信任,从而驱使双方都选择合作策略。
这里有一个理想化假设,那就是假设双方都知道博弈次数是无限的话,也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作,最终的博弈收益将定格在(3,3),这就是一个纳什均衡。既然博弈次数是无限的,那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的报复(这种报复在博弈论里称作“以牙还牙”策略)。
还有另一种假设情况是,假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失,于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1,-1),这就形成了第二个纳什均衡。
由此可见,随着次数(博弈性质)的变化,纳什均衡点也并非唯一。
(4)饿狮博弈
假设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设狮子A吃掉绵羊后就会打盹午睡,这时比A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子A敢不敢吃绵羊?
为简化说明,我们先给出此题的解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。假设狮子E睡着了,狮子F敢不敢吃掉狮子E?答案是肯定的,因为在狮子F的后面已没有其它狮子,所以狮子F可以放心地吃掉午睡中的狮子E。
继续前推,既然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子D。
再往前推,既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子C。依次前推,得出C不吃,B吃,A不吃。所以答案是狮子A不敢吃掉绵羊。
推理结果如下图:
但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,很容易得出结论:狮子G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的答案变成了狮子A敢吃掉绵羊。
对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时,A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。
(5)硬币正反
你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?
每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。
假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,由此列出方程就是
3x + (-2)(1-x)=(-2) * x + 1*( 1-x )——解方程得x=3/8;同样,美女的收益,列方程-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)——解得y也等于3/8。
于是,我们就可以算美女每次的期望收益是: (1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,也就是说,双方都采取最优策略的情况下,平均每次美女赢1/8元。
其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。
纳什均衡分类
最后讲一讲纳什均衡的分类。纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。
要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为 1,其他的则为 0。
故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题”就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。
[1] ,百度百科:约翰·纳什
[2] ,百度百科:纳什均衡
[3] 高鸿业.西方经济学(微观部分)第五版:人民大学出版社,6
[4] ,一般人也能看懂的纳什均衡案例
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:138561次
积分:1913
积分:1913
排名:第15942名
原创:43篇
转载:19篇
评论:43条
关注机器学习、深度学习算法,高性能硬件;
(2)(7)(5)(2)(2)(1)(5)(4)(3)(7)(7)(1)(2)(6)(1)(1)(4)(1)

我要回帖

更多关于 纳什均衡 的文章

 

随机推荐