如何理解博弈论模型的非合作博弈模型

博弈论与人类互惠利他主义的形成【马克思主义哲学吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0可签7级以上的吧50个
本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:29,621贴子:
博弈论与人类互惠利他主义的形成
【关键词】博弈论互惠理论利他主义霍布斯问题  博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的。  博弈论的开创者为美国两位著名的数学家冯.诺伊曼(von Neumann)和奥斯卡.摩根斯坦(Oskar Morgenstern),在冯.诺伊曼开始的工作中,一篇由波瑞尔(Borel)写出的关于极小极大性的文章给了他提示,使他将已有的想法发展成一个原创的观点,即“博弈论”。在博弈论中,冯.诺伊曼证明了“极小极大定理”(minimax solution),之后他逐步扩大在这一领域内的研究,于1944年与合作者摩根斯坦发表了经典的论文《博弈论与经济行为》[1]。这篇论文的发表,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯•诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础[2]。合作型博弈在20世纪50年代达到了巅峰期。然而,冯.诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈——“纳什均衡”应运而生了,它标志着博弈论新时代的开始!纳什(John Nash)在1950年和1951年的两篇开创性论文《n人博弈的均衡点》和《非合作博弈》,在这两篇论文中,纳什用严密优美的数学证明,给出了纳什均衡的概念和均衡存在定理。纳什的非合作博弈的理论比冯•诺伊曼的合作博弈理论更能反映现实的情况,因此将冯•诺依曼的“极小极大定理”推到非合作博弈领域,找到了普遍化的方法和均衡点[3]。今天博弈论已发展成一个较完善的学科。什么叫博弈?博弈的英文为game,我们一般将它翻译成&游戏&。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是人们遵循一定规则下的活动,进行游戏的人的目的是“赢”。在英文中,game有竞赛的意思,如奥林匹克运动会叫Olympic Games,进行game的人是很认真的,不同于汉语中游戏的概念。而在汉语中,游戏有儿戏的味道。对博弈论通俗的理解是一种“游戏理论”,其准确的定义是[4]:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应的结果或收益的过程。一个完整的博弈应当包括以下五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。在博弈论的众多模型中囚犯困境博弈最为经典,囚徒困境博弈源自关于两个合伙犯罪者的传说[5]。不过该案例讨论的是二人合作作案被缉捕后的招供还是不招供的理性选择问题,用以讨论伦理关系的形成虽没有逻辑障碍但有心理障碍,为后面讨论人类互惠利他主义形成的需要,在此将它改为A、B两个原始人合作捕杀猛兽的博弈。这两个原始人在捕杀猛兽时要么逃跑,要么合作,不可抗拒。如A在战斗中逃跑待B擒得猛兽后又可坐享其成,因而对A 的利益来说这个对策的得分可记为10分。而B留下孤军作战,虽也有捕获猛兽的机会,但也有被猛兽咬伤的危险,权衡得失这个对策对B 的利益来说可记为0分。A、B同时逃跑,利用这段时间去采集野果、野菜之类,虽然没有肉食但也不是一无所获,故二人在记分上均记为2分。而如果A、B 都坚守阵地合作战斗,可将猛兽打死,均分其肉,各记得分为6分。这样在这个不确定的博弈中,A与B均有两种对策:1.逃跑,2.合作。他们的支付矩阵如下:[6]A[1](逃跑)A[2](合作)B[1](逃跑)(2,2)(10,0)B[2](合作)(0,10)(6,6)表1 合作狞猎博弈模型支付矩阵这个博弈刻划出博弈者利益部分冲突的情况,被许多研究领域作为一种有效的分析手段而广泛采用。特里弗斯(Robert Trivers)最早采用囚徒困境博弈,提出了描述互惠利他主义行为的自然选择模型。该模型说明了自然选择在系统中如何不利于骗子(非互惠者)。阿克塞尔罗德(Robert Axelrod)与汉密尔顿[7]以囚徒困境博弈境况中的进化稳定策略概念为基础,发展了这个模型。在这两篇论文的基础上,关于互惠性的囚徒困境建模工作不断深入。  博弈论对人的基本假定是:人是理性的(rational)。所谓理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。博弈论力图在这个最简单的假定下得到丰富的结论,博弈论专家的这种做法如同物理学家对自然的假定一样。大家知道,物理学家往往假定几个最基本的假设,这最基本的假设构成公设,其余的结论由它们推得,如爱因斯坦的狭义相对论只有两条假设[8]:(1)物理定律在所有参考系中不变;(2)在所有参考系中光速保持常数。多么简单的公设!在这两个公设下得出了惊奇的结论,如运动的参照系中尺子收缩,时钟变慢,等等。相对论的这两条公设改变了物理学的整个构架,也改变了人们对自然的整个看法!在伦理学上有众多经久不衰的问题,其中有两个问题是霍布斯问题和罗尔斯问题[9]。霍布斯问题是:经济人与伦理人的关系如何?我们能够从经济人的论述中推出伦理人的论述即伦理规范的论述吗?罗尔斯问题是:功利与正义的关系如何?我们能够从功利原则推出正义原则吗?因而有比功利主义更高的原则吗?研究表明经典自然选择学说和亲缘选择理论难以解释有机体的利他行为,而互惠理论提出,一个有机体付出代价帮助另一个有机体,可以在下一次受另一个有机体帮助时获益更大。这里,“互惠利他主义”是指两个有机体之间交换适合度(fitness)代价和利益的行为。以此为基础,人们建立起标准迭演囚徒困境博弈模型、修正的囚徒困境博弈模型以及厨师困境博弈模型[10],对不同情况下的利他现象作出了解释。人们常说,我们不能超越社会经济状况来考察道德问题。其实,这个问题对于我们来说,更准确地说应该是这样一个问题:我们不能越过人类的基本经济事实即人类基本行为来讨论伦理问题。那么,基本的经济事实或人类基本行为是什么呢?这就是:每一个人都是自利的(Selfinterested),即要实现自己利益最大化或最优化的“理性人”或“经济人”。现在绝大多数经济学家都承认全部经济学的出发点就是自利的经济人,它通过市场“看不见的手”的调节而有利于并不是他们想去追求的公共利益。现在我们的问题是:自利的个人之间怎样能够通过相互的交往,建立健全的伦理规范而自觉成为一个高尚的人、一个纯粹的人、一个有道德的人、一个脱离低级趣味的人和一个有益于人民的人呢?简单地说,这个问题其实就是“经济人”怎样能够变成“伦理人”的问题,在历史上首先由霍布斯以最尖锐的方式提出来,在讨论市场经济与精神文明建设时我们又千百次地遇到这个实质上的霍布斯问题。历史上有一些哲学家,如亚当•斯密、洛克、帕森斯和哈贝马斯认为,经济人是不能推出伦理人的,从而使伦理规范不得不从其它方面寻求它的出发点。亚当•斯密找到了“社会同情心”洛克找到了“人类天生的平等”,某些马克思主义者找到“公有制”和“阶级友爱”等等。所有这些,并不是霍布斯问题的解。“纳什均衡”首先对亚当•斯密的“看不见的手”的原理提出挑战[11]。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯•诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。让我们再回到上面提到的合作狩猎博弈模型,就个人而言,最优选择是什么?是逃跑还是合作呢?以A为例,如果B逃跑,A当然要选择逃跑(即方案A[1],这里A可得2分),否则他会得到0分。如果B采取合作态度,坚持战斗,则A 还是采取逃跑方针为佳。因为我逃跑此时可得10分,比坚持战争时得分6分还要大。同理B也采取了同样的方针,同样的对策。结果:A也逃跑,B也逃跑,大家只各得2分。很明显,从这个矩阵来看,如果A、B都采取合作的方针,大家都会得到6分。显然后者才是最佳的(optimal)选择方案。这就是说,从个人角度看的最优方案,从整体角度看不是最大而是比较差的方案。这就是困境Dilemma就是“悖论”(系统论将它称为“整体悖论”)。这里个人理性与整体理性发生矛盾。个人理性的结果,导致整体非理性,即支付函数值为(2,2),不是最优。而要获得整体的理性(6,6)导致个人的非理性(不是最优)的选择。这里,逃跑的方案代表A、 B 不受任何约束可以为所欲为,相当于霍布斯的自然状态。其结果是人类处于一种悲惨世界,即霍布斯所形容的贫穷、孤独、凶残、恐惧和短命的人生。当然它的得分很低,相当于这里的(2,2)。而A、B都坚持合作表示形成道德规范的状态,道德规范约束大家走向共同合作,其结果,整体利益达到最大化,即6+6&#&#,相当于一种功利主义的目标。而不采取一方逃跑一方合作的方地,则相当于不采取损人利己的“解”,即不平等不正义方案A[1]B[2]或A[2]B[1],这相当于“平等的自由”和“平等的权利”,和将别人看作是目的而不只是看作手段的原则[12]。这样,“囚犯困境”或“合作狩猎”的支付矩阵的各个值的组合便有了它的伦理意义,可以写成如下的定性形式:A[1]A[2]B[1]个人理性:自然状态或原始状态不正义的选择:权利的不平等状态B[2]不正义的选择:权利的不平等状态集体理性:功利主义和正义原则表2 合作狩猎博弈模型的定性形式现在的问题是:如何解决个人理性与集体理性的矛盾,使具有个人理性的人过渡到具有集体理性的人呢?如何从选择A[1]B[1]方案进展到A[2]B[2]的方案呢?博弈论的现代成就证明,这就是自利的个人经过重复多次的博弈的结果。这时自利的个人追求的并不是在某一次博弈中期望的得分最大,而是多次博弈中期望得分的总和为最大。1980年博弈学家罗伯特•艾克罗特利用计算机在计算二人多次博弈中,对于个人来说最优方案不是“总是不合作”而是“第一次合作,以后各次依对方的对策,一报还一报”,即这次你合作了,下次我回报以合作,上次你“逃跑”、不合作,我也回报以不合作。不过,从理论上讲,这里所谓“多次博弈”指的是“无限次博弈”。从实际上讲,无限次博弈是不可能的。但只要博弈足够地多,就会接近这个极限。在这里,个人采取这个方案,有一个摸索、学习,包括思想境界的提高的过程,一旦大家摸索到这个方针,就相当于大家在A[2]B[2]的决策上稳定下来。这样个人理性就转化为集体理性。“经济人”就变成了“伦理人”,伦理规范便因此而形成。通过多次博弈,人们通过学习,认识到必须采取基于回报的合作方针,通俗地说,这就是从合作的愿望出发,人不利我,我不利人;人若利我,我必利人。当然,人不利我,我不利人,这句话并没有利他主义的含义。但是从合作愿望出发,人若利我,我必利人,这句话就包含了互惠性的利他主义、仁爱思想的出现。没有这种互惠利他主义,个人的长远利益的实现是不可能的,社会的和平与合作是不可能的。通过多次博弈,人们的相互关系的对策在A[2]B[2] 区稳定下来,就意味着人们从追求自己的短期利益最大化的目标转变到追求长期利益最大化的目标,再转变到追求共同利益最大化的目标,这里包含了一个从手段转变为目标的过程。共同利益最大化本来是达到个人利益最大化的手段,现在手段变成目的。这就是功利主义和集体主义的产生。通过多次博弈,人们相互之间默契了不采取A[2]B[1]与A[1]B[2]的方案。这就意味着摒弃不正义的原则。这就是正义的原则和平等的人权的起源。综上所述,伦理的社会契约是通过多次博弈而产生的。多次博弈的理论模型将功利主义、仁爱主义和正义论三者统一起来,这个集体理性和伦理规范的统一起源并不是依靠外部强制,而是通过博弈过程的一系列学习和自我教育的内部过程而实现的,从而得到了霍布斯问题的解。尝试着用博弈论解读人类的社会行动或集体行动,我们将发现,不只是人类利他主义的形成,很多原本复杂的人类社会的行动是容易得到理解的。e:3�Ep;@�@�ly:&微软雅黑&,&sans-serif&;mso-ascii-font-family:Tmso-hansi-font-family:Tmso-bidi-font-family:&Times New Roman&;mso-bidi-theme-font:minor-color:mso-themecolor:text1'&的方案。这就意味着摒弃不正义的原则。这就是正义的原则和平等的人权的起源。综上所述,伦理的社会契约是通过多次博弈而产生的。多次博弈的理论模型将功利主义、仁爱主义和正义论三者统一起来,这个集体理性和伦理规范的统一起源并不是依靠外部强制,而是通过博弈过程的一系列学习和自我教育的内部过程而实现的,从而得到了霍布斯问题的解。尝试着用博弈论解读人类的社会行动或集体行动,我们将发现,不只是人类利他主义的形成,很多原本复杂的人类社会的行动是容易得到理解的。
伦理的社会契约是通过多次博弈而产生的。多次博弈的理论模型将、仁爱主义和正义论三者统一起来,这个集体理性和伦理规范的统一起源并不是依靠外部强制,而是通过博弈过程的一系列学习和的内部过程而实现的,
博弈过程的一系列学习和的内部过程而实现的,文革的数理基础
一个赞字足以
贴吧热议榜
使用签名档&&
保存至快速回贴豆丁微信公众号
君,已阅读到文档的结尾了呢~~
博弈理论在生物学当中的应用应用数学(APPLIED MATHEMATICS)是应用目的明确的数学理论和方法的总称,研究如何应用数学知识到其它范畴(尤其是科学)的数学分枝,可以说是纯数学的相反。包括微分方程、向量分析、矩阵、傅里叶变换、复变分析、数值方法、概率论、数理统计、运筹学、控制理论、组合数学、信息论等许多数学分支,也包括从各种应用领域中提出的数学问题的研究。计算数学有时也可视为应用数学的一部分。..
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
博弈理论在生物学当中的应用
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口往期回顾 &
博弈论原理及其发展
&&&&许安拓&&&&编者的话&&&&日晚,瑞典皇家科学院将本年度诺贝尔经济学奖再次授予博弈论的理论研究和实践运用者罗伊德·沙普利与埃尔文·罗斯,使得这一理论学派第六次折桂诺奖。博弈论为何如此受青睐?在其演变进程中,有何创新和发展?这个被学者称为“研究互动决策”的理论,在现实中是如何运作的?以博弈论的视角去观察现实生活中的经济、政治、社会、军事、外交等现象,会有什么不一样的发现?它可以为决策者提供怎样的应对复杂问题和治理危机的方法?博弈论思想及其研究对于实践中诸多“怎么看”和“怎么办”问题的解决不无启发。&&&&博弈论从合作博弈发展到了非合作博弈,宣告了博弈论经济学应用新时代的开端,它被诸如军事、政治、外交、制度创新等领域广泛接纳。博弈论的实际运用需要很多严格的条件限制,而对于复杂系统而言,其约束条件常常难以满足,再加上人为的主观因素和信息的不对称性,如果机械地照搬模型,在现实中可能会适得其反。&&&&博弈论的原理&&&&博弈论又被称为对策论,它本是现代数学的一个新分支,也是运筹学的一个重要组成部分。按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert&Aumann教授的说法,博弈论就是研究互动决策的理论。&&&&一般而言,博弈论的基本要素有五个:决策人,就是在博弈中率先作出决策的一方,其往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动,如博弈中先下棋或先出牌的一方;对抗者,在博弈对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的;局中人,在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人,只有两个局中人的博弈称为“两人博弈”,而多于两个局中人的博弈则称为“多人博弈”。策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,如果在一个博弈中局中人有有限个策略,则称为“有限博弈”,否则称为“无限博弈”;胜负得失,一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的胜负得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。&&&&博弈的类型基本分为四种:合作博弈,研究人们达成合作时如何分配合作得到的收益;非合作博弈,研究人们在利益相互影响的局势中如何选择决策使自己的收益最大,即策略选择问题;完全信息或不完全信息博弈,参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息,反之,则称为不完全信息博弈。静态博弈和动态博弈,研究外在条件不变或变动时博弈得失。&&&&博弈论思想发展及成果&&&&最早的博弈论思想及专著可以追溯到我国古代的《孙子兵法》,它虽然没有用数学的方法量化分析博弈各方的实力对比,但它已经清楚、全面、多视角地阐述了博弈的基本原理、过程以及可能的结果,其典型案例就是春秋时代的“田忌赛马”。直到1928年冯·诺依曼将其系统化、理论化,宣告了博弈论作为一门科学的正式诞生。1944年,冯·诺依曼和奥斯卡·摩根斯特恩共著的《博弈论与经济行为》又将两人博弈推广到多人博弈结构,并将博弈论系统应用到经济领域。他们第一次提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。&&&&合作型博弈在20世纪50年代达到了巅峰期。然而,随着时间推移,其局限性也日渐显露出来:主要是因为其理论和近乎纯数学的研究方法过于抽象,大大地限制了博弈论在现实中的应用范围,在相当长的时间里,博弈论只是少数数学家圈内的游戏,大众对博弈论的研究也知之寥寥,其影响力当然就十分有限了。&&&&直到20世纪50年代初约翰·福布斯·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性博士论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951),给出了纳什均衡的概念和均衡存在定理。可以说,正是由于“纳什均衡”的出现,才使得博弈论从合作博弈发展到了非合作博弈,并宣告了博弈论经济学应用新时代的开端。&&&&此后,博弈论在塞尔顿、哈桑尼等人的研究和推动下取得了进一步发展。到20世纪70年代,博弈论被纳入到主流经济学的教科书和研究著作之中。目前,博弈论在纳什和沙普利的研究基础上分别向两个不同方向展开:非合作博弈和合作博弈。&&&&非合作博弈强调个体理性,主要研究在信息不对称条件下市场机制如何发挥其效率,纳什均衡就是其中最重要的代表,纳什均衡描绘出博弈中这样的局面:对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。纳什证明了在每个参与者都只有有限项策略选择、并允许混合策略的前提下,纳什均衡一定存在。“纳什均衡”从本质上挑战了传统经济学的根基,他对亚当·斯密的“看不见的手”的原理提出了质疑:即按照斯密的理论,在市场经济中,每一经济人只要从利己的目的出发,最终就可以在全社会达到利他的效果。但是从“纳什均衡”中却引出了“看不见的手”原理的一个悖论:即纳什均衡不一定是帕累托最优,从利己目的出发,结果是损人不利己,既不利己也不利人。这一发现使得纳什均衡理论成为奠定现代主流博弈理论和经济理论的根本基础,正如克瑞普斯在《博弈论和经济建模》(1990)一书的引言中所说:“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……”这种非合作博弈所得出的数学解即为“纳什均衡”,它主要解决了博弈各方如何合作才能“互不吃亏”的问题,但难以解决如何才能达到彼此共赢的局面。&&&&合作博弈是在强调集体精神和团体理性的基础上,通过合作、联盟或妥协的方法,使得博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整体利益有所增加。妥协(联盟、合作)之所以能够增进妥协双方以及整体利益的关键就在于合作博弈能够产生一种合作剩余。这种剩余就是从这种妥协或联盟关系和方式中产生出来的,且以此为限。至于合作剩余在博弈各方之间如何分配,则取决于博弈各方的力量对比和技巧运用。因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。然而妥协博弈后的双方利益又将如何获得?或者说,如何在双方继续获益或至少一方不受损失的条件下延续这种联盟或妥协呢?长期以来,经济学家对求解这种多重理性常常陷入困惑之中并敬而远之。而沙普利的研究成果使得合作博弈在理论和现实运用上取得了重大突破。正是基于此,它与零和博弈相比是一种正和博弈,合作剩余的分配既是妥协的结果,又是达成妥协的条件。这种思想在解决当今国际、国内现实中存在的许多政治、经济、社会矛盾上都有着极强的理论指导意义。&&&&1952年,沙普利在解决诸多理性人的博弈决策中引入了一个“核”的概念,并将其发展为合作博弈的一般利益分配集合一种所有成员均无法提升自身效用的稳定联盟状态。由于“核”这个概念不能给出联盟内成员效用分配的唯一预测,翌年,沙普利进一步在合作博弈框架中加入了一些着眼于“公平”分配合作利益的公理。沙普利首先对“公平”、“合理”等概念给予了严格的公理化描述,然后寻求是否有满足人们想要的那些公理的解。当然,如果对一个解的性质或公理要求太多,则这样的解可能不存在;另一方面,如果这些性质或公理要求得少,则又可能有许多解,即解存在但不唯一。&&&&他证明在这些公理的约束下,存在唯一的效用分配方案,这就是沙普利值。沙普利值是根据各人给联盟带来的增值来分配,在直观上是所有边际贡献的平均值。沙普利值计算方法简单,而且能得到合作博弈的唯一解,使用较为广泛。到目前为止这个解仍然是合作博弈领域内最重要的结果之一。不仅如此,沙普利的工作具有方法论上的重要意义,他的公理化方法使我们可以研究讨论合作博弈中其他各种各样的解。&&&&沙普利本人正是该技术最好的应用者。他与舒比克发表了一篇著名的论文《委员会制度下的权利分配评价方法》,后来称之为沙普利—舒比克权力指数。当时他们将沙普利值引入投票机制,评价了委员会制度的权力分配体系。目前,这一指数已广泛地应用于公司金融领域,反映了股权对公司决策的影响力,能够客观地度量某股东或某些股东对股份制公司的控制力。&&&&传统经济学中,通过价格调整可以实现供需平衡。然而,在一些特殊市场中,价格不能用作配置资源的手段,资源只能以分配或配给方式加以配置。这就为合作博弈提供了广阔的空间,当今世界由于在解决各类资源共享问题上冲突不断,合作博弈以其独特的配置方法解决了一系列资源共享中的匹配难题而在经济学中的地位与日俱增。尤其是在解决具体微观问题的配置方法上旨在寻找稳定解,即保证每一个配对都是稳定的,在匹配市场上没有剩下彼此愿意与对方组对,但却没有被市场允许的一对人,同时,已组对的人对自己的队友应该是满意的。这不仅形成了基于经典博弈的研究范式体系,扩展了传统经济学研究问题的范围,改变了传统经济学的体系和结构,冲击了传统主流经济学的许多观点,还拓展和加强了经济学与其他社会科学、自然科学的联系。尤其在现实运用中更是随处可见。&&&&博弈论的现实运用&&&&博弈论自1994年授予纳什均衡理论以来,至今已有6次获诺贝尔经济学奖。它深刻地改变了经济学项下各子学课的内容和研究方法,同时在经济学领域外的政治学(国内以及国际)、军事战略学、进化生物学以及计算机科学等领域都已成为重要的研究和分析工具。不仅如此,它还与会计学、统计学、社会心理学以及诸如认识论、伦理学等哲学分支有着重要的联系,尤其在局部简单的资源配置实践上常常能达到甚佳的效果。例如,2012年的诺贝尔经济学得主之一—罗斯的“全国住院医生配对程序”就是一个将沙普利的博弈理论应用于医学院毕业生分配到医院的住院实习医师系统的较好的现实案例。他确定了这个系统可以形成“稳定匹配”;他还帮助重新设计了现存的器官捐赠者和接受者之间进行配对的一些制度,极大地优化了资源配置,尽可能拯救了更多的生命。这些案例对当今我国解决一些现实的局部矛盾如初高中学生择校难、制度腐败、工资协商等问题都有积极的理论指导和借鉴意义。&&&&十八大报告中,我党提出的“五位一体”的治国理念涵盖了生态文明建设。我们就可以运用博弈论的基本原理来治理生态污染:当前各地环境污染严重,政府监管乏力,企业为了追求利益的最大化,宁愿以牺牲环境为代价,也不愿主动增加环保设备投资。如果按照传统的经济学理论:所有企业都从利己的目的出发,采取不顾环境的策略,就可进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这就是一个“看不见的手的有效的完全竞争机制”失败的例证。直到现在,这种遍地污染的局面仍然未见改善。因此,我们可以应用博弈论的基本原理,强化政府监管,加大污染管制,大幅提高污染企业的交易成本,唯此,这些企业才会采取低污染的策略组合。认识到合作博弈的重要性,积极采取治理污染的措施,可获得与高污染同样的利润,但环境将会变得更好。&&&&我们也可以用博弈论来理解当前国际关系中的一些争端。日,日本政府不顾中方多次反对,与所谓的土地所有者签订“购岛”合同,企图用偷梁换柱的方式窃取钓鱼岛,随即钓鱼岛争端恶化成了危机,博弈各方都相继登场。从表面上看,钓鱼岛争端可以简单地视为中日之间的“两人博弈”,但将其置于整个国际大背景下,即呈现出一种有限、动态的非合作博弈,其复杂程度绝非可以用一个模型或是某种算法所能解释清楚的。说它是有限博弈,是指其局中人的策略有限,即无外乎战、和、抗三种状态;说其动态,因为各方的国内国际政治、经济、社会生态都处在不断变动之中,而这些变量的不同走势都会直接影响到岛争的结局;说它非合作,是指各方在博弈中都希望获取自身收益的最大,其策略选择呈现出非合作性;最后是复杂的“多人博弈”,从最少的中日双方,到中日美台四方,再到更大范围内的俄罗斯、欧盟、南亚、中东等诸多的直接或间接利益相关者,他们也都会借此中日岛争涉入局中以博得自身利益的最大化或至少分得由此产生的“汤羹”。在如此复杂多变而且信息又不对称的博弈中只能从博弈的基本理论和思想出发,精算推理出一个大致的结果,绝不可能用静态的模型或是数学的方法得出一个多赢的局面。&&&&日本政府鉴于多次在钓鱼岛问题博弈上将中方以“和为贵”及“睦邻富邻安邻”的和平外交政策为软弱可欺,首先用“购岛”的方法选择了“单方对抗”,它希望通过“试应手”(围棋博弈术语)的方法让中方选择忍辱负重式地“单方合作”,那日本单方收益将大胜,中方大负;没想到日方误判形势,低估了中方捍卫国家领土的决心,随即中方也被迫选择“对抗”的方式以抵减“受骗支付”的损失,中方的选择要让日方意识到在反复博弈中只有选择“合作博弈”的方式才能最终让双方脱离困境。因此,日方必须清醒地认识到,只有从大局出发,承认争议、回到谈判合作的道路上来才是双赢的博弈结局。它也生动地说明了:在非零和博弈中,帕累托最优和纳什均衡是相冲突的。&&&&但是我们也应该看到,博弈论的实际运用需要很多严格的条件限制,而对于复杂系统而言,其约束条件常常难以满足,再加上人为的主观因素和信息的不对称性,如果机械地照搬模型,在现实中可能会适得其反。虽然我们不能将复杂现实情况的博弈完全基于数理模型之上,但其对微观事物的决策动机、博弈参与者变量之间的相互作用及其演变过程的推理分析都有极强的现实运用价值,在这方面与传统经济学研究的方法论、思维范式以及决策统筹的现实运用相比,突破了零和博弈的局限,尤其是在双赢或多赢博弈结果的达成与分析上,更能迎合当今国际、国内经济和社会发展以及战略对抗的潮流。&&&&(作者为财政部财政科学研究所研究员、研究生部教授)
<INPUT type=checkbox value=0 name=titlecheckbox sourceid="SourcePh" style="display:none">

我要回帖

更多关于 python 博弈论模型 的文章

 

随机推荐