什么是纳什均衡理论?

2024-05-01 18:36

1. 什么是纳什均衡理论?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。
当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。

扩展资料;
纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。
要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。
所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。
混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。
当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。
因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。
然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。
参考资料来源;百度百科——纳什平衡

什么是纳什均衡理论?

2. “纳什均衡理论”怎么理解?


3. 纳什均衡理论

博弈论
  
  
 博弈论是数学的一个分支,也是经济学的分析工具之一。它的基本假定是:人是理性的(或者说自私的),他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。在这里我主要讲经济学家纳什的博弈论观点,
  
 我主要讲两个板块,第一个板块介绍下诺贝尔经济学奖获得者纳什,著名的经济学家,纳什均衡的提出者。1928年出生,儿时的纳什是一个性格孤僻,成天着迷于做各种实验的孩子。上大学期间,经常旷课,充满与众不同的自信与自负。1948年凭着推荐信中一句“这个学生是个天才”,纳什来到了普林斯顿大学。当时人们对纳什的评价是:“天空都不足以容纳他的独立性”。那一年他还不到20岁。"纳什均衡”是他22岁博士毕业的论文,也奠定了数十年后他获得诺贝尔经济学奖的基础。不过到1958年,30岁的他疯了,患上严重的精神分裂症。我在想名人是不是都这样?直到上世纪80年代末才康复。于1994年获得了早就应该属于他的诺贝尔经济学奖。2015年,纳什和他的妻子因车祸去世。值得大家关注的是,在纳什疯了的期间,普林斯顿大学容纳了他,并没有把他赶出校园。我想他要是在中国的话,早就被送到精神病医院里去了。顺便说下,稷山县的精神病医院在晋东南地区知名度还是挺高的,如果去稷山走高速,下高速的出口处,立着一块大大的牌子,上面写着:稷山精神病医院欢迎您!这是稷山县的标志之一!
  
 以纳什为题材的电影《美丽心灵》,2001年上映,拍的非常好,完美的展现了纳什的生活历程。还有一部名字类似风格内容迥异的影片《美丽人生》,描写在德国纳粹统治期间,一位犹太父亲是如何想法设法保护孩子的!也值得大家一看!
  
 第二个板块我主要讲纳什均衡的两个案例:囚徒困境和智猪博弈。
  
 囚徒困境:假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
  
 对于两人而言最佳的选择应该是两人都抵赖,这样各判一年。所以监狱或者审讯室里的标语:坦白从宽,抗拒从严是错误的。实际上是:坦白从严,抗拒从宽。这是个帕累托最优的问题。但是这里有个问题,就是人性是最经不起考验的,分开审讯的目的就在这。所以两个人都抵赖在日常生活中基本是不可能的。所以对于A而言,不管B做出什么样的选择,坦白是他最好的结果。这就是一个博弈的过程。
  
 纳什的理论”对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,一定会导致集体利益的最大化。但是我们可以从纳什的理论中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。 
  
 第二个案例是智猪博弈。在一个猪圈里,有一大一小两头猪,猪圈里一边是猪食槽,上边有一个漏食的口。另一边是开关,只有按动开关,漏食口打开,掉下一些食物。时间一久两头猪就会发现,每次小猪按动开关的时候,等它气喘吁吁的跑到另一边的时候,大猪已经把食物吃完了。每次大猪去按动开关的时候,等大猪跑到另一边的时候,小猪还没有把食物吃完,大猪还能吃上一点。而且只有隔一段时间按动开关才有食物。经过这样一段时间的反复博弈后,小猪就会放弃去主动按开关,因为每次按开关都吃不上食物。最后只有大猪去按开关,大猪按开关,两只猪都能吃上一部分,维持生存,否则两只猪都要饿死!这就是典型的搭便车现象。
  
 等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人。 还有在教室里我们把学生分成小组,打扫卫生为例,总有个别学生不参与打扫,其它学生把活干了!
  
 如何解决这些问题?智猪博弈中的解决办法是减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 成本不高,但收获最大。教室里面很多老师的做法,班级事务具体化到每一位学生身上,然后加以监督,这样就能很好的解决这问题!

纳什均衡理论

4. 什么事纳什均衡理论


5. 纳什平衡理论具体是什么?

纳什平衡,在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。

扩展资料:
纳什平衡的命名来由为美国数学家小约翰·富比士·纳什。该概念的其中一个版本已知最早于1838年被安托万·奥古斯丁·库尔诺运用于他的寡占理论中。在库尔诺的理论中,商行们需选择合适的产量以获得最大利润,然而一家商行的理想产量取决于其他商行的产量。
当每一家商行的理想产量都需要根据已知其他商行的产量来做出调整,以达到最大利润时,一种纯策略的纳什平衡——库尔诺平衡就形成了。在分析平衡稳定性的过程中,库尔诺还提出了最适反应动态(或最佳反应动态)的概念。然而纳什对平衡的定义比库尔诺的更为广泛,也比帕勒托效率平衡的定义更为广泛,因为纳什的定义没有针对“形成哪种平衡最为理想”作出评判。
参考资料来源:百度百科 纳什平衡

纳什平衡理论具体是什么?

6. 什么是纳什均衡

纳什均衡的思想是,当参与者选定的策略组成纳什均衡后,就会形成一个平衡的局面。
在这个平衡的局面中,任何一个剧中人单方面地改变自己的策略,只能是自己的收益下降(或不变),绝不可能使自己的收益增加。这样,在纳什均衡下构成的这种局势让每个参与人都不敢轻举妄动,因而形成了这个平衡。

纳什均衡并不是为了集体的利益最大化,而是为了个人的利益最大化。所以在为了个人利益最大化的同时,一定会损耗集体的利益。因此纳什均衡点不一定(大多情况下都不是)是集体利益最大化点。


举个经典的例子:囚徒困境,两个囚犯抓起来之后,分别单独审问,如果都承认罪行就都判刑7年,都不承认就判刑2年,如果一个承认一个不承认,不承认的判刑10年,承认的由于表现良好所以直接宽大释放。

这个例子中很明显,如果大家都不承认是最好的结果(可以算是整体利益最大的结果),都承认是最坏的结果,但是这个最坏的结果却是纳什均衡的结果。为什么呢?

是因为在纳什均衡下,他们都承认都获刑7年,但是如果有一方选择不承认,他就有获刑10年的可能性,所以他们都不愿意冒这个风险,宁愿获刑7年,最终形成了这个纳什均衡。

我只是浅显的说了一下纳什均衡的道理,如果想了解的更深刻,比如纳什均衡点的分类、公式什么的最好还是系统的学习一下《博弈论》这门学科比较好。

7. 什么是纳什均衡

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。   
纳什的主要学术贡献体现在1950年和1951年的两篇论文,1950年他才把自己的研究成果写成题为“非合作博弈”的文章刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低,嘲笑几天之后,他遇到盖尔,像说梦话似的告诉他自己已经将冯·诺依曼的“最小最大原理找到了普遍化的方法和均衡点。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从没想到学术欺骗的后果。结果还是戴维·盖尔充当了他的“经纪人”,起草致科学院的短信,系主任列夫谢茨则利用方便的人脉关系亲自将文稿递交给科学院。纳什写的文章不多,他辩解说:少了才是精品。中国国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。 
1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。   
Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。以两家公司的价格大战为例,Nash平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。
假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的  纳什均衡
最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。   
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。

什么是纳什均衡

8. 什么叫纳什均衡

汗。。。你不是都知道的么。。。要不我给你讲下“囚徒困境”? 请参照我给的图
AB两人一起犯罪后被抓,但警察没有足够证据,于是把他们分别审问,并且给他们两条路。如果两人都沉默就只要每人一年蹲1年监狱,如果A选择沉默而B坦白了,那么A要蹲20年而B可以释放。。。
因为两个人无法交流,所以不知道对方会选什么,如果你是A,你会考虑其他人的决定,假设B坦白,那么自己当然坦白比较好(8年监狱),假设B沉默,自己还是坦白比较好(自由)。综上所述A就是选择坦白。而如果你是B,同理得“坦白”。所以最后两人都坦白,即达到了“纳什均衡”
好了,看在我打了这么多字和画了图的份上可以采纳了吧~

最新文章
热门文章
推荐阅读