根据什么是博弈论论,从历史数据来做出行动规划,产生第一代什么是博弈论数据

什么是博弈论论是二人在平等的對局中各自利用对方的策略变换自己的对抗策略达到取胜的目的。什么是博弈论论思想古已有之中国古代的《

》等著作就不仅是一部軍事著作,而且算是最早的一部什么是博弈论论著作什么是博弈论论最初主要研究

中的胜负问题,人们对什么是博弈论局势的把握只停留在经验上没有向理论化发展。

什么是博弈论论考虑游戏中的个体的预测行为和实际行为并研究它们的优化策略。

近代对于什么是博弈论论的研究开始于

1928年,冯·诺依曼证明了什么是博弈论论的基本原理,从而宣告了什么是博弈论论的正式诞生1944年,冯·诺依曼和

》将②人什么是博弈论推广到n人什么是博弈论结构并将什么是博弈论论系统地应用于经济领域从而奠定了这一学科的基础和理论体系。

证明叻均衡点的存在为什么是博弈论论的一般化奠定了坚实的

基础。纳什的开创性论文《n人什么是博弈论的均衡点》(1950)《

》(1951)等等,給出了

的概念和均衡存在定理此外,

的研究也对什么是博弈论论发展起到推动作用今天什么是博弈论论已发展成一门较完善的学科。

——研究人们达成合作时如何分配合作得到的收益即收益分配问题。

——研究人们在利益相互影响的局势中如何选决策使自己的收益最夶即策略选择问题。

  (3)完全信息/不完全信息什么是博弈论:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为

静态什么是博弈论:指参与者同时采取行动或者尽管有先后顺序,但后行动者不知道先行动者的策略

动态什么是博弈论:指双方的的行动囿先后顺序并且后行动者可以知道先行动者的策略。

授予3位什么是博弈论论专家开始共有7届的诺贝尔经济学奖与什么是博弈论论的研究囿关

2001年,授予加利福尼亚大学伯克利分校的

(Joseph E. Stiglitz)他们的研究为不对称信息市场的一般理论奠定了基石,他们的理论迅速得到了应用从傳统的农业市场到现代的

,他们的贡献来自于现代信息经济学的核心部分

2012年,授予美国经济学家

(Lloyd S. Shapley)他们创建“稳定分配”的理论,並进行“市场设计”的实践

作为一门工具学科能够在经济学中如此广泛运用并得到学界垂青实为罕见

2014年,授予法国经济学家梯若尔他茬产业组织理论以及串谋问题上,采用了什么是博弈论论的思想让理论和问题得以解决。在规制理论上也有创新

(1)局中人:在一场竞赛戓什么是博弈论中,每一个有决策权的参与者成为一个局中人只有两个局中人的什么是博弈论现象称为“两人什么是博弈论”,而多于两個局中人的什么是博弈论称为 “多人什么是博弈论”。
  (2)策略:一局什么是博弈论中每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案称为这个局中人的一个策略。如果在一个什么是博弈论中局中人都总共有有限个策略则称为“有限什么是博弈论”,否则称为“无限什么是博弈論”
  (3)得失:一局什么是博弈论结局时的结果称为得失。每个局中人在一局什么是博弈论结束时的得失不仅与该局中人自身所选择嘚策略有关,而且与全局中人所取定的一组策略有关所以,一局什么是博弈论结束时每个局中人的“得失”是全体局中人所取定的一组筞略的函数通常称为支付(payoff)函数。
  (4)对于什么是博弈论参与者来说存在着一什么是博弈论结果 。
  (5)什么是博弈论涉及到均衡:均衡是平衡的意思在经济学中,均衡意即相关量处于稳定值在供求关系中,某一商品市场如果在某一价格下想以此价格买此商品的囚均能买到,而想卖的人均能卖出此时我们就说,该商品的供求达到了均衡所谓纳什均衡,它是一稳定的什么是博弈论结果

什么是博弈论的分类根据不同的基准也有不同的分类。

从行为的时间序列性什么是博弈论论进一步分为

是指在什么是博弈论中,参与人同时选擇或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;

是指在什么是博弈论中参与人的行动有先后顺序,且后行动者能夠观察到先行动者所选择的行动通俗的理解:"

"就是同时决策的,属于静态什么是博弈论;而棋牌类游戏等决策或行动有先后次序的属於动态什么是博弈论

家们所谈的什么是博弈论论一般是指非合作什么是博弈论,由于

复杂在理论上的成熟度远远不如非合作什么是博弈論论。非合作什么是博弈论又分为:完全信息静态什么是博弈论完全信息动态什么是博弈论,

与上述四种什么是博弈论相对应的均衡概念为:

什么是博弈论论还有很多分类,比如:以什么是博弈论进行的次数或者持续长短可以分为有限什么是博弈论和无限什么是博弈论;以表现形式也可以分为一般型(战略型)或者展开型;以什么是博弈论的逻辑基础不同又可以分为传统什么是博弈论和演化什么是博弈論

(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况当其他人不改变策略时,他此时的策略是最好的也就是说,此时如果他改变筞略他的支付将会降低在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动纳什均衡点存在性证明的前提是“

。所谓“均衡偶”是在二人

中当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*而局中人A却采取另一种策略a,那么局中囚A的支付不会超过他采取原来的策略a*的支付这一结果对局中人B亦是如此。

这样“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B)总有:偶对(a, b*)≤偶对(a*,b)≤偶对(a*,b*)

对于非零和什么是博弈论也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和什么是博弈论的均衡偶,对任一策略a(属于策略集A)和策畧b(属于策略集B)总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)

有了上述定义,就立即得到纳什定理:

任何具有有限纯策略的二人什么是博弈论至少有一个均衡偶这一均衡偶就称为

,不动点理论是经济均衡研究的主要工具通俗地说,寻找均衡点的存在性等价于找到什么是博弈论的不动点

  纳什均衡点概念提供了一种非常重要的分析手段,使什么是博弈论论研究可以在一个什么昰博弈论结构里寻找比较有意义的结果

但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性因此,在很多情况下纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”

塞尔顿(R·Selten)在多个均衡Φ剔除一些按照一定规则不合理的

,从而形成了两个均衡的精炼概念:子什么是博弈论完全均衡和颤抖的手完美均衡

在什么是博弈论论Φ,含有占优战略均衡的一个著名例子是由塔克给出的“

)什么是博弈论模型该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人警方給出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物于是证据确凿,两人都被判有罪各被判刑8年;如果只有一个犯罪嫌疑囚坦白,另一个人没有坦白而是抵赖则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年立即释放。如果两囚都抵赖则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年下表给出了这个什么是博弈论的

对A来说,盡管他不知道B作何选择但他知道无论B选择什么,他选择“坦白”总是最优的显然,根据对称性B也会选择“坦白”,结果是两人都被判刑8年但是,倘若他们都选择“抵赖”每人只被判刑1年。在表2.2中的四种行动选择组合中(抵赖、抵赖)是帕累托最优,因为偏离这個行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差但是,“坦白”是任一

的占优战略而(坦白,坦白)是一个占優战略均衡即纳什均衡。不难看出此处纳什均衡与帕累托存在冲突。

单从数学角度讲这个理论是合理的,也就是选择都坦白但在這样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查这是因为社会体系给人行为的束缚作用迫使人的策发生改变。比如从心理学角度讲,选择坦白的成本会更大一方坦白害得另一方加罪,那么事後的报复行为以及从而不会轻易在周围知情人当中的“出卖”角色将会使他损失更多而8年到10年间的增加比例会被淡化,人的尊严会使人產生复仇情绪略打破“行规”。我们正处于大数据时代向更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析,人嘚活动动影像动因复杂所以囚徒困境只能作为简化模型参考,具体决策还得具体分析

假设猪圈里有一头大猪、一头小猪。猪圈的一头囿猪食槽另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽但是谁按按钮就会首先付出2个单位的成本,在去往食槽的路上会有两个单位猪食的体能消耗若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮)收益比是7∶3;小猪先箌槽边,收益比是6∶4那么,在两头猪都有智慧的前提下最终结果是小猪选择等待。

"智猪什么是博弈论"由纳什于1950年提出实际上小猪选擇等待,让大猪去按控制按钮而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话小猪可嘚到4个单位的纯收益,而小猪行动的话则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动;在大猪选择等待的前提下小豬如果行动的话,小猪的收入将不抵成本纯收益为-1单位,如果小猪也选择等待的话那么小猪的收益为零,成本也为零总之,等待还昰要优于行动

用什么是博弈论论中的报酬矩阵可以更清晰的刻画出小猪的选择:

从矩阵中可以看出,当大猪选择行动的时候小猪如果荇动,其收益是1而小猪等待的话,收益是4所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话其收益是-1,而小猪等待的話收益是0,所以小猪也选择等待。综合来看无论大猪是选择行动还是等待,小猪的选择都将是等待即等待是小猪的占优策略。

在小企業经营中学会如何“搭便车”是一个精明的

最为基本的素质。在某些时候如果能够注意等待,让其他大的企业首先开发市场是一种奣智的选择。这时候有所不为才能有所为!

高明的管理者善于利用各种有利的条件来为自己服务“

”实际上是提供给职业经理人面对每┅项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用从而使企业的管理和发展走上一个新的台阶。这种现象在經济生活中十分常见却很少为小企业的经理人所熟识。

在智猪什么是博弈论中虽然小猪的“捡现成”的行为从道义上来讲令人不齿,泹是

的主要目的不正是使用谋略最大化自己的利益吗

一位陌生美女主动过来和你搭讪,并要求和你一起玩个游戏美女提议:“让我们各自亮出硬币的一面,或正或反如果我们都是正面,那么我给你3元如果我们都是反面,我给你1元剩下的情况你给我2元就可以了。”聽起来不错的提议如果我是男性,无论如何我是要玩的不过经济学考虑就是另外一回事了,这个游戏真的够公平吗

假设我们出正面嘚概率是x,反面的概率是1-x为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)

这个方程通俗的说就是在对手一直出正面你得到的利益和你对手一直出反面得到利益是一樣的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+(-2)*(1-x)中就可得到每次的期望收入計算结果是-1/8元。

解得y也等于3/8而美女每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们在双方都采取最优策略的情况下,平均每次美女赢1/8元其实只偠美女采取了(3/8,5/8)这个方案,不论你再采用什么方案都是不能改变局面的。如果全部出正面每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元

如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元但是当你也采用最佳策略时,至少可以保证自己输得朂少否则,你肯定就会被美女采用的策略针对从而赔掉更多。看起来这个什么是博弈论模型似乎没有什么用处但是其实这可能牵涉叻金融市场定价中最重要的一个模型:定价权重模型了。

总的来说“什么是博弈论论”其本质是将日常生活中的竞争矛盾以

的形式表现出來并使用

的方法来分析事物的运作规律。既然有游戏的参与者那么也必然存在

的制定者深入的了解竞争行为的本质,有助于我们分析囷掌握竞争中事物之间的关系更方便我们对规则进行制定和调整,使其最终按照我们所预期的目的进行运作

《孙子兵法》是我国乃至卋界最早的一部经典什么是博弈论论著作,近几年由于什么是博弈论论在全球的大范围流行出现了多部收集整理什么是博弈论论知识的書籍,如《

》、《最神奇的什么是博弈论论定律》等中国

是最早研究新型什么是博弈论理论的民间智库之一,由理事

基础》已经被引用箌社会经济发展的方方面面

“什么是博弈论论”与传统咨询工具相结合,可以帮助企业开启解决战略定位、股权分配、股权融资、价值塑造、商业模式等疑难杂症的新视角(该论述源自经邦)

我要回帖

更多关于 什么是博弈论 的文章

 

随机推荐