TreeMind树图在线AI思维导图

博弈论思维导图

  收藏
  分享
免费下载
免费使用文件
U459666368 浏览量:782024-06-21 14:01:19
已被使用10次
查看详情博弈论思维导图

博弈论内容介绍

树图思维导图提供 博弈论 在线思维导图免费制作,点击“编辑”按钮,可对 博弈论  进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:ac4830980c65e9c928701ef2838b1fae

思维导图大纲

博弈论思维导图模板大纲

基本概念

发展历史

早期研究

1713年Waldegrave提出两人博弈的极小化极大混合策略

1838年Cournot从产量决策分析的双寡头竞争模型

1883年Bertrand从价格决策分析的双寡头竞争模型

创立的标志

1944年冯诺依曼和摩根斯坦的《博弈论与经济行为》

创立了博弈论研究的基本概念

二人零和博弈的完全解决

合作博弈

非合作博弈论理论的创立

1950年约翰纳什的《非合作博弈》

提出了纳什均衡的概念

不完全信息博弈理论

Harsanyi和Selten

组成要素

参与人

规则

信息

行动

策略

收益函数

结果

均衡

所有参与人的策略组合

定义

在一定的游戏规则约束下,基于直接互相作用的环境条件,各参与人依据掌握的信息,选择各自的策略,以实现利益最大化

基本假设

理性假设

认知理性

对两个事物的比较具有完备性和传递性

行为理性

如果A比B好那就选择A

人需要的不是便宜而是占便宜

共同知识假设

永不完成的任务

黑脸之谜

分类

按参与人之间的关系

合作博弈

非合作博弈

按参与人的先后行动顺序

静态博弈

动态博弈

按参与人对其它参与人的知识

完全信息博弈

不完全信息博弈

结合

完全信息静态博弈

纳什均衡

完全信息动态博弈

子博弈精炼纳什均衡

不完全信息静态博弈

贝叶斯纳什均衡

不完全信息动态博弈

精炼贝叶斯纳什均衡

完全信息静态博弈

纳什均衡:指一种策略组合,在此组合下,没有人有意愿独自改变他的策略

在任何有限博弈中,都至少存在一个纳什均衡

囚徒困境:个人最优策略不是整体最优策略

两个寡头企业产量的博弈

兴办公用事业

军备竞赛

智猪博弈:多劳者不多得

公司里的大小股东

股市上的庄家、散户

市场上的大小企业

性别战

斗鸡博弈

抢地盘

夫妻矛盾

市场进入阻挠

谢林点:在多重纳什均衡中最可能出现的均衡

获胜的准则是和多数人的选择一样

在相近人群中更容易形成

谢林点不明晰的情况下通过中间人来协调各自的预期

强化谢林点:做广告

完全信息动态博弈

子博弈精炼纳什均衡

博弈的标准型表述

三要素

参与人

策略

支付函数

用矩阵表示

博弈的扩展型表述

五要素

参与人

每个参与人选择行动的时间点

每个参与人在每次行动时可以选择的行动集合

每个参与人在每次行动时对手过去行动选择的信息

支付函数

用博弈树表示

纯策略纳什均衡和混合策略纳什均衡

石头剪刀布

猎鹿博弈

纳什均衡的三个问题

一个博弈有可能有多个纳什均衡

静态博弈下把其他人的策略当做固定的

允许了不可置信威胁的存在

子博弈:从每个行动选择开始至博弈结束构成的博弈

家庭生活

精炼纳什均衡:当且只当参与人的战略在每一个子博弈中都构成纳什均衡

不可置信威胁

断绝父女关系

不包含不可置信威胁的纳什均衡才是精炼纳什均衡

承诺行动:当事人使自己的威胁变得可置信

当事人不实行这种威胁时会带来更大的损失

会改变均衡结果

承诺行动的成本越高,威胁就越可置信

破釜沉舟

万元陷阱

重复博弈

特征

前一次博弈不改变后一次博弈的结构(游戏规则完全一样)

所有人能观测到历史结果

所有人的收益为每阶段收益的和

常见策略

雷锋:无论对方是否合作,我方都合作

曹操:无论对方是否背叛,我方都背叛

冷酷:当对方背叛之后永远背叛,无论对方是否恢复合作

贴现因子的影响

卖假烟

心太软:只要对方不连续多次背叛,都选择合作

一报还一报:第一次合作,之后模仿对方上一次的动作

噪音处理

特点

可激怒的(防背叛)

宽容的(给对方改正的机会)

清晰的(容易被对方识别出)

善良的

人鬼:观察对方总体行为,如果对方大部分会合作,那么选择合作,反之选择背叛

欺软怕硬:先背叛试探对方反应。如果对方是雷锋就一直占便宜;如果对方报复,下次就合作

镇定者:先建立合作关系,然后再想办法占便宜

醉汉:无论对方是否合作,我都随便出

不完全信息静态博弈

贝叶斯纳什均衡

不完全信息动态博弈

精炼贝叶斯均衡

经典基本模型

囚徒困境

智猪博弈

枪手博弈

斗鸡博弈

鹰鸽博弈

蜈蚣博弈

五名海盗

猎鹿博弈

酒吧博弈

人质困境

多人囚徒困境

最后通牒

博弈中,人会最求利益之外的价值

讨价还价

x* = (1-δ2)(1-δ1δ2)

手表定律

帕累托最优

需要同时满足三个条件

交换最优

生产最优

产品混合最优

帕累托改进:在没有人利益受损的情况下让有些人获得更大利益

帕累托最优就是再也找不到任何帕累托改进的状态,是一种资源最优化配置的状态

分蛋糕

帕累托最优并非总体最优

卡尔多-希克斯改进:对于集体来说部分收益、部分受损,收益大于受损,总体福利提升,受益者给受损者一定补偿

国家层面的改革

现实不如表面那么美好

人性问题

价值选择问题

火车问题

如何量化受损和收益

相关思维导图模板

博弈论思维导图思维导图

树图思维导图提供 博弈论思维导图 在线思维导图免费制作,点击“编辑”按钮,可对 博弈论思维导图  进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:b47567af9d988f3f14d48dd514355caa

《博弈论》读书笔记思维导图

树图思维导图提供 《博弈论》读书笔记 在线思维导图免费制作,点击“编辑”按钮,可对 《博弈论》读书笔记  进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:9bdaa1105fcd84db7f0c563a59160b07