火星首页> 软件理念>当前正文

博弈论

作者:火星哥      2016-01-08 15:42:35     来源:火星彩票网

关于博弈论,也有一个有趣的问题,这个问题可以归结为数学问题、哲学问题、心理学问题。实际上,你也可以称之为运筹学问题,策略问题,当然也可以称之为博弈问题。不过数学上,或者书本中,都会称之为:“囚徒困境”。

两个共谋犯罪的人(用A、B来代表)被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。

警方通常情况下,将犯罪分子分开来审讯,都是由这个原理而来。事实上,如果是任何一个罪犯,假如智商足够高,或者有足够好的战略专家指导,一定会按照互相揭发去做的。我们来看看数学的解释,这是一个两位囚徒的博弈支付矩阵:

 

囚徒困境博弈(Prisoner’s dilemma

AB

坦白

抵赖

坦白

88

010

抵赖

100

11

 

对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。

pic_01.png

再简单一些来讲,如果A和B的坦白、抵赖概率都是50%,那么对A来说,坦白的数学期望是:8*50% + 0 * 50% = 4 年,而抵赖的数学期望是:10*50% + 1*50% = 5.5年。对于B来讲也是一样的期望值。所以A和B的受罚程度完全取决于其二者的相互信任程度。注意,是相互信任程度。假如每个人对自己的伙伴的信任度都比较高,只要高到满足 8.0x = 11(1-x) ,解得57.9%的程度,就能够全都抵赖,达到1,1的最佳选择了。可见,伙伴之间的信任程度是多么重要啊。

这是博弈论最经典的应用,当然,还有一个小例子,对于大多数普通人而言可能都会有些帮助。俗话说,买的不如卖的精。数学中有很多有意思的模型,被很多商人利用来做买卖,业绩相当不俗。下面来看一个美女的圈套是如何应用博弈原理的:

一位陌生美女主动过来和你搭讪,并要求和你一起玩个游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”听起来不错的提议。如果我是男性,无论如何我是要玩的,不过经济学考虑就是另外一回事了,这个游戏真的够公平吗?

 

美女与硬币(The Beauty And The Coins

 

绅士 ,美女

正面

反面

正面

3-3

-22

反面

-22

1-1

 

综合考证以上案例,您可以先开动脑筋认真想一想,从博弈论的角度,这个游戏并非那么简单公平。稍后我们会给出我们的见解,欢迎来信与我们进行讨论。



分享到:
最少输入3个字 回复

你可能感兴趣的文章更多