本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 % _& y) a$ K1 K6 @4 J+ u: \+ G
4 p/ W9 ^; M1 k1 ]
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 R9 M4 t( Y' s0 m6 Y 以下三个定义:
1 _* n; Y1 o; X2 S1 k7 v 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 `' x5 S5 u) d5 }4 T" }8 W/ ` 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
2 O; q( K* c* u/ y' E# N) H4 Y 所谓的双方优势策略则是指双方利益总和最大的策略。 3 M( w$ p8 j8 M2 Y: q0 x4 j
[编辑本段]严格优势策略举例分析+ B" M5 |9 m/ f$ j
一、经典的囚徒困境 $ S/ d8 @$ M( P, N9 }: y; Z- U+ U
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 ^* @* b, i) ~/ q* z+ Q! M3 T 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & @2 D8 b) c, l
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 I& I7 v8 w# t/ L4 I$ _
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
! T, }" W4 ]" c/ ?+ z/ K 若二人都互相检举(互相“背叛”),则二人同样判监2年。
s* x* F, L9 ~' q# T. m/ A* z 7 j2 N2 h7 z2 _/ K/ Z( B K4 J8 `
用表格概述如下:
! I4 {: F+ U2 e, n% I* X+ S6 I2 f
' i! R+ W6 b# @! C- I 甲沉默(合作) 甲认罪(背叛)
' [! k# w/ p Y3 P# K. h乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 $ j% A, h; a f2 Q# ^
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
+ P) d' E5 f7 U; {$ Q- F; c, s3 _; G$ u" f
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' o' j) z% W1 c( V& H3 W 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
: o" g* H9 l! e 若对方沉默、背叛会让我获释,所以会选择背叛。 ' m' |" r! B7 h
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 1 y: O; t4 w/ B0 s
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % {/ o$ ^0 M$ [8 o$ b; }9 U
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 m: W+ `" }+ v6 x
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。1 E- q8 f, A+ N7 e" g7 H
[编辑本段]二、智猪博弈理论5 Q) l) |$ W( N
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & ?4 j3 E) ?% @$ J" x# x T
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: V0 v! l% h6 o' @9 C$ C 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. X* K9 c2 l( c 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / R2 V8 h# }2 K# s
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
5 c- h, n) R( c) h2 J t# k 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " m/ d' J2 U0 g7 \4 s0 r
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ n; M6 @* x# h% h8 r
& L" R3 J* P5 J$ v$ s3 i/ F三、关于企业价格策略
6 F+ O B1 a/ T3 ?' Z' b. s j. P$ ]! ^* r2 x2 p
$ B+ S" s$ }7 `4 f 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 e: L( m/ I/ D$ i: V' L/ E; I
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
8 ~! X3 `) U8 D/ ?. d, m8 i 以下三个定义:- T7 L0 {. r& c+ A
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
0 \# J- {2 w. M2 h# N, H 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
/ \7 k: v1 g# Y" [+ { e, n 所谓的双方优势策略则是指双方利益总和最大的策略。
" V2 f4 S0 w# `" K* X2 Y: {. g[编辑本段]严格优势策略举例分析
! [( e0 Y! v; s3 u1 _$ o, R 一、经典的囚徒困境
# c2 Z( t/ L4 M# l 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
3 T. B: Y3 a" O0 F' G 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( }4 J% F+ [: ~% y& J1 r
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 E; ?) [+ K# j3 E% o! e+ F0 C, ?
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
) ~6 p7 B5 O; E- ^ 若二人都互相检举(互相“背叛”),则二人同样判监2年。6 D3 `( j4 a- B
2 F# ~: Q- B' J. o
用表格概述如下: }( S, }, ]; v3 U! p9 `
& ~, k/ d8 h5 S- i 甲沉默(合作) 甲认罪(背叛) # ?1 I( p" |0 B& g v
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 7 E: a8 y- [, Y$ r! ]4 ?
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 . q3 a2 N5 U) e8 I5 V
$ m" k4 M( O. D) y2 ], K
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 . n% I7 X% |8 Q# @+ l# a( }
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # t# N! ~9 q f9 }0 d: a
若对方沉默、背叛会让我获释,所以会选择背叛。
+ _( l; D$ l1 t8 M* P+ }, R 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( W* ?& z, j; w' Y
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 S$ p6 U( b* Z% {/ P* J 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: j0 O# e, x1 B2 F 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; E: `. L2 [$ `, l& f: P[编辑本段]二、智猪博弈理论
) \. U. `& l; j 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* q- y$ x1 T4 V' \ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! P" J: g$ K% r% b) p
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 p, d; Y" |. ~6 P, `4 L 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 w: Z: D- N$ [! K* S) f “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 , S# |. w: l8 {0 e6 [8 b& i& d2 Z
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 * Z9 M( D2 f9 F1 I f' k0 P
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。9 @1 u1 B5 r0 Y! [7 l6 q
( L/ M7 v/ P. b3 b; C9 w9 K
三、关于企业价格策略
h; s/ J! x( W. b! c) r% [) C& b0 _$ e3 a) Q, t
; C- T' `8 P$ u 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? & a0 l+ G6 E% \9 E! k& g$ H
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ X% B1 ?, X4 B; \) \9 R" H- G
以下三个定义:
# P/ @. ~ m2 s 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( m& S* e* J8 T! u" G! h
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 : H6 ]! u% }3 W& L; Q6 g. L
所谓的双方优势策略则是指双方利益总和最大的策略。 * `/ ~7 d! Z- _$ p4 Q7 M; B0 g
[编辑本段]严格优势策略举例分析3 B, G8 n% H9 r( ^, r& r8 C: _' X
一、经典的囚徒困境
) v/ {. \& P9 \& J 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
- A5 K4 o E* X% t& p" |$ m/ \' E 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ! L i/ x' i5 W+ V
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . j! `9 d; L1 X7 Z$ f7 B8 G
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( O; g9 c K5 |" S( z3 A 若二人都互相检举(互相“背叛”),则二人同样判监2年。* a z, T7 g. h# D4 l. U. ~- R
1 Q% A4 S$ L/ s- d2 @9 u用表格概述如下:
$ H8 Z4 }* }0 y: M: c- ~/ H
2 i; o9 H! N# F( w 甲沉默(合作) 甲认罪(背叛) 1 h% J$ d, Y% s7 g0 G3 ]. G
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 # o: z7 H8 M0 D4 Q4 Y! p' q
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ; w7 T# j2 Q& t' ~6 y3 P! k, \. B
7 z1 d6 o1 j$ ?% e1 R4 F* a 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
0 Z9 D+ F6 p( ?9 j$ Y 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' D' p7 }* \9 o, d 若对方沉默、背叛会让我获释,所以会选择背叛。
9 E6 g! t+ R. W. K# F) T* H. K) }' o 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
f8 H- [3 a' x# r" W$ @+ g% q 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 y; P: u+ e- e2 S$ a2 q 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! d' F7 _0 r: e
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 @* N) Y% i3 [ ~" N4 \0 `/ v/ N( {0 q
[编辑本段]二、智猪博弈理论
( n, p8 k5 Y# [2 z+ T 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ S. M$ c/ ^" i+ \5 }) X1 v 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. P, h; u# L0 e' o9 Q" { 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 B& X# k" D* ]+ o 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ |7 J7 _& n. r { P
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 2 f: }. t2 ~0 L6 U% X
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; t7 b. [' a# ?0 V, `* j
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: A/ d ?7 C7 ], K) H! u 8 d7 ~: ^9 F6 f4 Z# y
三、关于企业价格策略
* x2 x% l. [9 n6 W/ {8 x% d' X z3 |5 K& h* P
" ^0 ]: A' j# S8 j
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ |# r. e* m5 ~/ V x2 D# d 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% k3 f, U, ?& `# A0 G) f* L# q1 A u
以下三个定义:+ R. E0 N2 M5 o! w, [
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ z' k. L# ?3 ~: H: K/ P$ O 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ; X- o' V& d3 y+ l* O
所谓的双方优势策略则是指双方利益总和最大的策略。 ; U/ ?/ a% W# v' B- r9 Y
[编辑本段]严格优势策略举例分析. H. z5 Q- ^* R3 c7 Y
一、经典的囚徒困境 7 f5 W) k$ A2 W9 x
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, [& f; ^" m. w0 Q% m; r: {' x 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ i Z4 T2 b# w5 u7 i 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% t& E, Q6 d$ h8 U 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 5 v8 g' T- L4 i
若二人都互相检举(互相“背叛”),则二人同样判监2年。* C4 ~1 |+ x5 j! s. u3 f4 y' I/ u
/ i6 a) @7 l% C3 ]& G
用表格概述如下:' s) Q+ J* d. Y/ Y4 O) m5 M7 y
0 G! l2 \3 G3 x! C 甲沉默(合作) 甲认罪(背叛)
, H3 U% j, S9 N% Q+ t乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 : a$ w) k1 b. r5 K: D
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 % U2 N8 B" G: m% Q4 d# F! V
; I8 s. k: G6 N' p
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 . Y% d! f$ C5 G' W
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 `, E# R3 h: P# m! \
若对方沉默、背叛会让我获释,所以会选择背叛。 ) `8 X9 l/ F. {4 ?9 a! K
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + k4 K2 F; x7 {& |; M9 J% c6 r' u
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! V1 I/ @1 T( P+ {3 k+ I
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 p3 E% X9 s. M
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
1 e2 ?/ r5 b+ y) F& ~[编辑本段]二、智猪博弈理论3 q; q# n/ @1 i+ }3 y3 o3 h
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 , K9 j3 D6 j* s
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 g+ T+ n& b M& x% _, |' |
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 / A, a- @, l' ?6 j1 f" w
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
@2 ?* T' ^/ R; L4 K% A' i “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 s" x# i: j6 t/ b9 l! U 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 7 p% f. q4 [' c
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 Z3 O- s! N6 J* g8 o M4 e
! w, ?4 U' |$ n5 U三、关于企业价格策略
2 I, n9 {9 Y' N& I7 U
- N6 }8 q- z6 N* _ 0 g- G ]5 l- ` J( I
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 1 y& z+ P! \9 L6 K8 U: L
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |