《鱿鱼游戏3》在6月27日上映了,随着李政宰老师的杀青,这场“真人版蛋仔派对”总算是有了一个阶段性的结束。后面第四季不管是转战美东开展破产红脖超级乱斗,还是转战美西上演小黑小墨互打手枪,估计都不会有啥浪花了。我之所以下这样的判断是因为,鱿鱼游戏爆火的关键点之一是其巧妙的关卡游戏设计,而有趣的关卡游戏设计是很难的。看完第三季一个很大的感触就是,编剧已经很难设计出更好、更吸引人的游戏了。因为不管是捉迷藏还是荡秋千亦或是推推乐,从游戏设计的角度来看这三个游戏都很难称之为“好游戏”。
那么我们不禁要问,一个好的游戏除了要有趣且简单之外,还要有什么要素才能让它被称之为“好游戏”呢?好的,我们今天借着《鱿鱼游戏》来看一下纳什均衡。
纯策略纳什均衡
首先我们先看看什么叫好游戏,从最经典的游戏“剪刀石头布”说起,剪刀石头布是一个经典的两人零和博弈,即一方的收益等于另一方的损失。此时我们假设玩家A和玩家B在玩剪刀石头布,那此时的收益矩阵如下:
B: 石头 | B: 布 | B: 剪刀 | |
---|---|---|---|
A: 石头 | 0 | -1 | 1 |
A: 布 | 1 | 0 | -1 |
A: 剪刀 | -1 | 1 | 0 |
此时双方可能的操作如下:
如果A选择出石头,B的最佳回应是布(因为B选布得1,选石头或剪刀得0或-1)。
如果B选择出布,A的最佳回应是剪刀(因为A选剪刀得1,选石头或布得-1或0)。
同理如果A选择剪刀,B的最佳回应是石头。
如果B选择石头,A的最佳回应是布。
可以看到,没有任何一个策略组合是双方互为最佳回应的。因此,剪刀石头布不存在传统意义上的纳什均衡,即不存在纯策略纳什均衡。
混合策略纳什均衡
但这时候如果我们让剪刀石头布成为一个N次决胜游戏,两人进行N次剪刀石头布,最后统计两人谁的获胜次数更多谁胜利,这时是否存在纳什均衡呢?
现在我们还是让小A和小B登场,此时小A的策略是每次都0.3概率剪刀、0.2概率石头、0.5概率布,小B的策略是0.4概率剪刀、0.4概率石头、0.2概率布,此时我们写个简单的程序模拟下两者的胜负情况:
1 | import random |
此时模拟一百万次,总计的胜负结果如下:
1 | ===== 总计 ===== |
此时可以看到小B对小A产生了胜和优势,核心原因在于B的策略选择相对A产生了策略优势,此时A相对B的策略差计算如下:
1 | E_A = 0.30(0·0.40 -1·0.40 +1·0.20) |
可以看出来每局B相对A都有0.02分的优势,而这点优势在一百万局下来只有便产生了很明显的胜场差异。此时其实从策略差函数可以看出来,B如果知道A的概率分布选择,那他总是能找到一种策略让他战胜或者至少战平小A,小A反之亦然。
那此时小A有没有什么至少让自己立于不败之地的手段呢,此时我们让小A采用(1/3, 1/3, 1/3)的策略,我们假设小B的策略是 (q1,q2,q3),则此时A相对B的策略差计算为:
1 | E_A = 1/3(0·q_1 -1·q_2 +1·q_3) |
可以发现当小A的策略是(1/3, 1/3, 1/3),他能让自己的胜率至少保证不处于劣势,当然坏处是也不可能存在优势。而小B也是同理,与其冒险设置一个可能被别人击败的策略,倒不如先让自己立身于不亏的状态。因此在彼此猜疑的情况下,小A和小B在这个游戏中会陷入一个纳什均衡点, 即:
- 小A的最优策略是,以(1/3, 1/3, 1/3)的概率出剪刀石头布。
- 小B的最优策略也是,以(1/3, 1/3, 1/3)的概率出剪刀石头布。
因此两人便形成了纳什均衡,而这种基于一定策略组合而非单一策略的情况下产生的均衡点,便是混合策略纳什均衡。而此时,这种有明确的纳什均衡点的游戏便不再具有趣味性,因为最优策略已经在数学层面上被定义好了,玩家只需要遵循即可。
重新看下鱿鱼游戏
让我们用纳什均衡的视角重新看一下鱿鱼游戏3中的各个游戏,捉迷藏、荡秋千与推推乐。
捉迷藏
我们需要分别分析A组和B组的策略,以及它们之间的互动。
A组的策略:
每个A组玩家必须在规定时间内至少杀死一名B组玩家。
可以追杀B组玩家,但B组可以反杀。
A组之间不能互相残杀。
B组的策略:
必须规定时间内找到迷宫出口。
可以躲避A组。
可以反杀A组。
- 寻找纳什均衡点
为了找到纳什均衡,我们需要考虑是否存在一组策略,使得任何玩家都无法通过单方面改变策略而获得更好的结果。
可能的均衡策略:
A组策略:
每个A组玩家选择一个B组玩家作为目标,并追杀。
如果B组玩家反杀,A组玩家可能会选择其他目标。
B组策略:
B组玩家可以选择躲避A组,同时寻找出口。
或者B组玩家可以合作,集中反杀A组玩家。
均衡分析:
B组玩家的选择:
如果B组玩家选择合作反杀A组,可能会减少A组玩家数量,从而降低A组的击杀成功率。
但反杀A组需要消耗时间和资源,可能影响寻找出口的进度。
A组玩家的选择:
如果A组玩家分散追杀B组,可能会增加击杀率。
但如果B组集中反杀,A组玩家可能会避免单独行动。
关键点:
所有A组玩家必须至少杀死一名B组玩家才能通关。
所有B组玩家必须找到出口才能通关。
如果A组玩家未能击杀B组玩家,则被淘汰。
如果B组玩家未能找到出口,则被淘汰(无论是否被杀)。
可能的均衡:
A组玩家:每个A组玩家选择一个B组玩家作为目标,并确保能够击杀至少一个B组玩家。为了避免被反杀,A组玩家可能会选择分散追杀不同的B组玩家。
B组玩家:为了最大化自己的生存概率,B组玩家可能会选择分散逃跑,避免被A组集中击杀。同时,B组玩家可能会尝试反杀A组玩家以减少A组数量,但这样会分散寻找出口的注意力。
纳什均衡的存在:
如果A组玩家和B组玩家都采取分散策略(A组分散追杀,B组分散逃跑和寻找出口),那么:
对于A组玩家:如果其他A组玩家也分散追杀,自己无法通过改变策略(如集中追杀)获得更好的结果,因为B组玩家已经分散。
对于B组玩家:如果其他B组玩家也分散逃跑,自己无法通过改变策略(如集中反杀)获得更好的结果,因为A组玩家已经分散。
这种分散策略下,任何一方都无法通过单方面改变策略而获得更好的结果。因此,这是一个纳什均衡。 - 验证均衡的稳定性
让我们验证这个均衡是否稳定:
A组玩家:
如果某个A组玩家试图集中追杀多个B组玩家,可能会因为B组玩家的分散而无法有效击杀,且可能被反杀。
因此,分散追杀是最优策略。
B组玩家:
如果某个B组玩家试图集中反杀A组玩家,可能会减少A组数量,但会牺牲寻找出口的时间,可能导致自己被淘汰。
因此,分散逃跑和寻找出口是最优策略。 - 其他可能的均衡
另一种可能的均衡是:
A组玩家:所有A组玩家集中追杀一个B组玩家,确保击杀。
B组玩家:所有B组玩家集中反杀A组玩家,减少A组数量。
然而,这种策略对于A组玩家来说风险较高,因为集中追杀一个B组玩家可能无法保证每个A组玩家都能击杀一个B组玩家(因为只有一个B组玩家被击杀)。因此,这种策略不是纳什均衡。 - 结论
最合理的纳什均衡是:
A组玩家:每个A组玩家独立选择一个B组玩家作为目标,分散追杀。
B组玩家:每个B组玩家独立选择逃跑路线,寻找出口,尽量避免被追杀。
在这种策略下,任何一方都无法通过单方面改变策略而获得更好的结果。 - 数学模型(简要)
为了更形式化,可以构建以下模型:
设A组有n个玩家,B组有m个玩家。
A组玩家i的策略是选择一个B组玩家j进行追杀。
B组玩家j的策略是选择逃跑和寻找出口的路径。
纳什均衡的条件是:
对于每个A组玩家i,给定其他A组玩家的追杀策略和B组玩家的逃跑策略,选择追杀某个B组玩家是最优的。
对于每个B组玩家j,给定其他B组玩家的逃跑策略和A组玩家的追杀策略,选择逃跑和寻找出口的路径是最优的。 - 实际限制
在实际中,迷宫的复杂性、玩家的能力差异、信息不对称等因素可能影响均衡的实现。但从理论上看,分散策略是一个稳定的纳什均衡。 - 最终答案
是的,这个游戏存在纳什均衡点。
纳什均衡策略如下:
A组玩家:每个A组玩家独立选择一个B组玩家作为目标,分散追杀,确保自己能够击杀至少一个B组玩家。
B组玩家:每个B组玩家独立选择逃跑路线,专注于寻找迷宫出口,避免被A组玩家追杀。
在这种策略组合下,任何单个玩家都无法通过单方面改变自己的策略而获得更好的结果。