《鱿鱼游戏3》播完之后,我有一个很强烈的感受:这一季的戏剧冲突还在,但“游戏设计本身”已经明显不如前两季抓人。
原因并不复杂:一个游戏如果想长期有张力,不只是要“刺激”,还要在规则层面有稳定的博弈空间。换句话说,它得让玩家不断面对真实、持续、可计算的策略选择,而不是只靠剧情强行推进。
所以这篇文章想做一件事:
借《鱿鱼游戏3》里的三个核心关卡,系统地聊聊纳什均衡,以及它为什么会直接决定一个游戏好不好看、耐不耐玩。
先把概念说清:什么是纳什均衡
一个策略组合如果满足下面条件,就叫纳什均衡:
- 在其他人策略不变时,你单独改策略,收益不会更好;
- 对每个参与者都成立。
它的核心是“无人愿意单方面偏离”。
注意这里说的是“单方面”。也就是说,就算有一个大家都更好的集体方案,只要个体有动机背刺,它就未必是均衡。
接下来我先用最经典的例子(剪刀石头布)做一个热身,再回到鱿鱼游戏。
一、从剪刀石头布理解纯策略与混合策略

剪刀石头布是一个典型的两人零和博弈:一方收益就是另一方损失。
设玩家 A 和玩家 B 的收益矩阵如下(以 A 视角):
| B: 石头 | B: 布 | B: 剪刀 | |
|---|---|---|---|
| A: 石头 | 0 | -1 | 1 |
| A: 布 | 1 | 0 | -1 |
| A: 剪刀 | -1 | 1 | 0 |
1) 纯策略纳什均衡:这里不存在
如果 A 出石头,B 最佳回应是布;
如果 B 出布,A 最佳回应是剪刀;
如果 A 改出剪刀,B 又会改石头……
你会发现策略在循环,找不到一个固定组合让双方都不想改。
所以这个游戏不存在纯策略纳什均衡。
2) 混合策略纳什均衡:这里存在
如果游戏重复很多轮,玩家可以采用“概率策略”。
比如下面这个例子:
- A: 剪刀 0.3,石头 0.2,布 0.5
- B: 剪刀 0.4,石头 0.4,布 0.2
我们先做个模拟:
1 | import random |
模拟一百万次,典型结果是:
1 | ===== 总计 ===== |
B 对 A 的期望优势可以直接算出来:
1 | E_A = 0.30(0·0.40 -1·0.40 +1·0.20) |
这意味着 A 每局平均要亏 0.02。看起来很小,但轮数拉长后会被稳定放大。
那么 A 有办法“至少不吃亏”吗?有:采用均匀随机策略 (1/3, 1/3, 1/3)。
设 B 的策略是 (q1, q2, q3),则:
1 | E_A = 1/3(0·q_1 -1·q_2 +1·q_3) |
当双方都采用 (1/3, 1/3, 1/3) 时,谁都无法通过单方面换概率获得优势,这就是混合策略纳什均衡。
上面这个热身结论很重要:
如果规则可被稳定“解题”,游戏张力会迅速下降。
带着这个观点,我们回看鱿鱼游戏第三季。
二、回看《鱿鱼游戏3》:三个关卡的博弈结构
1) 捉迷藏:有均衡,但依赖信息与执行能力

先把游戏抽象出来:
所有参与者分成 A/B 两组:
- A组目标:在规定时间内至少杀死一名B组玩家。
- B组目标:在规定时间内找到迷宫出口。
- A组限制:不能互相残杀。
- B组限制:无明确限制,可以躲避或反杀A组。
A 组最自然策略
- 追杀B组玩家
A组玩家必须击杀至少一个B组玩家才能通关。 - 反杀风险
B组玩家可以反杀A组,因此A组需谨慎选择目标。 - 分散追杀
A组玩家之间不能互相残杀,因此分散追杀不同B组玩家是合理选择。
B 组最自然策略
- 寻找出口
B组玩家必须找到迷宫出口才能通关。 - 躲避A组
B组玩家可以选择躲避A组,避免被击杀。 - 反杀A组
B组玩家可以反杀A组,但会消耗时间和资源,影响寻找出口。
均衡判断(简化模型)
一个较稳定的局部均衡是:
- A 组分散追杀(提高“每人至少一杀”达成率);
- B 组分散逃跑并以找出口为主(降低被集中围猎概率)。
为什么说“局部”而不是“全局”?
因为这个均衡对前提非常敏感:
- 地图信息是否对称;
- 个体能力差异是否显著;
- A/B 人数比例是否失衡;
- 临场合作是否能稳定维持。
其他策略为什么不稳定
- 集中追杀与反杀
- A组集中追杀一个B组玩家,B组集中反杀A组。
- A组会出现“有人完成不了击杀指标”的问题,个体有强烈偏离动机,所以不稳。
小结:
捉迷藏不是“没有均衡”,而是“均衡高度情境化”。编剧如果想靠它持续制造高质量张力,就必须不断打破信息条件,否则很快会被策略化。
2) 荡秋千:纯策略均衡过于直给,观感上容易塌缩

这个关卡的问题其实最明显:
它几乎直接把“先手抢位 + 阻止他人通过”写成了占优策略。
如果所有人都理性,最优反应会快速收敛为:
- 抢先占据关键点位;
- 阻断后续竞争者;
- 牺牲整体通关率换个体先手收益。
这会产生一个尴尬结果:
均衡存在,但观赏性下降。
因为玩家策略空间被压得太窄,观众很快就能预测行为,戏剧性主要靠角色人设而不是机制本身。
3) 推推乐:存在局部均衡,但会被价值偏好主动打破
这个关卡比前两个更有意思,因为它把“理性收益”与“道德偏好”直接撞在一起。
规则抽象
| 要素 | 内容 |
|---|---|
| 场景 | 3座悬空的狭窄平台,需跳跃、推搡、合作或背叛抵达终点 |
| 胜利条件 | 倒计时归零前至少1人到达终点即可触发奖金;未到达者淘汰 |
| 关键动作 | 可抢夺武器、推人、按下“开始键”启动倒计时 |
| 人数 | 最多7人(含婴儿) |
| 信息 | 不完全:无法预知他人是否按下开始键 |
局部纳什均衡:恶人组“牺牲一人”方案
| 策略组合 | 收益结构 | 单方偏离后果 | 均衡判定 |
|---|---|---|---|
| 恶人组 提出牺牲1名重伤者,其余6人过桥,不按下开始键 |
6人存活 → 每人75亿韩元 | 若抢武器/推人 → 引发混战,全灭概率↑ | 无动力偏离 |
| 主角团 接受方案,不攻击、不启动游戏 |
婴儿、自己、孩子爸均存活 | 若拒绝 → 进入抽签,死亡概率≥1/2 | 无动力偏离 |
在“纯收益最大化”前提下,这个组合确实稳定。
均衡破裂:主角提出“公平抽签”
| 新策略 | 恶人组视角 | 结果 |
|---|---|---|
| 抽签(婴儿不计) | 死亡概率 = 4/6 > 50%,期望收益为负 | 拒绝参与 → 爆发冲突 → 全灭 |
破裂原因一句话就够:
主角方案不符合恶人组个体理性,因此原均衡无法维持。
其他策略组合(稳定性对比)
| 策略 | 是否均衡 | 理由 |
|---|---|---|
| 全员零冲突合作过桥 | ✅(理论上) | 收益最大,但信息不完全+信任缺失难以达成 |
| 恶人组内部推人减员 | ✅(子博弈) | 内部稳定,一旦被主角干预即崩 |
| 主角单方按下开始键 | ❌ | 自己也可能掉下,非最优反应 |
| 抽签决定生死 | ❌ | 对恶人组严格劣势策略,拒绝参与 |
这一关最值得看的点
这关不是“有没有均衡”的问题,而是“角色是否愿意活在均衡里”的问题。
也就是说,剧情冲突并非来自数学失败,而是来自价值排序冲突。
三、把三关放在一起看:第三季为什么观感分裂
综合上面的分析,可以看到:
- 三个关卡都能找到某种纳什结构(纯策略或混合/局部均衡);
- 但很多均衡太“直给”,导致策略空间不够丰富;
- 剧情推进越来越依赖“角色偏离理性”,而非规则自身生成张力。
这也是我说第三季游戏设计偏弱的核心原因:
机制不够复杂时,博弈很快被解题;一旦被解题,戏剧就只能靠人设强推。
四、再看真正耐玩的游戏:它们如何处理纳什均衡
上面聊的是剧。下面回到现实游戏设计,看看“好游戏”怎么和均衡相处。
1) MOBA(DOTA/LOL/王者)
MOBA 的本质是:版本会不断制造局部强势点。
如果完全放任,最优策略会快速收敛,体验会变成“谁抢到版本答案谁赢”。
所以你会看到一套经典制度工具:
- Ban 位(先消除最强占优策略);
- 轮选顺序(压制先手信息优势);
- 版本更新(持续打破旧均衡)。
它的本质是在做一件事:
不让博弈过早收敛到单一可解点。
2) 德州扑克
德州扑克在有限玩家、有限动作、有限信息框架下,理论上存在混合策略纳什均衡。
但问题在于,这个均衡在实际局面里非常复杂,玩家无法完整求解。
于是它在体验上呈现为:
- 你知道“有均衡”;
- 但你无法稳定“吃透均衡”;
- 所以博弈长期有张力。
这也是为什么扑克经久不衰:
不是没有规则答案,而是答案复杂到足够支撑长期策略对抗。
五、结论:有趣的规则,往往是“可博弈但不可速解”
把全文压缩成一句话就是:
好游戏不是“没有纳什均衡”,而是“不让玩家太快锁死在单一均衡里”。
回到《鱿鱼游戏3》,我个人的判断也是一样:
- 三个关卡并非没有博弈;
- 但机制层面的可展开空间不足;
- 于是剧情只能越来越依赖“非理性人物动作”来打破稳定策略。
这不完全是“编剧降智”,更像是规则设计难度本身已经到瓶颈了。
因为真正高质量的规则,从来都不是“想个刺激惩罚机制”那么简单,而是要同时满足:
- 可理解(观众看得懂);
- 可博弈(角色有策略空间);
- 不速解(不会两轮就被看穿)。
最后,纳什均衡不只解释游戏,也解释制度。
很多看似高明的规则设计,本质上都是在“设计激励结构”,让参与者在各自理性下仍然沿着制定者希望的方向行动。
所以,不光是游戏。
纳什均衡之道,本质上也是“制定规则之道”。