09混合策略在网球比赛中的应用

这篇blog主要整理了耶鲁大学博弈论公开课「第9课混合策略」的笔记。

混合策略就是在纯策略上的一个概率分布。

混合策略的预期收益是该混合策略中每个纯策略预期收益的加权平均数。

\(\color{blue}{e.g.}\) 性别之战

		2
		a	b
1	A	\(\color{red}{2},1\)	\(\color{red}{0},0\)	\(\frac{1}{5}\)
	B	\(\color{green}{0},0\)	\(\color{green}{1},2\)	\(\frac{4}{5}\)
		\(\frac{1}{2}\)	\(\frac{1}{2}\)

已知\(p=(\frac{1}{5},\frac{4}{5})\) ， \(q=(\frac{1}{2},\frac{1}{2})\) ，求 \(p=(\frac{1}{5},\frac{4}{5})\) 的预期收益是什么？

（1）\(EU_{1}(A,q)=\color{red}{2}\times\frac{1}{2}+\color{red}{0}\times\frac{1}{2}=1\)

\(EU_{1}(B,q)=\color{green}{0}\times\frac{1}{2}+\color{green}{1}\times\frac{1}{2}=\frac{1}{2}\)

（2）\(EU_{2}(p,q)=\frac{1}{5}EU_{1}(A,q)+\frac{4}{5}EU_{1}(B,q)\)

\(=\frac{1}{5}\times1+\frac{4}{5}\times\frac{1}{2}\)

\(=\frac{3}{5}\)

\(\frac{1}{2}<\frac{3}{5}<1\) ，一般选择混合策略的预期收益介于混合策略所包含的纯策略的预期收益之间。

Lesson：如果一个混合策略是BR，那么混合策略中的每个纯策略必须也是BR，也就是说他们的收益必须相同。

\(\color{blue}{e.g.}\) 网球 Venus vs. Serena Williams

Serena在网前，球在Venus那半场，V接到球后要选择往S的左边还是右边击打。

Serena选择l代表作为回应，向左倾；选择r代表作为回应向右倾

		S
		l	r
V	L	\(50,50\)	\(80,20\)	\(p\)
	R	\(90,10\)	\(20,80\)	\(1-p\)
		\(q\)	\(1-q\)

这里没有纯策略纳什均衡。

下面寻找混合策略纳什均衡——

（1）寻找NE时S的混合策略，关键在于用S的混合策略\((q,1-q)\)分析V的收益。

V的收益是：

\(L\to 50q+80(1-q)\)

\(R\to 90q+20(1-q)\)

假设V也同样混合她的策略，现在V处于NE中，那么无论\(p\)多大，V采取的一定也是BR。V采取的BR包含了有时向左有时向右的情况，那么这必须满足选左还是选右本身也是BR。这就是说，选左和选右的混合是BR，那么选左选右单独也是BR。选左和选右的收益必须是相等的。

令 \(50q+80(1-q)=90q+20(1-q)\)

解得 \(q=\frac{3}{5}\)

（2）寻找NE时V的混合策略，关键在于用V的混合策略\((p,1-p)\)分析S的收益

\(l\to50p+10(1-p)\)

\(r\to20p+80(1-p)\)

令 \(50p+10(1-p)=20p+80(1-p)\)

解得 \(p=\frac{7}{10}\)

（3）综上，\(NE=[(\frac{7}{10},\frac{3}{10}),(\frac{3}{5},\frac{2}{5})]\)

假设我是V的教练，我发现S防左的概率>0.6，那么我会建议V朝右打（总是打右）；相反，如果我发现S防左的概率<0.6，那么我会建议V始终朝左打。

注意上面一段中斜体的两个词“总是”和“始终”，因为如果S采用的策略不是 \((\frac{3}{5},\frac{2}{5})\) 的混合策略，那么V的BR就是纯策略；且如果V采用的策略不是 \((\frac{7}{10},\frac{3}{10})\) 的混合策略，那么S的BR就是纯策略。

改变收益矩阵

		S
		l	r
V	L	\(30,70\)	\(80,20\)	\(p\)
	R	\(90,10\)	\(20,80\)	\(1-p\)
		\(q\)	\(1-q\)

改变的是：当V朝S的左边打，而S左倾时，双方的收益。此时，S的收益增大了，就是说S打反手球的能力增强了。

这里仍没有纯策略纳什均衡。

两个可能的影响：

（1）直接影响：S应该多左倾，即 \(q\) 变大（70>50）

（2）战略影响：V知道S打反手球的能力增强了，V选L的概率降低，于是S左倾的次数减少，即 \(q\) 变小

那么，\(q\) 到底是变大还是变小呢？下面重新求解NE：

为了找到S的新的 \(q\) ，利用V的收益

\(L\to30q+80(1-q)\)

\(R\to90q+20(1-q)\)

令 \(30q+80(1-q)=90q+20(1-q)\)

解得 \(q=0.5 < 0.6\)

可知，\(q\) 变小了，战略影响更大。

《相对静态 (comparative statics)》

《带双方回到NE (bing each other back into NE)》

复习这篇笔记的原因：混合策略会最终提供一个数字上的结论，给出了对于决策的指导意见。

知识与理解

博弈论公开课

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！

disscussOFtheNEWone 上一篇

知识搜索加油站下一篇