Skip to main content

扑克的本质笔记(3)

Posted in

上一集说要先研究一下BU在不同情况下的决策问题。因为BU的决策比UTG要简单一点,他只有两个决策需要做。第一,他拿J的时候,bluff的频率,我们拿q1表示。第二,他拿Q的时候,他call的频率,我们拿q2表示。注意当BU拿K的时候他没有什么决策好做的,100%或者bet或者call就行了。q1和q2都是从0到1的数。

UTG的情况要稍微复杂一点,他要做三个决策。第一,他拿J的时候bluff的频率,用p1表示;第二,他拿Q的时候call BU的bet的频率,用p2表示;第三,他拿K的时候bet的频率,用p3表示。

有人说,p3=1。UTG拿 K还不肯定bet啊?不一定。假如UTG偷偷看到了BU的牌是个J,那么他的最佳策略就是check,希望引诱bluff。

好,现在我们有5个变量,UTG有三个p1 p2 p3,BU有两个q1 q2。这5个都是频率(概率,我混用两个词),他们5个完全决定了两者的策略。

现在定义一下两者的EV。我们把EV定义为双方Anti 100之后的EV。也就是说,那100块钱的anti算作sunk cost,不算成我们的支出。200块钱的底锅不属于任何一个玩家。例如,UTG check, BU bet, UTG fold。我们就给UTG记0,给BU记+200.

对于UTG和BU来说,他们的牌的情况总共有P(3,2)=6种,我们下面把所有6 种情况一一列出进行分析。好不容易琢磨这么一个简单的游戏,就是为了能用最简单最有效的方法:穷举啊!每个玩家他有四个可能的结果:或者输100,或者赢 200,或者赢300,或者0. 当双方check-check时输的那一方收益就是零。零收益对我们的计算没有影响,因此我们只需要考虑非零收益的三个结果。

情况之一,UTG 是个J,BU是个Q。如果UTG bluff,并且被call了,他-100,发生的概率是p1q2 (p1是UTG bluff J的概率,q2是BU call Q的概率)。如果UTG bluff 成功,BU扔牌,他+200,概率是p1(1-q2)。如果UTG直接check,我们已经知道BU一定也check,UTG 收益0,就不算概率了。

情况之二,UTG有J,BU有K。这种情况UTG只有一种非零收益的可能就是-100,发生在他bluff的时候。概率是p1.

情况之三,UTG有Q,BU有J。UTG必然check。BU在1-q1的概率下随后check,UTG收入+200. 另外BU也可能Bluff被UTG call,概率为q1p2,此时UTG -300.

情况之四,UTG有Q,BU有K。此时UTG注定赢不了任何的锅,他只可能输 100,当他call的时候。概率为p2

情况之五,UTG有K,BU有J。此时若UTG成功引诱bluff,收益+300,概率(1- p3)q1。其他任何时候UTG都是收益+200,概率为1-(1-p3)q1.

情况之六,UTG有K,BU有Q。如果UTG bet,BU可能call,UTG收益+300,概率为p3q2. 其他任何时候UTG都是收益+200,概率为1-p3q2.

这六种情况是均匀分布,每种概率都是六分之一。现在就可以把UTG所有情况下的权重EV简单相加,得到他的最终总EV。这个加起来的式子相当的长,写出来大概是这样的:

100/6 * (-p1q2-p1-q2) + 100/6 (2p1 - 2p1q2 +6 -4q1 + 2p3q1 - 2p3q2) + 100/6 (3p2q1 + 3q1 -3p3q1 + 3p3q2)

这个式子写出来,恐怕耐着心看到这里的朋友们都想起了伟大的墙的话:数学对扑克有用,沉迷于数学则误入歧途!于是终于愤愤得关上这个帖子。没关系,任何公式您都可以跳过,只看结论也无伤大雅。反正这些东东也是自己写着玩的。但是我确信,结论还是能对您有一定的吸引力的。

刚才这个公式是UTG在post anti的EV,单位是元。为了简化,我们把单位变成100元,就把100全都消掉了。我们还要变成pre-anti,也就是玩牌之前的EV,于是在公式后面-1. 再合并一下同类项,变成下面这个公式

UTG的EV (100$) = 1/6 * [ p1(1-3q2) + p2(3q1-1) + p3(q2-q1) -q1]

我们把p1, p2, p3看成自变量,把q1,q2看成他们的系数。我们会发现一个奇怪的现象:如果q1和q2都是1/3的话,三个自变量的系数都成了0,公式就变成 UTG的EV = -1/18, 而不取决于p1, p2,和p3.

这也就是说,如果BU以1/3的概率bluff J,以1/3的概率call Q,那么碰管你UTG怎么玩,我保证你UTG平均每一把输1/18 (个100元)。真是太奇妙了,BU只要用这种打法,无论UTG怎么玩,只要他不犯低级错误,他们的收益都是固定的。无论UTG拿J全bluff,还是全 fold;无论拿Q全call,还是全checkfold,谁也不会多赢,谁也不会多输. UTG以每手牌十八分之一的速度稳定向BU送钱。