订阅

订阅PokerListings.hk新闻:

网上扑克红利

  1. 独家 $500 bwin Poker 注册红利
    阅读更多

2009年02月23日

机器人的威胁(2)

Visit Full Tilt Poker

独家原创 PokerListings.hk

均衡策略

在上面两场人机大战中,主办方刻意营造了风险对等的比赛模式,因为实际上同一局牌双方各持一端的牌玩了2遍,无论好牌差牌,你我都一样,所以这是一场典型的零和博弈。

在博弈论中有一项理论称作纳什均衡,纳什本人也因发现这个理论而获得诺贝尔奖。这种理论指出:在零和博弈中一定存在着一种策略集,一旦博弈中的一方采取了这个策略,另一方就将无计可施,只能采取策略集中相对应的策略来应对才能做到对自己最有利。

举例来说--

1.如果你们玩的是石头剪刀布游戏,那么纳什均衡就是严格随机地出剪刀,石头或者布,一旦有人这样做,那么对手只能同样采取这种策略,否则就必输无疑,双方都采取纳什均衡的结果就是打平。(当然要玩得次数足够多)

2.拿扑克来举例,由于扑克比上面那个例子复杂地多,所以可以抽取由中的某一阶段来寻找纳什均衡。比如所有的在50元的锅底中下注50元的动作,如果你可以严格做到,非Nuts不下注,然后夹杂1/3机会的诈唬,这就是一种纳什均衡。对手除非采取相同的策略。不然就会对他自己不利。

但是实际生活中,人是无法做到的,因为你有许多的小动作能让对手识别出你是不是在诈唬,而且你也不可能做到绝对1/3概率。可是机器人可以做到,这就是它强于人类的地方。CPRG的工作人员雄心勃勃,不仅要寻找某一部分的纳什均衡,还期望寻找整场比赛中的纳什均衡。

机器人的死穴

当然就目前而言,它还无法做到这一点,制约它的因素主要是计算机的运算能力,对于2人单挑的有限注德州扑克来说,共有10的18次幂种情形需要考虑(我也不知道怎么算出来,这是CPRG给出的数据),要在这么巨大的策略集当中寻求一个纳什均衡点,在目前的硬件水平之下是不可能完成的任务。曾有人问过CPRG的负责人,如果计算机可以动用无穷多的资源,找出纳什均衡点需要多久?答案是超过10万个星期。

另外它的纳什均衡点并非来自实际牌局,而是来自于模拟牌局,而且是精简模式的牌局。精简的办法一是人数要少,二是有限注游戏,三是将持牌分类,当然还有更多的渠道,我们就不得而知了。

所以在机器人眼中,底牌AA,KK,QQ可能都是完全一样的,在翻牌圈拿到顶对的情形也是一样的,都会同样对待。不同"智商"的机器人之间的区别只是划分范围的泛与细,高性能的机器人可能划分更细,低性能的机器人则更宽泛。

另一个死穴在于,机器人无法分析和判断对手的策略,所以它们的均衡策略是静态的,它根本不在乎你在怎么玩,怎么变换策略,它只是按照它"自以为是"的均衡策略在进行,它只是在等你出错,典型的以不变应万变。可以想像如果两台机器人对战,只要玩的足够长,它们将是一场绝对的零和游戏,不分输赢。

不过CPRG的工程师声称他们目前可以通过一些策略让北极星适当地增加诈唬的次数来更大的获利,当然这会有改善,但是显然一时半会并不会有什么显著的改变。

因为这两个死穴的制约,在面对高手作战时,机器人仍然占不到绝对优势。从这两年的赛况就能体现,去年它输了,今年也只是一局险胜。

我们有必要惧怕机器人吗?

对于顶级的玩家而言,即使像北极星这样顶级的扑克机器人,也构不成明显的威胁,但是对于水平较差的玩家来说,这的确是一种不公平。但是我们依然不必过分担心它们的泛滥,因为目前,真正有效果的机器人主要出现在两人对战的牌局中,超过三个人的牌局,机器人就无法有效地应付了,原因我们上面已经分析过了。

除非真的有那种可以看到你底牌,看到下一张未翻的牌的机器人,它们才是真正的不公平与可怕,问题是有这样的机器人吗?我没有答案,你认为呢?祝你好运!

 

更多新闻

文章存档