激战二十天!人工智慧Libratus战胜四位顶级德州扑克选手

作者: / / 时间:2020-07-22 / / 浏览量: 804次

激战二十天!人工智慧Libratus战胜四位顶级德州扑克选手
Ryan Riess , 23, a poker professional from East Lansing, Michigan contemplates a move against Jay Farber, 29, a Las Vegas VIP Host originally from Santa Barbara, California, during the final table of the World Series of Poker $10,000 buy-in no-limit Texas Hold 'Em tournament at the Rio Hotel & Casino in Las Vegas, Nevada November 5, 2013. REUTERS/Steve Marcus- RTX151SF

在宾州匹兹堡的 Rivers 赌场,卡耐基梅隆大学开发的人工智慧系统 Libratus 战胜四位德州扑克顶级选手,获得最终胜利。

据官网介绍,此次由 4 名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智慧程式 Libratus,赛程为 20 天,一共进行了 12 万手牌的比赛。

2015 年,CMU 曾组织了首场「大脑对抗人工智慧」赛事。在当时的赛事中,代表 CMU 出战的是另外一款人工智慧系统「Claudico」,同样也有 4 名职业扑克玩家参加了比赛,然而,Claudico 并未获得最终胜利。

不过 CMU 认为,当时扑克职业玩家与 Claudico 仅进行了 8 万手牌的比赛,就统计学角度来讲并无法证明人类职业扑克玩家或人工智慧具有优势。这也是本轮巡迴赛中比赛的牌局数量增加 50% 的原因。

德州扑克的玩法:每个玩家有 2 张牌作为「底牌」,同时还有 5 张公共牌。玩家选择 5 张公共牌里的 3 张,与手里的 2 张底牌组合,最后以期得到最好的 5 张牌的组合。按照「Card Ranking」决定最后的胜者。

由于对方的「底牌」是隐藏资讯,对于电脑来说,就是在处理一种「非完整资讯博弈」。而围棋对弈双方的资讯是完整的、对称的,并没有隐藏的资讯。Libratus 此次战胜顶级人类德州扑克选手,具有非常重要的意义。

电脑正确决定,依赖于对方「底牌资讯」情况下的机率分布,这种「底牌资讯」可以通过对手过去的行为显露出来。比如有时玩家採取「虚张声势」的策略,对手有时手里并没有强牌,但还是作出全额下注、志在必得的行为,电脑这时要根据对方过去的博弈表现,来判断对手有强牌的机率。

相应的,对手也会推断我方的底牌资讯,所以这里就是一个「递归推理」,一个玩家无法轻易推理博弈状况。

继围棋和德州扑克之后,人工智慧的下一站会是哪个游戏呢?



上一篇: 下一篇: