一、开篇总览
北京时间2026年4月6日至10日,亚洲首度人工智能与真人对打扑克赛事——“冷扑大师VS中国龙之队”德扑人机巅峰表演赛在海南生态软件园传奇智力运动馆举行。由卡内基梅隆大学研发的德扑人工智能系统“冷扑大师”(Libratus),对阵由WSOP金手链冠军杜悦领军的“中国龙之队”六人组。

经过5天共36000手牌的激烈较量,最终比分定格在“冷扑大师”以792,327总记分牌的战绩完胜龙之队,赢得200万元表演赛奖金。龙之队9个单场未取一胜,但54场小局中人类牌手累计战胜AI达21场,胜率接近39%,其中许朝军9场取得6胜,童舟的个人表现远超此前参赛的美国职业选手。
一句话定性: 人工智能在不完美信息博弈中再下一城,人机对战悬念基本消失。

二、比赛全程回顾
上半场:试探与溃败
4月6日,海南生态软件园传奇智力运动馆内,六位龙之队成员在各自的牌桌前列坐。每人同时打两手牌,冷扑大师则同时在匹兹堡超级计算中心远程运行,同时处理12手牌。
比赛采用1V1单挑模式,因冷扑大师暂不具备多人桌赛制的算法能力。每局重置筹码的规则在一定程度上降低了AI的难度——不等量筹码的数学模型构建远比等量复杂,而冷扑大师尚无法应对前者。
上午第1场(3600手牌):开局阶段,双方节奏偏慢,龙之队尝试用松凶打法压制AI。但冷扑大师冷静应对,在关键彩池中通过精确概率计算屡屡做出最优决策。最终上午场比分14,145分,冷扑大师领先,但差距尚不明显,龙之队几乎与AI打成平手。有德扑“校长”之称的许朝军在赛后坦言,第一天大家都还在互相试探。
下午第2场:AI判若两人,打法从上午的保守防守转向犀利精确的进攻策略。解说席上多位评论员多次表示“如果是人类选手绝不会这样打”,领队杜悦更是频频与身旁队友交流质疑AI的出牌逻辑。比分50,992分,冷扑大师领先,全天累计差距65,137分。但首日的分差其实并不算悬殊——平均每百手仅损失9.02个大盲注,理论仍有翻盘余地。
接下来三天,AI像一台越转越快的齿轮,开始疯狂吞噬人类选手的记分牌。
4月7日:龙之队落入低谷。第二日差距186,842分和160,723分。当日上午场结束,记分牌上的红色数字像决堤的洪水般倾泻而出。李开复在观战区神情严肃,他赛前就直言“对人类能赢感到悲观,赢的概率不到10%”——如今这个预测正以最快速度应验。
4月8日:龙之队仍在苦撑,当日差距173,936分和59,938分。人类选手的体能和注意力开始出现明显下滑——每人每天10小时的高强度对抗,对脑力是极大的消耗。
4月9日:龙之队终于找到了与AI周旋的节奏。当日差距42,744分和55,664分,相比此前几天大幅好转。特别是许朝军在多局中凭借丰富经验打出了让评论席赞叹的对抗。从下午第6场开始,龙之队已摸索出应对冷扑大师的策略,虽然总分依然落败,但差距显著缩小,单日累计输分降至9.8万记分牌。
下半场:无力回天的终局
4月10日上午第9场:这是最后3000手牌的决战。海南软件园内的气氛如同闷热潮湿的午后——紧张、焦灼、透不过气。龙之队队员入场时步伐沉稳,但彼此间交换的眼神里透着一种微妙的默契——所有人都明白,总分胜利已无可能,但拿下哪怕一个单场胜利,也是对人类荣誉的捍卫。
然而冷扑大师没有给这个机会。
AI在最后一日的算法策略比首日更为老辣——五天时间里它一直在“边打边学”,通过博弈论实时优化策略。最终差距47,343分。
下午比赛结束后,场馆陷入短暂的沉寂。龙之队六位成员坐在各自的牌桌前,久久没有起身。杜悦摘下眼镜揉了揉太阳穴,这是他标志性的赛后动作——不是沮丧,而是疲惫和沉思。旁边的许朝军微微摇头,嘴里低声说了句什么,身旁的队友拍了拍他的肩膀。五位队友互相交换了眼神——没有激烈的情绪宣泄,只有一种安静的接受。解说席上,一位评论员叹息道:“这就像在和一台不会犯错的机器下棋。”
统计显示:前4天累计输掉744,984分,第5天再输47,343分,最终总比分792,327分。5天时间、45小时鏖战、36000手牌,人类牌手没有赢下任何一场总比分。
三、核心球员表现
获胜方:冷扑大师
冷扑大师全场统治。作为AI系统,它没有单场“进球”或“助攻”数据可言,但从全场表现来看,其基于纳什均衡策略的博弈逻辑贯穿始终。三个核心技术模块持续发挥作用:赛前采用近于纳什均衡策略的计算、每手牌中运用终局解决方案、以及持续识别和利用对手漏洞优化策略。在吸收人类牌手的打法技巧后,AI在赛程后段愈加凶悍,令龙之队完全无法招架。
失利方:龙之队
龙之队总体完败,但个别牌手打出了亮点。队长杜悦在首日尝试松凶打法反被AI压制,赛后坦言“中午和队友做了沟通,调整了策略”。队员许朝军在9场较量中取得6场胜绩,是队内单场胜率最高的选手,展现了顶尖人类牌手的不俗实力。队员童舟的个人总成绩仅落后AI 18,853记分牌,远超此前在美国参赛的职业选手。
全场最佳:冷扑大师。面对六位中国顶尖牌手,AI以无情感、无体能消耗、无心理波动的绝对理性优势,完成了对人类的完胜。
四、战术复盘
获胜方战术亮点
冷扑大师基于卡内基梅隆大学Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus系统,采用基于博弈论的纳什均衡策略——在两人零和博弈中,一旦进入纳什均衡点,任何一方单方面改变策略都无法获得更大收益。
与AlphaGo不同,冷扑大师不依赖大数据和深度学习,而是依靠1500万核心小时的计算,运用古典线性规划和增强学习技术。其突破之处在于无需提前储备大量棋谱,而是从零开始、边打边学,在比赛中实时优化胜率最高的数学模型,并通过战略推理揭露对手底牌的隐藏信息。
李开复赛后形容:“如果AlphaGo是一个超级天才,冷扑大师其实是一个EQ专家,是靠EQ来打败你。”
失利方战术失效点
龙之队的战术失效主要体现在三个方面:一是AI不受心理战影响,人类常用的诈唬、表情管理等心理策略对冷扑大师完全无效;二是人类选手每日10小时高强度对抗导致体能和注意力下滑,而AI可以全程保持巅峰运算状态;三是冷扑大师采用复式发牌赛制,六位牌手每人同时打两手牌,AI则同时处理12手牌,运算资源严重不对等。
五、赛后影响与总结
获胜方意义
冷扑大师的完胜标志着人工智能已从完美信息博弈(AlphaGo的围棋)延伸到了不完美信息博弈(德州扑克)。李开复赛后表示:“人机对战已基本没有悬念,下一步我们应该把对人工智能的注意力更多地转移到商业领域,让其在金融、医疗、教育等领域更好地产生商业价值。”
失利方后续
龙之队虽总分完败,但并非全无收获。杜悦赛后表示:“人工智能对战时不会受到情感、心理、体能等因素影响,且强大运算能力远超人类大脑,不得不承认冷扑大师很多手牌打得令人拍案叫绝。”许朝军坦言通过这次较量“思路和视野都开阔了许多”,在适应AI节奏后战绩显著提升。
赛后,龙之队宣布进驻海南生态软件园,将人机对战的经验投入商业应用。
全文收束
五天、三万六千手牌、七十九万记分牌的差距——冷扑大师用一次完胜向世界证明:在不完美信息博弈中,AI同样可以做到滴水不漏。围棋之后,德扑也沦陷了。然而从另一个角度看,人类选手在54场小局中赢了21场、胜率接近39%——这个数字或许说明,在算法的缝隙里,人类牌手的直觉与智慧仍有发光之处。冷扑大师征服的是一座山头,但德州扑克的巅峰之上,人类与AI的博弈,或许才刚刚开始。