打麻将，AI又赢了！腾讯绝艺AI刷新全球最好成绩

首页 > 中国科技先生 > 基础 > > 内容页

打麻将，AI又赢了！腾讯绝艺AI刷新全球最好成绩

来源：深圳商报&读创发布日期：2023-07-12 11:22:16

(相关资料图)

继在围棋、王者职业大赛和AI足球世界竞赛夺冠后，腾讯AI又拿一下了个麻将冠军。7月11日，腾讯宣布自研棋牌类 AI “绝艺LuckyJ” 在国际知名麻将平台“天凤”上达到十段水平，刷新了 AI 在麻将领域的最好成绩。“绝艺LuckyJ” 展现了在非完美信息博弈游戏中的优秀决策水平，进一步提升了AI解决现实世界问题的能力。

麻将源于中国，比赛为何在日本举行？据介绍，日本在线麻将竞技平台“天凤”创建于 2006 年，拥有体系化的竞技规则和专业段位规则，受到职业麻将界的广泛认可。据称，全球麻将AI基本上都是在该平台进行训练和打段。截至目前，天凤平台活跃人数 23.8万，而能达到十段的仅 27 人（含AI），不到万分之一。“绝艺LuckyJ” 在天凤平台特上房达到10.68段，相比其他麻将AI和人类玩家，“绝艺 LuckyJ”不仅稳定段位更高，从零开始达到十段所需的对战局数也明显更少，仅需要1321局。

从国际象棋到围棋，再到德州扑克、王者荣耀等，游戏多样化的情境为AI的训练和学习提供了便利的研究场景。围棋、象棋都属于完美信息博弈，参与竞技双方的每次决策，都可以看到全局的信息。AI能够通过强大的计算力来枚举各种可能性，从而找到致胜策略。而麻将无法看到手的手牌，加上还有大量未揭开的牌，存在大量的隐藏信息，是典型的非完美信息博弈。

据介绍，麻将一共有136张牌，每一位玩家只能看到很少的牌，包括自己的13张手牌和所有人打出来的牌。牌局开始时，另外三位玩家的手牌以及墙牌都是看不到的，面对如此多的隐藏未知信息，麻将玩家的每一个决策都需要兼顾进攻和防守。此外，在麻将的对战中，除了正常的摸牌、打牌之外，还要决定是否吃牌、碰牌、杠牌、立直以及是否胡牌。任意一位玩家的吃碰杠以都会改变摸牌的顺序，这一过程也涉及了大量的决策。

为了更好地解决麻将游戏中存在的大量隐藏信息的难题，提升AI的决策能力，腾讯 AI Lab基于强化学习和遗憾值最小化的自我博弈技术，使得AI能从零开始自我学习和提高，并最终收敛到一个最强的混合策略，让AI在实际对战的过程中拥有更加平衡的策略能力。同时，考虑到传统的非完美信息搜索算法在麻将面前很难发挥太大的作用，腾讯 AI Lab基于乐观价值估计的思想，提出了一种高效的非完美搜索方法，使得AI在有海量隐藏信息的游戏状态中，仍可以实时调整当前策略，从而更好地应对多变的战局。

天凤平台开发公司C-EGG的CEO角田真吾表示：“LuckyJ进一步拓宽了麻将AI的能力边界在特上房包括人类玩家在内的对战1000局以上的所有玩家中，LuckJ的稳定段位排名第一”。 “雀友杯”2014年世界麻将大师邀请赛冠军，腾讯麻将锦标赛年度总决赛（2018，2019）冠军成海华提到，AI在攻防两端都表现得都十分出色，充分体现了计算上的优势。此外，“绝艺LuckyJ“在国标麻将中也有亮眼表现，在线下职业选手邀请赛中击败六位职业选手，成为首个战胜国标麻将顶尖职业选手的麻将AI。

决策与生成是当前人工智能发展的两大主线，也是研究通用人工智能的必由之路。在模拟真实世界的虚拟游戏中，AI学会快速分析、决策与行动，就能执行更困难复杂的任务并发挥更大作用。腾讯 AI Lab 研究员表示，现实世界中充满了需要在非完美信息状态下做决策的场景，比如金融交易、自动驾驶、交通物流、拍卖系统等。在游戏环境中推进决策AI的能力，最终是希望AI能从虚拟走向现实，解决真实世界的复杂问题。

从2017年开始，腾讯AI Lab自研的绝艺、绝悟两款决策AI。2017年，“绝艺”在第10届UEC杯计算机围棋大赛上斩获冠军；2019年，“绝悟”战胜王者荣耀职业选手，2020年，“绝悟WeKick牌“又在11v11足球AI竞赛上取得冠军。借助棋牌、MOBA等多类游戏场景，腾讯也在探索用AI解决现实中的复杂问题。“绝艺 LuckyJ” 在专业领域的突破，体现了腾讯 AI Lab 的深度强化学习智能体不断进化，正逐渐向解决更复杂更多样化的问题迁移，为AI走入更多行业打下了基础。

审读：孙世建

关键词：

上一篇: 西南证券：给予邦基科技买入评级，目标价位19.8元 下一篇: 最后一页

打麻将，AI又赢了！ 腾讯绝艺AI刷新全球最好成绩

打麻将，AI又赢了！腾讯绝艺AI刷新全球最好成绩