蒙特卡洛树搜索加冕指环王!游戏越复杂,AI越厉害
来源:arxiv
编辑:David
【新智元导读】 AI又来征服游戏了,这次的目标是《指环王》!这是一款以团队协作为中心的经典卡牌游戏。新模型基于蒙特卡洛树搜索 (MCTS) 算法,游戏难度越高越厉害!
AI再次入侵游戏领域!
与之前的即时策略类、对战类游戏不同,这次的目标是在国外非常流行的卡牌游戏《指环王》。
说起来,自从AlphaGo横空出世,击败人类最优秀的职业围棋手之后,AI开始在越来越多战略游戏中与人类对战。
机器学习算法和其他计算工具开始变得越来越先进,许多计算机科学家开始通过训练他们在不同的游戏中与人类竞争来测试他们的能力。
实际上,在过去10年左右的时间里,开发人员已经训练了许多模型在战略游戏、棋盘游戏、电脑游戏和纸牌游戏中与人类对战。其中一些AI取得了显著成果,击败了公认的人类冠军和游戏专家。
比如,Deepmind的AlphaStar模型就在《星际争霸2》中超过了99.8%人类玩家水平,达到了最高的宗师级段位。
近日,华沙理工大学的研究人员最近着手开发一种基于蒙特卡洛树搜索 (MCTS) 算法的技术,可以玩由 Fantasy Flight Games 于 2011 年发布的《指环王》 (LotR) 经典纸牌游戏。
MCTS 算法是一种通用的启发式决策方法,可以在随机游戏(playouts)中来优化给定游戏或场景中的搜索解决方案空间。研究人员在 arXiv 的一篇最新论文中介绍了他们的 MCTS 技术。
"我们是《指环王》游戏的粉丝,但我们发现没有现有AI可以玩这个游戏,"进行这项研究的两位研究人员 Bartosz Sawicki 和 Konrad Godlewski 表示。"尽管如此,我们还是发现了树搜索方法在类似的纸牌游戏中的应用,比如万智牌或《炉石传说》。"
《指环王》为什么之前没有AI来尝试呢?
主要原因是开发这款游戏的AI具有很高的挑战性。这是一款合作纸牌游戏,游戏策略的解决方案空间巨大,逻辑结构复杂,并且有随机事件发生的可能性。这些特点使得游戏的规则和策略很难通过计算方法获得。
"2016 年围棋人机大战,是人类玩家有机会和 AI 竞争的最后时刻。" Sawicki 和 Godlewski 解释说。"我们论文的目标是为《指环王》游戏寻找蒙特卡洛树搜索的代理。"
与其他著名的纸牌游戏,如《炉石传说》和万智牌相比,《指环王》的游戏模式有着很大的不同。事实上, 《指环王》的中心策略是团队合作,而不是与其他玩家竞争。
游戏中的决策过程非常复杂,游戏玩法包括多个阶段,其中大部分玩法策略要取决于前一阶段的结果。
尽管面临这些挑战,Sawicki 和Godlewiski 还是能够开发出一种可以玩 LotR 的基于 MCTS 的方法。然后,他们在游戏模拟器上进行了一系列测试,评估了他们开发的技术。
"我们的 MCTS 玩家的胜率明显高于基于规则的人类专家级玩家,"Sawicki 和 Godlewski 说。"此外,我们的方法将领域知识添加到扩展策略和 MCTS 中,进一步提高了模型的整体效率。"
这一成果证明,通过结合不同的人工智能和计算技术,AI模型可以实现复杂和协作式的策略游戏的精通。尽管如此,采用MCTS 来处理这些复杂的游戏也有很大的局限性。
"主要问题是 MCTS 将游戏逻辑与AI 算法相结合,所以在构建游戏树时必须知道合法的走法,不过,调试具有显著分支因素的游戏树是一场噩梦。
在很多情况下,程序可以运行顺利,但游戏胜率为零,我们不得不手动检查整个游戏树。" Sawicki 和 Godlewski 解释道。
未来,这项技术可以被《指环王》游戏爱好者与 AI 合作玩游戏。还可以激发其他人工智能工具的开发,这些工具可以玩复杂的、战略性、多阶段的游戏。
另外,这项研究未来还打算探索《指环王》游戏中训练的深度强化学习 (RL) 代理的潜力和性能。
研究人员表示:"目前的工作重点是使用强化学习来进一步提高 AI 在游戏中的性能。给定一个游戏状态,神经网络返回一个由环境(即游戏模拟器)执行的动作。
这很困难,因为不同状态下动作的数量不同,而策略网络只能有一个固定的数量输出。到目前为止,我们的结果很有希望。"
参考链接:
https://arxiv.org/pdf/2109.12001.pdf
https://techxplore.com/news/2021-10-monte-carlo-tree-algorithms-lord.html
悲惨的家庭北大又要开学了,又要迎来新一批的学生精英,天才少年。很多人认为,能够上北大的,必然是天之骄子,人品高尚,智慧无双。他的确是智商够高,但人品就没那么高尚了。你知道说的是谁吗?他就是最
善有善报,恶有恶报梅三娘本来生活很富裕,但是她跟丈夫只有一个儿子,所以她的儿子顿时成了两个人的心肝宝贝。有一天,她在自家的家门口发现了一个弃婴,便收养了那个女婴,那个人就是她的养女,梅三娘唤她小梅。
爱因斯坦我少年时,就已经深刻意识到,别人的追求毫无意义爱因斯坦67岁的时候,时日无多了,他本身也想写点东西,希望能够给年轻人一些帮助,再加上希尔普博士的劝说,于是他写了一本自述。这本自述论述了物理学,政治,哲学之类,但其核心思想被抽了
学医还是从教,多少学生徘徊在这两个专业之间,无法做出决定导语很多同学的理想是成为一名教导有方的老师,或者是成为一名救死扶伤的医生,到了选择专业时,学生就需要在这二者之间做出抉择了。其实对于如何选择有所纠结也很正常,毕竟这一刻的决定,可能
港影天王的传奇,香港娱乐圈斗志顽强的两个人,难有第三人其后在文字中证道。唐泪毋庸置疑。刘德华与郭富城,是双周一成之后香港最具叫座力的两个演员。很多人或许会表示不服。尤其同为大咖的甄子丹梁朝伟和古天乐影迷,甚至也包括刘德华影迷。这个话题拒绝
福原爱女儿痛哭!父母离婚孩子受罪,江宏杰夫妻是否真的难挽回?福原爱女儿机场痛哭?根据相关媒体报道,江宏杰与福原爱已经传出婚变一段时间了,每一次谈到他们的婚姻,福原爱总是表示一切为孩子着想,而江宏杰总是抱着最大的善意,看到他们之间的问题。即使
青海甘肃之旅三黑马河畔日出揽胜,茶卡盐湖寻镜难求青海行D3青海湖日出昨天晚上十二点才入住酒店,一大早五点就起床,睡眼朦胧之际与大床斗争了半天,终于战胜自己。不过惊喜的是看到了青海湖日出。其实日出也看过几次,但是青海湖日出与众不同
奇山秀水游桂林十三心之所向曳箧游(桂林游览攻略总结下篇)D6相公山灵渠靖江王府相公山的夏季是看日出的绝佳季节,一则凌晨气温不高,天气凉爽,比较适宜爬山二是相公山不高,只需半小时左右即可登顶,这比守在泰山或黄山看日出要好许多三则人少,观察
三言两语说双减1。一二年级不能笔试,看来将来会有层出不穷的非笔试(如口试或面试等)出现2。小学初中英语比重下降,但中高考英语难度极可能增加3。中小学(义务教育,不含高中)范围内不能月考期中考只能
美丽的呼伦贝尔之七而今识尽美滋味(呼伦贝尔游攻略)一黑山头黑山头是位于内蒙古自治区呼伦贝尔市的一座古城。古城因在额尔古纳市黑山头而得名。古城在黑山头西北约10公里处,古城分内城和外城,城墙均为土筑。1952年黑山头划归额尔古纳所辖
奇山秀水游桂林(桂林游记十)百年沧桑说靖府到桂林旅游不久你就会发现,桂林市内基本上很难看到特别高的建筑,一般楼房都建在20层左右,之所以如此,就不得不提到桂林的南天一柱独秀峰以及其所在的靖江王城(也称靖江王府)。靖江王城坐