范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

什么?象棋和围棋都存在不败策略?

  象棋和围棋都是中华文明的瑰宝,更是训练和测试思维能力的方式之一,那些在这两种棋类上取得成就的人们,其智商普遍得到公众认可。但是,我们是否想过,在这两种棋类上是否存在必胜或者平局的策略?答案是存在的,这是策梅洛关于双人完全信息博弈的一个定理的结论。本文将详细介绍这个定理的证明,并将其用于诸如五子棋的分析中。如无特殊说明,后文所提及的游戏都是双人游戏。
  什么是最优策略
  为了让大家对最优策略有一个直观的理解,这里举一个小游戏作为例子。这个小游戏叫Chop,在游戏的最开始有一个m n的网格(下图是一个4 6网格示例),游戏由两位玩家轮流操作,每位玩家每轮可以沿着一整根竖网格线或者一整根横网格线将网格割掉一块,割到只剩下一个小方格的玩家为胜者。注意,不能沿着剩余网格的边界线做切割,例如不能沿着下图的AB线切割,但是沿着CD线或者EF线切割都是可以的。每次切割完之后网格会被分成两块,由操作切割的玩家决定留下哪一块。
  对于这类双人游戏,一般会有最先进行操作的玩家,我们将其称为先手,另一位被称为后手。如果一开始的时候m和n其中一个数为1,比如n=1,先手玩家可以直接切割掉(m-1)个格子即可获得胜利,这个策略就是先手玩家的最优策略。如果对于一般的m和n,先手或者后手怎样才能保证获胜呢?读者可以稍作思考,再接着往下看。
  其实很简单,如果m和n不相等,那么先手的最优策略会导致必胜的结果:这时候先手玩家只要割掉其中一块使得剩下的网格是个长和宽相等的网格即可。这样,无论后手切割哪条线,都是在长和宽相等的基础上进行切割,最后必然得到一个长宽不相等的网格,也就不可能是单独一个网格。先手玩家只要每一步实行这个策略,无论后手玩家怎么操作,先手玩家都会获胜。这时候读者肯定明白了,当m=n的时候,无论先手玩家怎么操作,后手玩家都可以借助前述一样的策略获胜。
  完全信息博弈和策梅洛定理
  现在回到一般游戏的讨论上。策梅洛定理适用于被称为完全信息博弈的一类游戏。所谓完全信息博弈,指的是游戏的所有信息都是公开的,游戏双方都能清楚了解到目前游戏所处的状态信息,并且游戏的每一步都不涉及概率因素。这个条件把扑克、飞行棋、暗棋和翻棋玩法下的军棋都排除掉了。然后,我们还需要这个游戏能在有限步内结束,并且,游戏的结局要么是平局要么有一方是胜者。很明显,围棋是属于完全信息博弈的。至于象棋,有可能会进入循环状态从而整个游戏没完没了。为了避免这一点,我们可以加入一些新规则使得象棋不会出现循环,比如,设定一个很大的数N,只要连续N步双方都没有被吃掉棋子就判为和棋,或者不允许超过N次进入同一种棋子状态,否则判为和棋。加入这些规则或者类似的规则之后,象棋就满足要求了。
  下面给出策梅洛定理的严格表述:在双人完全信息博弈下,只有三种情况:要么先手具有必胜策略,要么后手具有必胜策略,要么双方的最优策略会导致平局。比如前面所说的Chop游戏,当m n时,先手玩家具有必胜策略;如果m=n,后手玩家具有必胜策略。Chop游戏没有平局。策梅洛定理是一个结论很强的定理,下面我们会发现,它的证明非常简单,不需要用到很高深的知识。
  策梅洛定理的证明
  为了证明策梅洛定理,我们需要引入一个小小的概念:游戏树。在游戏的每一步,玩家有很多种走法,每一个走法都会产生新的分支,把两位玩家的所有可能走法考虑进来,就会得到一个树状结构。这个树状结构穷尽了游戏过程的所有可能性。下图是Chop游戏在1 4情况下的游戏树。在本文,我们用(1,0)表示先手获胜,(0,1)表示后手获胜,(0,0)表示平局。
  在游戏树上,节点会标注上游戏状态,比如上图中的方格。有时候为了信息完全,还会标注上在此节点轮到哪位玩家操作了。因为我们把游戏循环往复的可能性排除了,游戏状态转移图不会出现圈图,所以必然是树图。(对于象棋,如果用A表示棋子状态,加上了前文所述的其中一个规则后,整个游戏状态将由(A, i)表示,其中i表示已经连续i步双方都没有被吃掉棋子或者已经i次进入棋子状态A了。在这样的表示下,当i不等于j时,(A, i)和(A, j)哪怕棋子状态都是A,但是依然代表不同的游戏状态。于是,象棋的游戏转移也不会出现圈图。)
  接下来,我们假设每一位玩家都是理智的,当玩家处于游戏树的某个节点时,她/他必然会选择对其最有利的走法。假如现在游戏状态来到了倒数第二步,再走一步游戏将结束了,那么我们就会看到游戏树的末端,大概是如下图这样的,其中省略号表示未画出的末端节点
  在上图的游戏树中,如果在A处轮到先手玩家操作了,那么她/他必然会选择走向B。走向C和D对先手玩家来说都不是最优走法。于是,A虽然不是末端节点,但是它依然可以带有胜负信息(1,0),这个胜负信息表示先手方在A处只要按最优策略走就会获胜。当然,上图只是一个例子,有可能末端节点都不是(1,0)状态的,这时候对先手玩家来说最优策略就是走到平局状态(如果有平局末端的话),这样A节点将会带有(0,0)的胜负信息。如果是最坏情况,节点A下的所有末端节点都对应(0,1)的胜负,那么在A处无论先手玩家怎么走都必输,于是节点A带有的胜负信息是(0,1)。假如我们给胜负引入大小关系:(1,0)>(0,0)>(0,1),那么前述得到A的胜负信息的分析可以总结为:轮到先手方操作,A节点的胜负=A的下一级节点的胜负最大值。另一方面,如果在A处轮到后手玩家操作了,我们也可以通过类似的分析得到A处的胜负信息,只不过最大值要换成最小值:轮到后手方操作,A节点的胜负=A的下一级节点的胜负最小值。
  得到了A处的胜负信息之后,我们就可以忽略A下面的所有节点了,这时候A就成了一个末端节点,它带有相应的胜负信息,这个胜负信息表示从该节点出发,两位玩家都使用最优策略后会导致的胜负结局。这个操作可以继续进行下去,不断得到上一级节点的胜负信息,然后忽略掉旧的末端节点。如此往复,因为树是有限高的,最终我们会得到游戏一开始那个节点(术语叫根节点)的胜负信息。如果根节点的胜负信息是(1,0),那么意味着先手玩家只要按最优策略走下去就会必胜;如果根节点的胜负信息是(0,1),那么意味着后手玩家具有必胜策略;如果根节点的胜负信息是(0,0),那么意味着双方的最优策略会导致平局。至此,策梅洛定理证明完毕。
  从下往上的胜负信息推导
  如何确定谁才具有必胜策略:策略窃取
  想必读者已经跃跃欲试了,如果知道了象棋或者围棋的最优策略,岂不是在棋坛上横着走?可惜的是,虽然策梅洛定理的证明是构造性的,但是构造过程需要我们先得到整个游戏树,而像围棋这类棋,游戏的路径(指从根节点到末端节点的一条路径)比宇宙的原子数目还要多,要想通过整个游戏树来得到最优策略是不可能的了。如此说来,策梅洛定理仅仅给必胜或者平局策略提供了存在性。不过,借助策梅洛定理所提供的存在性,我们可以利用被称为策略窃取的方法证明在某些游戏上后手不存在必胜策略,换言之,先手有不败策略。
  本文将以著名的五子棋为例介绍策略窃取是怎么一回事。很明显,五子棋满足策梅洛定理的条件,于是有且仅有三种可能性:先手具有必胜策略、后手具有必胜策略、双方的最优策略会导致平局。接下来我们使用反证法。假如后手具有必胜策略,我们把这个策略称为S。这时候无论先手玩家怎么走,后手玩家只要使用策略S,先手玩家必输。
  策略窃取的要点就是把对方的策略"窃取"过来。先手玩家先在棋盘上随便放一个棋子,位置记为P1,然后假装这个棋子不存在。这时候轮到后手玩家放子了,由于假装P1上的棋子不存在,后手玩家成了"先手",而先手玩家成了"后手",于是先手玩家可以使用必胜策略S。根据这个策略的必胜性质,无论对方怎么走,"后手"玩家(也就是先手玩家)都将获胜。不过,事情似乎没那么简单。我们只是假装P1上的棋子不存在而已,实际上这个棋子是存在的。P1位置上的棋子会怎么影响到策略S的使用呢?假如走到了某一步,策略S要求"后手"玩家将棋子放在P1位置,这时候P1已经存在"后手"玩家的棋子了,但是游戏要求玩家每一步都不能不下棋子,此时"后手"玩家可以在这一步把棋子下在其他的任意位置,记为P2。这样的话P1和P2都占据了"后手"玩家的棋子,这就等价于游戏一开始"后手"玩家将棋子下在了P2,并且在目前这一轮"后手"玩家根据策略S的要求把棋子下在了P1位置。如果接下来策略要求棋子下在P2,那么"后手"玩家可以任意把棋子下在P3位置……如此类推,先手玩家可以完美使用策略S,于是会必胜。这和反证法的假设相矛盾。于是,五子棋只能存在两种情况:先手具有必胜策略、双方的最优策略会导致平局。或者更简洁地表述为,先手具有不败策略。
  回顾前述关于五子棋的讨论,这个"五"字完全没有体现出来,我们完全可以把相关结论推广到四子棋、六子棋等等。特别地,井字棋本质上是一种三子棋,由于它的游戏树很简单,我们甚至可以通过穷举法证明在井字棋上确实是先手玩家具有不败策略。
  在哪都能玩的井字棋
  转载内容仅代表作者观点
  不代表中科院物理所立场
  来源:中科院理论物理研究所
  原标题:DoctorCurious 26: 什么?象棋和围棋都存在不败策略?

神经刀王仕鹏的双面人生王仕鹏是个出色的射手,职业生涯最辉煌的时刻莫过于2006年世锦赛5。8秒绝杀斯洛文尼亚了,整场比赛一分没得,最后的绝杀全队,是不折不扣的神经刀。三分投起来手顺人挡杀人,佛挡杀佛,谁奥运金牌预测日本排第三,七成民众仍反对召开中文导报讯4月15日,东京都新冠病毒感染人数高达729人,继2月4日的734人后再次超过700人,打破了政府正在推行的蔓防中逐渐升高的最高纪录。而此时,东京都刚刚举办完距东京奥运会NBA未来超巨,日本奥运主力!混血八村塁俘获美女,审美似哈登说到哈登相信球迷朋友不陌生,曾经雷霆的第六人,如今成长为NBA的超级球星,连续3个赛季拿到得分王,哈登的进攻火力真的够猛!哈登被球迷记住的不止他的球技,还有他的绯闻,早期的哈登情感男乒周启豪下周期能成为绝对主力吗?估计希望不大,在中国,站队很重要。周启豪是刘国正带出来的。刘国梁不可能允许他派的担任国家主力,那样对自己是很大的威胁!很难!因为要看领导是否喜欢你,是不是他的嫡系,顺他者昌逆他者亡湖人主场战爵士,赢球定律,稳了?犹他爵士vs洛杉矶湖人北京时间202104180430星期日爵士方面消息人士透露,爵士后卫多诺万米切尔右脚踝核磁共振检查结果显示无结构性损伤。米切尔在获准回归赛场前预计将缺席数场比西媒巴黎今夏将签下登贝莱甚至曾考虑用内马尔换他根据西班牙世界体育报的消息,由于本赛季糟糕的发挥,登贝莱已经被推上了巴萨的转会名单,巴黎圣日耳曼将会是他的潜在下家。登贝莱与巴萨的合同在2022年到期,巴萨也无意延长与他的合同,因武磊在李铁的国家队就一定能打上主力吗?武磊在国家队最多算半主力!为什么这么说呢?这得从三个方面来看实力位置和目前的国足阵容来决定!武磊实力一般虽然武磊曾经是中超金靴中国足球金球先生,甚至还攻破过巴萨的大门,在中国足球这演员公开自己与KD私信尼克杨你应该改名叫拉塞尔直播吧4月2日讯近日,杜兰特在推特上与演员迈克尔拉帕波特(MichaelRapoport)之间展开了口水战。该演员将KD与自己的私信聊天记录公开。尼克杨看到了这场闹剧,在推特上别有同样是主教练,做人的差距怎么这么大呢?库里的疯狂还在继续,对于他来说,再创造什么样的记录和奇迹我们都习以为常了,只用静静地欣赏库里的逆天表演就够了。可能今天勇士主教练科尔的做法有点扫兴,三节42分,命中11记三分球。尤用你一个建议,你说怎么样才能让中国足球崛起?一般这种问题的解决办法可以从加强自身和打击对手两个角度去实施。不过对于你的问题前一个方向就算了吧,有那钱不如顾点人每次赛前把对手打一顿效果好笑哭首先,我认为你说的是应该是男足,现阶曝中超黑马突然隐身广州驻地空无一人,足协面临新危机聚焦中超和CBA,独一无二球迷媒体点击右上角关注,你不会后悔的2021赛季中超联赛即将开启,各俱乐部的备战已经进入尾声,随后16支球队将按照分组前往各自所在赛区。考虑到集中赛会制的
如何评价李宗伟?李宗伟,马来西亚羽毛球运动员,项目是男单,他是马来西亚羽毛球队最成功的男子单打选手,被大家亲切的成为拿督。1999年开始打正式比赛,2004年获得第一个公开赛冠军,2006年第一次香蕉船兄弟合照!4人全都入选75大,老詹兄弟们,我爱你们NBA全明星已经落下帷幕,在正赛中场休息中,NBA为了纪念75周年,举办了75大巨星典礼。这个典礼中,乔丹惊喜现身,也是让现场气氛达到高潮。除此之外,一些球队纷纷晒出自己球队入选的郎平元宵节美国逛街买衣服!姐姐拎包陪伴,离开女排半年气色佳中国女排正在筹备2022年的首次大集训,蔡斌教练要正式上任了。郎平如今则在美国,一位网友在元宵节当天逛街巧遇郎平,并且在社交媒体上发布了照片。郎平这是在逛一家叫lululemon的美国超级碗成反种族歧视舞台,有歌手在比赛中场秀单膝下跪引关注来源环球时报环球时报综合报道备受美国人关注的超级碗成为抗议种族歧视的舞台。第56届美国职业橄榄球大联盟(NFL)超级碗总决赛日前结束,美国传奇说唱歌手埃米纳姆在比赛中场秀中单膝下跪冬奥最新金牌榜中国9金创新高,反超美国冲上第三,英国终破荒北京时间2月19日,北京冬奥会来到第15个比赛日,今天会产生7枚金牌,目前在最新的金牌榜上,挪威队15枚金牌提前锁定了最终第一,德国队单日再添1金,11金基本上锁定了第二,中国队今金牌9比8!冬奥会最后1天,中国暂时反超美国杀入前3,创42年纪录北京时间2月19日,在今天晚间接近晚上22点的时候,中国冬奥会又传来令人震撼的好消息,我们在花样滑冰双人滑自由滑项目当中,隋文静和韩聪为中国队拿下了第九金,中国队更进一步取得了历史日本足协取消外援限制允许企业冠名中超不搞的我们都支持北京时间2月18日与2月19日这两天,新赛季的日本足球职业联赛(以下简称J联赛)拉开了序幕,18支来自顶级联赛的球队捉对厮杀,为球迷们奉献了9场精彩的比赛。除了比赛本身值得关注之外CBA今日两场对决,四川战上海难度极大,同曦战广厦还需努力新赛季CBA正如火如荼进行,目前已来到到第二轮,从总体上来看全华班对决更加精彩纷呈,几支豪强球队依然强势,吉林东北虎大比分输给北控让球迷非常意外,主要还是内线上的问题,如今广东辽宁第三届全国大学生冰球联赛在京开幕新华社北京10月20日电战马杯第三届全国大学生冰球联赛20日在北京奥众冰球馆开幕。高水平组的哈尔滨工业大学队在揭幕战中战胜吉林体育学院队,赢得开门红。本届联赛共有17支球队参赛,比与中国男足国家队风雨同舟得女记者李晌ampampquot近况2000年日韩足球世界杯足球专业媒体人(李晌)单骑走秀频频出镜,给球迷留下了深刻影响。这位苹果脸而俊秀特性的女中豪杰,多少使人联想到对军旅生涯特点的敬佩赛后她撰写的中国足球零距离也如果我们的国家足球队,人才如下,会不会有些希望?前锋苏炳添,刘翔?所谓隔行如隔山,身体条件最为出众的运动员未必就能踢好足球。涛哥就勉为其难的来分析一下题主所列的人员名单。题主所列举的前锋是刘翔与苏炳添,他们两人的特点就是速度特别快。不过足球世界里