AlphaGoZero跟完美的围棋之神有多大差距?
问题有点多而且复杂,拿了张草稿纸写了写才算想明白了些…
先说说贴目吧,围棋由于符合策梅洛定理中的规定条件,无论贴目是多少:
“要么黑方有必胜之策略、要么白方有必胜之策略、要么双方也有必不败之策略”。
只要对围棋和围棋ai有些了解的人来说,很轻易可以发现在贴目为6.5时,黑棋优势,贴目为7.5时,白棋优势。而这点优势如果交由围棋之神掌控,那就是胜势,即便对手也是围棋之神。因为在正常情况下,只要贴目不为正数,就不会有平局出现
那这就存在一个问题:如果贴目为7时会怎么样?
刚开始我也被这个问题困扰了一会,后来突然转念一想:在贴整数目的情况下,双方最接近的情况也就是赢或输对方1目。举个例子:假如你执黑棋先行,需要贴给对方7目整,如果你能赢对手1目,那么即使你在贴7.5的情况下也能赢0.5目;而如果你输对手恰好一目,那么即使你少贴0.5目你也照输不误。因此:
围棋在某个整数贴目下双方都是有“必不败策略”的,而目前来看很可能是7目。但可能双方中有一方必胜策略可能要多于对方,可能有一方只有很少甚至只有一种“必不败策略”,不过对于参透了一切变化的围棋之神来说,贴7目,无论执黑或执白就已立于不败之地…
另外,由于围棋双方目数总和一定是361目,因此,在贴偶整数目的情况下,一定不会有平局出现(除非出现有眼双活的特殊情况)
不过,这其中还有个非常重要的点需要指出:以上都是建立在常规规则之下的分析,即平局只发生在双方终局之后目数完全相同的情况下。而围棋还有“三劫循环”,“四劫循环”,“多劫循环”的局面,这种情况下是会判处无胜负(可以理解为平局)的,那会不会出现形势不利的一方去努力形成复杂的无胜负局面来形成平局?暂时不得而知,这好像得看目前围棋ai对无胜负局面的理解以及目前围棋ai胜率中是否完全考虑了无胜负这种情况。。。
针对“有某一最优解的围棋局面具备的特征”再做一点讨论:
我说说我对于“有某一最优解的围棋局面具备的特征”这一问题的看法:
除去一些显而易见的,一眼就能看出最优解的局面(比如两条贯穿全盘的大龙对杀,仅一气之差),其他的貌似走哪都行,你去问不同的职业棋手,会得到与之棋风大致相匹配的答案,去问ai胜率也只浮动1个百分点以内的局面,以目前人类的技术水平来说,很难找到真正的最优解。即使你拿着顶级ai让他就对着这一张图使劲训练,得到了精确到小说点后几十位的胜率,发现其中某个点应该更好。那最多也只是目前人类的技术水平下的最佳,是否能得到ai的认可尤未可知。因此目前来看是否有最佳解的局面之间还有很大的一段未知地带,也不用说是否能有人给出有唯一最优解围棋局面的特征了。。。
围棋之神是必然不可能有认输功能的,也完全不需要一个函数或者模块去判断是否需要认输。因为它参透了围棋的所有变化,也只知道围棋的所有变化。这么说的原因是围棋之神的胜率只有100%(必胜)与0%(必不胜即输或平)两种,而这种胜率是建立在对方也是围棋之神的情况下才有意义的,且如果真的对手是另一个围棋之神,那必败的一方开局认输,贴7目整的棋局双方随便走一走一平局收尾也是合情合理。但如果他的对手是你我凡夫俗子,抑或是绝艺、AlphaGo这种顶级ai(其实在围棋之神眼里并没有什么区别),那它就不能再在开局自认为必败时认输,因为它的对手实力远逊于它,这样做很不合理。
因此我们的围棋之神需要选择一种最佳下法继续棋局。在此指出题主一处错误,此时围棋之神不应该是采用“双方理想情况下,子差最小”的下法,而应该采用“尽量将局面导向混沌,即最复杂的下法”,不过如何定义“最复杂的下法”还有待考究,但一定不等同于题主所说子差最小。原因就在于围棋只有胜或负两种情况(不考虑平),输半目与全盘没有活棋并没有区别(当然面子上过不去),比赛的奖金不会因为你只输了半目而多分你一点,所以在劣势局面下,释放胜负手是唯一的选择(总好过安乐死)。所以围棋之神也需要在开局自认为必败的情况下释放它自认为的“胜负手”,尽可能让局面变得复杂。
再回答题主比较关心的一点:围棋之神究竟能让AlphaGo几个子?
由于围棋之神现在并不存在,AlphaGo也已退役,所以拿其他对局来进行参考:
最近一次人类与ai的正式对局应该是去年年底李世石的退役三番棋,与韩国本土ai韩豆的受2子、分先的对局。
李世石引退赛第一局三番棋中最大的亮点应该就是第一局李世石的黑76天外飞仙
神之一飞这一步不仅当场击溃韩豆,就连绝艺、星阵等其他顶级ai也都没有看到。
图1图1:韩豆当时应该只看到了黑1大吃的手段,所以提前用白 与黑棋做了交换。
图2图2:白棋如果打完想要压出,黑4可以与白5交换,然后吃掉中腹棋筋。
图3图3:如果白棋打完粘上,黑4与白5交换后,有黑10位妙手,恰好能够将白棋棋筋吃住,白不行。
图4图4:白1最强应对