本篇文章4204字,读完约11分钟

雷锋。这篇文章来自于辛勤工作的开放班|阿尔法戈特别会议的分享。

分享嘉宾:业余围棋5,高。感谢业余围棋爱好者鲍云对此次分享的友好支持。

1.你觉得围棋圈的前两场比赛怎么样?在第一场比赛中,大多数球员可能都有一定程度的误判,认为李世石曾经是霸主。第二场比赛后,专业专家对人工智能的决策原则了解越来越多,他们的判断也在不断变化。

输掉第一场比赛后,每个人的情绪都很低落。虽然他们知道这一天迟早会到来,但他们都认为这一天并没有提前那么快,人类应该还能抵抗一段时间。然而,第二场比赛后,大家普遍提高了对人工智能实力的判断,很多人甚至认为柯杰现在可能不会赢。当晚,大批专业专家进行了深入的反思和讨论,尤其是李喆第六节。

(根据我得到的信息)在第一场比赛中,阿尔法戈应该总是判断自己的获胜概率高于一半,也就是说,我们总是说它有优势,而在第二场比赛中,它认为在一段时间的中间比赛中获胜概率是一半,也就是预测平局,这与大多数人类大师在解释时的判断完全不同,这是一个非常有趣的现象。

然而,游戏结束后,经过深入分析,我听到的声音越来越倾向于支持电脑的判断。也就是说,李世石在第一局棋中并没有优势,我们需要从电脑上重新审视“慢手”和“错手”。

第二,如何评价两个游戏中的人和机器之前所想的“错误”?

首先,正如我之前所说的,我个人同意李世石在第一场比赛中从来没有优势,所以没有转折点这回事。

计算机确实玩了一些常规国际象棋理论中有问题的把戏,并且赢了,但是这并不一定意味着国际象棋理论是完全错误的。

我想重复很多人已经提到过的一点,这也是我们看国际象棋时一个非常重要的信息:计算机下国际象棋的决定是根据着陆点随后变化的获胜概率来判断的。

在这里,我想引用第一天晚上李哲对第六段的解释:

在场的每个人都认为电脑的这一步走得很慢。然而,李喆认为这只手不一定是坏的,即使在计算机决策中,它也已经是最好的手了(事实上,这是肯定的,因为计算机是这样选择它的)。

如果电脑没有编象棋,左上角的黑棋可能会非常厉害。当然,这并不是说白棋不能这样下,但它背后的变化是相当复杂的。电脑应该判断获胜的概率不如实战,所以它选择了实战“慢手”来下象棋。

那么,有一个关键点。当时,每个人都认为计算机的方法根本不合理,但我们还是按照计算机的逻辑东山再起,而且有一种方法可以理解:

在这一步,大空被直接交给黑棋。在当地,这是一个严重的损失,但计算机选择了这种方法,然后每个人都认为黑棋有明显的优势,但赛后,农业小组说农业总是判断自己的优势。为什么?

许多白棋在左下方输了,然后经过几次简单的预备性交换,右边的点出来了,这被每个人认为是一个精彩的“赢家或输家”和一手精彩的赛后牌,但我们可能忽略了一种可能性:电脑已经在形势判断中计算出了这一步棋以及由此引起的后续变化。

也就是说,计算机知道,在这之后,它将在正确的一代中进行后续的改变,这是它的“权利”。因此,即使左下角的白棋遭受严重损失,它也会在抓住第一手牌后实现右边的“右”,白棋仍然是一个优势。

左下角的部分损失法可能会使它赢的更少,但它缩小了棋盘,这大大减少了剩余的空和棋盘上的变化。从人的角度来说,它缩小了棋盘的范围,并接近终点,这与ag的逻辑相同,只是ag可以通过获胜概率更准确地判断这一点。

因此,ag在选择左上慢手补棋时考虑了所有这些变化,左下输变化领先,并把随后的右边便宜点计入形势判断。经过所有这些步骤,棋盘已经大大缩小,白棋的情况是领先的。从计算机的角度来看,它获胜的概率一直在增加。

(当然,也有来自他人的一些意见,以及一些个人的推测性判断,这可能高估了计算机,但我认为我们应该高估它而不是低估它,更不用说结果了,这个推测很可能是正确的,而且ag已经看得很远了。(

第二,如何看待外部评价博弈中不存在“抢劫”的问题?

抢劫包含许多转化的可能性,这可能会降低获胜的概率,即使它只是从90%降低到80%,所以它不会选择抢劫。即使对人来说,在赢棋的情况下,也要注意简化情况,减少变化,尽量不要选择复杂的抢劫,增加赢棋的可能性。

有太多的象棋游戏没有被抢,没有什么特别奇怪的。如果你打,你就输了,也就是李没拼,这好像有点没骨气。许多人认为他没有表现出人类的优雅。(鲍云的观点)

第三,阿尔法戈和人类行走的区别

许多人说银和人类棋手不是一种围棋,围棋是基于获胜的概率,而人们通过在当地赢得几只眼睛和失去几只眼睛来判断,这并不简单。事实上,这种说法并不了解人类围棋的高水平。

正如我在回答前一个问题时所说,当接近最后阶段时,人类会选择赔钱但减少棋盘上的变化的方式来接近最后阶段。这是一个典型的决定,通过减少赢家的数量来提高获胜的概率。只是人类对概率的判断是建立在经验和直觉的基础上的,这应该不如成熟计算机的判断准确度。

但如果这是最佳解决方案,也就是我们所说的“上帝保佑”,情况可能会有所不同。我们目前的游戏是,如果我们在一个单一的整体情况下赢了,我们都会赢,而输赢的数量实际上是没有意义的。人们会犯错误,所以出现了我前面提到的“概率统计”的决策模式。但是如果现在有一个“上帝”,他用尽了围棋的所有变化,一点错误都不会犯,当他和李世石一起玩的时候,会发生这种情况吗?

棋手眼中 AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

当然,他无论如何都可以赢,所以从追求Go的最优解的角度来看,他可能不会用这个数来进行概率决策,因为他获胜的概率必须是100%,所以对他来说,最优解应该是尽可能增加获胜目标的数量。

这里我想举两个例子。

白棋136,根据最优解,应该在A位置。在这样一个相对封闭的空房间里,计算机不应该在计算方法和数字时出错。

然而,如果它作出这样的决定,它表明它相信,尽管它已经失去了一个目标,但它不太可能在这样一种方法的后续过程中犯错误(或类似的错误),因此获胜的概率提高了。还有一个让每个人都头疼的例子:

如果电脑前半部分的“慢手”可以在同一天快速解释,那么右下角的“错误”会让很多人难以理解。他们只能认为电脑真的错了,或者判断错了~因此,电脑不是无懈可击的。

按照人们的想法,这一步只需要跳一到四下,黑棋就会输得更快。

我随机放了黑色2,这意味着要领先。白色1在这里跳跃。如果黑棋第一,白棋保留拯救上面第三个儿子的手段,黑棋输得更惨。如果黑棋弥补了象棋的不足,那么输掉第一手棋将比实战更糟糕。

但是为什么电脑不那么慢呢?看完第二集后,我们对计算机的计算能力有了新的理解。更多的人认为计算机的计算水平不应低于这一变化,但赢得这一变化的概率不如实战。

这也是一个封闭的空,而人类提出的较低方法是最优的较低方法,这是毫无疑问的,因为在这个空,人类可以穷尽一切变化。但是ag呢?我相信可以。

第一天晚上,我总是不能理解这一部分,并认为这是一个计算机错误,但第二天,我慢慢地感觉到它的决策模型,虽然我不知道如何判断概率,必须认为这些后续的变化降低了获胜的概率。

4.如何预测下一场比赛的结果?

我不知道。如果我根据以上分析判断,我会高估电脑。

也就是说,电脑有可能赢,但出于情感,我支持李世石赢得一场比赛。

我们可以看到,计算机的某些部分可能不会选择最佳解决方案。这种“错误”是否是“错误”取决于“人们”能否用它来取胜。

我有一个大胆的猜测,如果你想打败这一代人工智能,它很可能是下一代人工智能,而不是人类的主人。

5.阿尔法戈对围棋的看法不同于人类

从开始到结束,计算机总是被获胜的概率所引导。因为很难准确判断概率,人们会用很多象棋理论和判断来做决定,但这些都包含了获胜的概率。人类总结的象棋理论是获胜概率最高的方法(人类判断)。至于眼睛数量的得失,它们只是一些同质的判断方式。

如果国际象棋理论的获胜概率被证明不够高,那就意味着国际象棋理论不够好,而其他人的国际象棋理论本身也在不断创新并接近最优解。因此,一些声称计算机不看象棋理论的说法是没有意义的。选择最优法则本身就是一种理论,人们可以用一种人类能够理解的方式来解释它,这就变成了国际象棋理论。只是人类对围棋的规则探索不够深入,我们的理解并不都是正确的。

棋手眼中 AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

简单地说,有太多不同的地方,但是客观地说,程序是有意义的,人们应该好好分析和学习。当然,程序并不完美。去吧,所以要批判地学习。(鲍云的观点)

读者问题:

“人们总是认为围棋太复杂,计算机无法控制它。结果,他们突然发现自己是控制不了它的人。”你怎么想呢?李莉:我认为这有道理。事实上,在未来,人类也可以用电脑来帮助训练他们的棋感,从而更接近最佳的行走。如今,许多中国职业棋手使用电脑“做功课”,并开发一些以前被认为“不好”的棋步。

我认为人类应该勇敢地承认自己的缺点,然后利用自己的优点。而不是用机器来比较计算。从古代中国的观点来看,它是人与自然的统一,人本身也是宇宙的一部分。

高::我的长期观点可以解释。早在阿尔法戈面试之前:

围棋的规律是客观存在的,人类更像是“发现”围棋而不是“创造”围棋。因此,人类围棋的发展史就是一部不断逼近最优解,不断发现逼近最优解的“规律”的历史。

一代又一代顶尖高手,不断提升人类围棋的巅峰水平,就是这样一个过程。

因此,许多业余棋手会问棋手类似的问题:历史上谁更强,每个人都会回答,但后者更强(通常)。

现在我们的计算工具已经如此发达,以至于它们已经达到或超过了人类的最高水平。将来,我们可以借助工具更好地探索围棋规则。因此,我个人希望将来会有一两个训练有素的围棋程序供大家学习(虽然我知道谷歌和脸书都是降维攻击,目标是人工智能而不是围棋)。

高:至于各种角度的嘲讽之声,我想口水终究会消失在历史的尘埃中。

虽然阿尔法戈赢了,但它的弱点是什么?

高::由于概率取向,它可能不会选择最好的,所以局部变化可能会犯“错误”。当然,在这两场棋赛中,ag只有在获胜的情况下才会做出这样的举动,所以对人类来说是没有意义的,人类不能用这些“错误”来取胜。

这种类似人类的“丢了眼睛,缩小了棋盘”需要强有力的控制,它正在显示自己的控制。

在前半部分,它的概率判断可能也有问题,但现在看来,它不一定比人类的巅峰状态更差,甚至更好~所以我认为它的弱点可能在于它不是“走神”。

(对于我们这些落后的人来说,这似乎不是一个弱点。)随着它变得越来越强大,人类峰会利用这些差距取胜的机会越来越小。

标题图来自:wordpress

标题:棋手眼中 AlphaGo对抗李世石用了哪些奇招 | 硬创公开课

地址:http://www.j4f2.com/ydbxw/8913.html