0完胜AlphaGo,alphago利用了哪些特征

结果是棋手每次平均面对35次选择。去平均值250个选项。这个数字被称为问题的“分支因素”，它是AI的祸根。如果你自己乘以250次评估可能的反应，你很快就会到达比宇宙中的原子数目多得多的位置，这将占据世界上所有的超过一百万年的电脑绘制出来的结果。事实上，直到去年，人们才真正计算出了多少。（大约是2.081681994 x 10 ^ 170，或者用简单的英文，二百个quinquinquagintillion。

）可能的棋盘状态的数量约等于2.081681994×10 ^ 170。由于没有人或超级计算机能够检查所有可能性，玩家依靠感觉和直觉。对于一个有经验的围棋选手，一个动作可能是感觉是正确的。其次，量化一个移动的价值是非常棘手的。甚至搞清楚谁胜利了也是一个挑战。国际象棋的棋子有明确的价值：棋子值1分、骑士3、一个车，5分。

通过比较拍摄的棋子的价值，你可以粗略地了解谁赢了。深蓝采用了数十个这样的经验法则来定位好动作。但是围棋没有固有的固定价值，他们只关系到彼此的关系。不确定的举动价值使决策进一步复杂化。第三，大多数情况下涉及某种交易。诀窍是找出你的对手想要什么，并强迫他们给你想要的东西作为回报。所以机器人的不变性就体现出来了。

最后，你交易的东西有抽象的价值，而这些价值并不总是可以量化的。除了要点，玩家可能需要影响力（后来可能会有用的棋子），sente（选择下一个玩的地方的自由度），还是aji（字面意思是“回味”，一个不可译的日语术语，表示潜在的诡计：一位教学资源解释道，就像是当你迟到的时候，鞋子里有一块石头，很疼，结果你不能跑得这么快，但是因为你迟到了，你不能停下来把它拿出来。

这是一个简单的例子。黑方可以用另外几个动作来封锁有价值的角点：黑色占据角落的领域。或者，黑方可以将角落的领土换成白色。作为回报，他们得到的棋子面向侧面和中心，这可能在未来（影响力）有用。标记的白色棋子被严重削弱，但对黑色后来（aji）可能变成一个复杂的滋扰。现在轮到黑方了，他们可以放置在任何他们喜欢的地方（先知）。

黑色交易角的潜力可以获得有影响的一个序列。你可以看到不可能把精确的价值观放在影响、aji和sente上。很像现实世界中相互冲突的价值 - 客户服务，股票表现和企业风险缓解。机器难以把握这种权衡的细微差别，因为这些实体是抽象的、微妙的，在概念上是截然不同的。在0和1中也不存在共同的同义词。尽管面临这些挑战，AI技术的稳步发展已经让AlphaGo掌握了这个游戏。

这些变化体现了AI如何发展到现在的状态并预示着未来。为了理解AI的前进方向，我们需要看看我们是如何达到现在的水平的。第一阶段：按照我的说法去做（20世纪50年代到60年代）人工智能的正式诞生发生在达特茅斯学院1956年的一次会议上，正式举行了一个宏大的前提：“智能的每一个方面原则上都可以被精确地描述，以便能够模拟一台机器。

AI的创始人从哲学家 - 数学家那里得到了他们的线索，比如最近开发了逻辑专用符号的Gottlob Frege和Bertrand Russell。根据这种方法的领导者，情报的关键在于运用逻辑规则。他们迅速建立了可以派生重要的数学证明的程序，并且自信地预言，在短短的十年时间里，计算机将会掌握国际象棋。但随后进展遇到困难。

没有人预见到一个障碍。第二阶段：规则和经验法则（20世纪60年代末至21世纪初）随着研究人员开始要求电脑解决复杂的现实世界问题，如诊断疾病或翻译俄语，事实证明，这些复杂问题中的许多问题只能在理论上解决，而不能在实践中解决。解决问题的时间和记忆要求往往会随着你有多深的寻找答案而呈指数级增长。研究人员放弃了“人工智能”一词，以逃避学术界和研究界的痛苦。

从某种意义上说，拯救AI是由于劳动分工。研究人员并没有试图对那些可以纯粹用逻辑做任何事情的机器进行编程，而是降低了他们的期望，并开始针对具体的问题量身定制个别的程序。限制程序需要解决的问题有助于限制必须搜索的可能解决方案的数量。程序员越来越多地开始按照人们的思维方式对AI进行建模。这通常意味着使用启发式或心理捷径。

我们一直使用启发式：鸡肉变得越粉红色，你应该把它放在烤箱里的时间越长。如果西红柿坚挺，就证明吃得很新鲜。需要更多的味道？添加更多的调味料。这些小知识是至关重要的。我们不能没有他们，因为没有足够的时间去完美地完成任何事情。第一次尝试构建Go-playing计算机的方式也是一样的。一段代码估计游戏得分，有一些例行程序可以识别先知，识别如何保护重要的棋子不被捕获，访问一个普通序列的库，等等所有高级玩家使用的专业技能。

0完胜AlphaGo,alphago利用了哪些特征

最近更新

相关文章

科技知识最新文章

问答排行榜推荐

科技知识排行榜精选

科技知识文章排行榜

热门标签