您的位置:首页 >IT >

阿尔法攻击教练机(阿尔法go)

导读 阿尔法攻击教练机,阿尔法go很多人还不知道,今天乐天来为大家解答以上问题,现在让我们一起来看看吧!1、谷歌AlphaGo是什么?作为一种人工

阿尔法攻击教练机,阿尔法go很多人还不知道,今天乐天来为大家解答以上问题,现在让我们一起来看看吧!

1、 谷歌AlphaGo是什么?作为一种人工智能,AlphaGo与上世纪IBM打败国际象棋大师卡斯帕罗夫的深蓝超级计算机,以及同时代的苹果Siri和Google Now有着显著的不同。要解读AlphaGo,首先我们要知道AlphaGo的背后是什么。

2、 实际上,谷歌AlphaGo的背后是谷歌2014年收购的英国人工智能公司DeepMind开发的神经网络系统。与深蓝不同,这个系统不是超级计算机,而是由许多数据中心作为节点连接起来的神经网络系统,每个节点有多台超级计算机。就像人脑一样,是由50-100亿个神经元组成的,这就是为什么这种机器学习架构被称为神经网络。

3、 你可以把AlphaGo理解为《超验骇客》(传输)中约翰尼德普扮演的人工智能,它控制的超级计算机就像电影中人工智能控制的人类一样,共同服务于一个蜂巢思维。

4、 055-79000,人工智能控制的工人马丁。马丁没有思想,但是他看到的东西会被人工智能直接获得。

5、 AlphaGo就是专门为在这个神经网络系统上下围棋而开发的例子。不过,虽然名字已经介绍了它的功能,但是AlphaGo背后的神经网络系统适用于任何智力竞技赛事。

6、 这个系统的基础叫做卷积神经网络(CNN),是过去在大规模图像处理中表现优异的神经网络。常用于人工智能图像识别,比如谷歌的图片搜索,百度的图像识别功能。这也解释了为什么AlphaGo是基于卷积神经网络的。毕竟围棋的制胜原则是:

7、 游戏双方轮流将黑白棋子放在棋盘格子的交叉点上。棋子掉落后,不能移动。在下棋的过程中,围起来的“地”的大小决定了胜负。

8、 AlphaGo背后的系统也利用了一种叫做深度Q学习(DQN)的技能。强化的灵感来源于心理学中的行为主义理论,即生物如何在环境给予的奖励或惩罚的刺激下,逐渐形成对刺激的预期,产生能够获得最大收益的习惯性行为。不仅如此,AlphaGo借鉴了蒙特卡罗树搜索算法,在判断当前局势的效用函数和决定下一步行动的策略函数上都有非常好的表现,远超可以媲美人类棋手的最后一个围棋程序。

9、 DeepMind训练AlphaGo的步骤说明:以10万个大师棋谱作为初始数据,进行分类,用于训练策略函数;然后和自己下棋;强化训练策略功能,继续下棋;经过3000万步,进行回归分析,整合蒙特卡罗树搜索模型,训练效用函数。

10、 效用函数和策略函数分别对应AlphaGo的两个思维维度:棋盘的现状和自己/对手的下一步走向。

11、 AlphaGo采用的DQN是一种具有广泛适应性的强化学习模型。说白了就是不需要修改代码。如果你让它下围棋,它也能下围棋。如果让它在红白机上玩超级玛丽和太空入侵者,它就不会出生。作为一种基于卷积神经网络、采用强化学习模型的人工智能,AlphaGo具有很强的学习能力。它往往开始一个新的项目,玩几局就能获得比世界上最好的选手都强的实力。

12、 2014年,已经被谷歌收购的DeepMind用雅达利的五款游戏Pong,Brick-hitting,Space Invader,Underwater Rescue和Beam Rider测试了自己的人工智能的性能,发现在两三款游戏之后,神经网络的操控能力已经远远超过了世界上任何已知的游戏大师。

13、 DeepMind使用同一套人工智能,在不调整代码的情况下测试各种智力竞技赛事,取得了优异的成绩,证明了今天坐在李世石面前的AlphaGo的学习能力有多强。

14、 李世石是黑棋,AlphaGo是白子。大约85分钟后,进入休息阶段。

15、 在此之前,DeepMind进行的无数次虚拟象棋训练,以及去年击败欧洲围棋冠军魏凡二世的经历,已经让AlphaGo练就了顶尖的棋艺,这一水平恐怕高于世界上任何已知的围棋选手。

16、 AlphaGo的水平大概是六个专业段。用其他围棋程序的495局赢494局;在让4个孩子的前提下还是有75%的胜率。

17、 尽管棋盘上发生了变化,但AlphaGo和李世石在此战之前已经不在同一起跑线上了。据DeepMind披露,自去年10月5-0击败魏凡2段后,AlphaGo大幅提升了神经网络容量(数据容量)和与自己下棋进行训练的数据质量。而且优化了神经网络的分布式计算延迟,最终AlphaGo能够在两个小时的有限时间内击败李世石九段。

18、 AlphaGo只是DeepMind证明自己的一个工具。你也可以把这场对阵李世石的比赛理解为谷歌的公关策略。

19、 2014年,这家公司曾在其官网上写道:DeepMind致力于深入学习,以真正理解智慧。但对于DeepMind和谷歌来说,构建AlphaGo和其他人工智能神经网络并不是终点。

20、 将机器学习与神经科学相结合,创建了“通用学习算法”。DeepMind和谷歌希望通过这种算法来“定型”智能,理解什么是智能,进而更好地帮助人类理解大脑。DeepMind的联合创始人之一戴密斯哈萨比斯曾写道:

21、 用算法提取智慧,可能是理解人类思维最神秘原理的最佳方式。

22、 试图将智能提取到算法结构中,可能是理解我们大脑中一些持久奥秘的最佳途径。

23、 在谷歌收购DeepMind之前,收购的条款之一就是谷歌必须成立一个人工智能伦理委员会。所以,现阶段人们不必担心这样的人工智能最终会杀死或统治人类。不过,至少,人工智能在围棋这种智力运动上打败人类已经是注定的了。

24、 围棋作为一个庞大的决策树游戏,本来是适合人脑思考的,不适合机器操作。但DeepMind AI的方向是模仿人脑思维,用神经网络“复制”智慧。

本文到此结束,希望对大家有所帮助。

免责声明:本文由用户上传,如有侵权请联系删除!