今天,给大家来解读一下科幻电影中出现的机器学习技术。
钢铁侠和美国队长因为观点不同发生了激烈的冲突。钢铁侠先是被击中,从累积的美国队长的战斗数据中去进行搜索,来预测美国队长出拳的规律,从而扭转了局势。
这项技术就归功于钢铁侠战甲的机器学习能力。

在《美国队长3》中,钢铁侠与美国队长因观念冲突导致的内战,钢铁侠先不断挨揍来积累了大量的美国队长的战斗数据,再将这些数据进行计算,分析美国队长的出拳规律,从而扭转了局势。
这一针对对战数据进行的分析,归根结底就是钢铁侠拥有强大的机器学习的能力。

机器学习是通过对已有的数据或者经验的学习,来自动改进算法性能的人工智能的重要的研究方向。机器学习的目的把人类思考、归纳经验的过程转化为计算机,通过对数据的处理得出模型的过程。
计算机得出的模型能够以近似于人的方式解决很多复杂的问题。机器学习的核心是使用算法来解析数据,通过一系列的运算,从数据或者经验中学习,对某个任务做出决策或者预测,并对效果进行评估。
机器学习中的训练与预测的过程,可以对应到人类的归纳和推测的过程。

通过这样的对应,我们可以发现机器学习的思想并不复杂,仅仅是对人类生活中学习成长的模拟。由于机器学习不是基于编程形成的结果,因此它的处理过程不是因果的逻辑,而是通过归纳思想得出的相关性结论。
从20世纪50年代开始研究机器学习以来,不同时期的研究途径和目标并不相同,可以划分为主要的四个阶段。
第一阶段是20世纪50年代中叶到60年代中叶。这个时期主要研究有无知识的学习,在这个时期,由于缺少丰富的知识,远不能实现真正的智能研究。
最具代表性的研究成果是1952年创建的第一个真正的机器学习程序,也就是简单的棋盘游戏第二阶段,从20世纪60年代中叶到70年代中叶,这个时期主要研究将各个领域的知识植入到系统里,目的是通过机器模拟人类学习的过程。
在这个研究阶段,主要是用各种符号来表示机器语言,科研人员将专家学者的知识加入到系统里,并取得了一定的效果。

第三阶段,从20世纪70年代中叶到80年代中叶,开始从学习单个概念扩展到学习多个概念,开始把学习系统与各种应用结合起来,并取得了很大成功。
同时专家系统在知识获取方面的需求也极大地刺激了机器学习的发展,自动知识获取成为机器学习应用的研究目标。
20世纪80年代中叶开始,机器学习发展进入到了第四的阶段,机器学习已成为新的学科方向,它综合应用了心理学、生物学、神经生理学、数学、自动化和计算机科学等,形成了机器学习理论的基础,融合各种学习方法,并且形成了多样的集成学习系统的研究方向。

首先是选择数据,这里的数据可以分为三个部分,分别是训练用的数据、验证用的数据和测试用的数据。
有了数据后,第二步就需要对数据进行建模,使用训练数据来构建设计相关特征的模型。

得到数据之后,第三步就是验证模型,用之前准备的验证数据来验证建立模型的效果。
第四步是调试模型。为了提升模型的性能,使用更多的数据、不同的特征来调整参数,也是最耗时、最费力的一步。
模型准备完毕后,第五步使用模型部署,训练好的模型,对新的数据进行预测。最后需要测试模型,使用测试用的数据来验证模型,并评估模型的性能。

几十年来,机器学习的方法种类很多,常见的、最经典的可以分为三类,有监督学习、无监督学习和强化学习。

所谓有监督学习,就是我们通常所说的分类,也就是通过已有的信息获得一个最优的处理模式,再利用这个模式将所有的输入信息处理成输出信息,计算机通过对输出信息的简单的判断,将已有的信息分成不同的种类。
这样人工智能就有了对未知数据进行分类的能力。
比如家长经常教育孩子,苹果是能吃的,石头是不能吃的,苹果、石头就是输入信息,而家长给出的判断,能吃和不能吃就是相应的输出信息。
当孩子认知能力达到一定水平的时候,就会逐步地形成一种模式。遇到类似石头的东西就知道是不能吃的,有监督学习可以说是通过有标签的数据结合标定的结果的一个直接反馈,从而来预测结果或者未来。

与有监督学习不同,无监督学习并没有放置任何可以参考的样本或者已经分类的参考目标,给定的数据集也没有正确答案,计算机需要直接对已有的数据建立模型,挖掘潜在的结构。
也许有人会问,在没有样本的情况下,计算机如何自己建立模型呢?其实在人类思维的过程中,无监督学习是时常发生的。
比如我们对音乐并不了解的情况下,不知道是什么古典音乐,什么是摇滚乐,但我们依然能够自发地将其进行分类,这就是无监督学习,并没有人给我们模型将听到的音乐进行分类,但我们依然能够将不同的音乐区分开。
当我们根据某种事物的特性将其归为一类时,使用的就是无监督学习中的聚类分析法。俗话说,物以类聚,所谓的类就是具有相似元素的事物的集合。
聚类分析的目的是在相似的基础上收集数据并进行分类。

聚类分析的对象被称为描述数据,通过衡量它和不同数据源之间的相似性,就能把不同的数据源归到不同的类别中。比如我们找到一种植物,并发现它具有青菜的特征,只是颜色不一样,那么我们就可以将其归类为蔬菜中。
还有一类机器学习的方法, AI 在自己所属的环境中一边试错,一边寻找最合适行动的过程,被叫做强化学习。
首先清楚地表现出自己的行动和状况。其次要认识什么样的状况下采取什么样的行动,在该环境下会产生什么样的结果,然后从中学习并采取最优的行动。

学习的线索是获得的回报,回报是相对结果的停价值。比如在格斗游戏中让人类玩家和 AI 对战,最开始 AI 会毫无章法地出招,回报人类玩家的体力有一定程度的减少。
最初可能对玩家构不成什么伤害,但在反复的对战过程中,偶尔会对玩家造成伤害。AI就会记住场景,通过不断的对战,AI就会学习在什么样的情况下,采取什么样的招式可以削弱对方的体力。
机器学习有巨大的潜力来改变和改善世界,我们正朝着真正的人工智能迈进。比如目前火热研发中的无人驾驶汽车,通过机器学习可以实现自动导航,并实现安全的驾驶。

一个例子是交通标志的传感器,它使用监督学习算法来识别和解析交通标志,并将它们与一组标有标记的标准标志进行比较,这样汽车就能够看到停车标志,并认识到它实际上意味着要停车而不是转弯单向行驶或者人行横道等等。
