到底什么成就了今天的人工智能？

网舟科技

维基百科对智能有如下定义：

智能是一种能够感知或推断信息，并将其作为知识留存下来，自适应地用于某种环境或上下文的能力。

人工智能(Artificial Intelligence)

虽然我们很难对人工智能做一个确切的解释，但可以从查尔斯巴贝奇的分析机讲起。它虽然没有任何特殊的“自适应”能力，但却非常灵活。遗憾的是，理论上虽然完美，但却没有得以实现。

巴贝奇分析机早图灵机50年左右出现。从理论上讲，它能够将任何可计算的函数作为输入，并在完全机械的情况下产生输出。

复杂性理论(complexity theory)由此得以发展，同时人们也意识到构建通用计算机其实相对简单。此外，算法的实现也越发多样。尽管还存在一些技术上的挑战，但在过去的70年中，相同价格可购买到的计算量大约每两年翻一番。

也就是说，构建计算力强大的人工智能系统越发容易。然而，这受到了所提供或输入的数据，以及处理时间的限制。可以做如下思考：如果每台计算机的能力都受到数据和时间的限制，我们还能称之为智能计算机么?

下面我们简单回顾一下人工智能的发展史。人类的智能主要包括归纳总结和逻辑演绎，对应着人工智能中的联结主义(如人工神经网络)和符号主义(如吴文俊方法)。符号主义认为智能是基于逻辑规则的符号操作;联结主义认为智能是由神经元构成的信息处理系统。其发展轨迹如下图所示：

联结主义，即“橙色阵营”在一开始处于领先地位，得益于其与神经科学和人类大脑之间的关系。人类大脑被视为“强AI(Strong Artificial Intelligence)”和“通用人工智能(Artificial General Intelligence，AGI)”唯一的成功应用。然而，第一代神经网络在处理实际问题时屡屡受挫。因为神经网络多数是线性的，并且能力十分有限，深受外界质疑。与此同时，符号主义，即“蓝色阵营”利用严谨的数学理论创造出了更多有用的东西。

随着手工知识的积累，输入或输出数据量急速增长，系统的性能无法适应需求，联结主义逐渐衰败。就好比法律，专家制定出再完备的规则都有可能相互冲突，此时便需要越来越多的“法官”来解决这些问题。这减缓了联结主义的发展。

后来，“橙色阵营”获取了足够的标签数据和计算资源，能够在可接受的时间内对网络进行“训练”，世界各地的研究学者开始进行大量试验。尽管如此，联结主义仍花费了大量的时间使大众重新信任神经网络，开发人员也花了较长才适应了模糊逻辑和统计的概念。

在对人工神经网络进行详细讨论前，本文将先介绍一些其它方法：决策树、概率模型、进化算法。

决策树(Decision Tree)是最简单有效的算法之一。其“学习”是通过顺序地遍历数据的每个属性并找到对特定输出具有最大预测能力的属性来执行的。像随机森林这样的高级变体使用了更复杂的学习技术，并在同一个模型中组合多个树，它们的输出是通过“投票”得到的，这与人类的“直觉”类似。

概率模型(Probabilistic models)是统计方法的代表。概率模型与神经网络常共享架构、学习/优化过程甚至符号。但是概率模型大多受概率逻辑(通常是贝叶斯)的约束，而神经网络则无此约束。

进化算法(Evolutionary computation)最初是受到生物进化的启发，且以随机突变和适应度为主。由于修改通常是随机的，其限制噪声的效果突出。进化算法是一种引导式搜索，许多方面与退火过程类似。

上述方法有一个共同点:它们从较差的策略开始，逐渐对其改善，以期在某种性能评估方法中取得更好的分数。

如今，机器学习技术，尤其是深度学习正在主导人工智能的发展。与大多数使用1到2个中间抽象层(所谓的浅模型)机器学习方法不同，深度学习可能包含数百甚至数千个堆叠的可训练层。

研究学者认为对这样的深度网络进行训练，需要全新的优化程序。事实证明，使用梯度下降的逆向传播(即链式法则)即可很好的进行训练，也可使用Adam或RMSProp。

神经网络训练流程如下：

1、获取输入

2、计算输出

3、评估性能

4、调节参数

5、重复训练，至性能最优

梯度下降法只需调整参数使误差最小。但该方法容易使网络陷入局部最优，而没有获得最优性能。然而，最新研究表明许多神经网络已经能够获取全局最优解。

深度学习实现了训练的并行化，即分布式学习。能在同一时间跨多台机器训练相同的体系结构，同时实现梯度交换，加速超过1000倍。

此外，经过训练的网络可以处理相似的任务，即迁移学习，这也是人工神经网络广泛流行的重要原因。例如，经过图像分类训练的网络可以用于其他计算机视觉任务，自然语言处理和其他领域。更重要的是，同一个网络还可以用来解决不同模式的问题。

强化学习(Reinforcement Learning，RL)则将它们结合在了一起。RL的最初想法来自行为心理学，科研人员探究了在行为心理学中奖励如何影响学习和塑造动物的行为。

RL并不需要出现正确的输入/输出对，也不需要精确校正次优化的行为。举个例子，我们并不需要教会机器人如何精确移动，只需根据它走多远或多快对其进行奖励，它会自己找出正确的路线。然而，这种训练模式在实践中也是最具挑战性的，即使是相对简单的任务，通常也需要付出大量的努力才能正确设置。

在实际问题中，通常很难在环境中指定奖励，研究人员目前更多地关注内部奖励模型。

与RL并行的是逆向强化学习(Inverse Reinforcement Learning)：当完成复杂的任务时，强化学习的回报函数很难指定，我们希望有一种方法能够找到高效且可靠的回报函数，这种方法就是逆向强化学习。

通用人工智能中一些框架来自于严格的数学理论，一些受神经元回路的启发，还有一些基于心理模型。本文将以HTM、AIXI、ACT-R和SOAR为例进行介绍。

层级实时记忆算法 (Hierarchical Temporal Memory，HTM)，HTM算法旨在模拟新大脑皮层的工作原理，将复杂的问题转化为模式匹配与预测。它强调对“神经元”进行分层级，以及信息模式的空间特性与时间特性。

稀疏分布表示(Sparse Distributed Representation, SDR)是HTM算法中的一个重要概念。实际上，它只是拥有几千个元素的位数组。就像大脑中的信息总是通过亿万神经细胞中的小部分活跃细胞来表示一样，HTM使用稀疏分布表示语义相关的输入。

HTM算法中的抑制(Inhibition)类似于批规范化和其他一些正则化技术,提升(Boosting)在机器学习中已经是一个相对较老的概念,层次结构(Hierarchical Structure)并没有真正的大脑皮层的结构灵活。HTM对物体间关系的重视程度低，甚至连稀疏分布表示也可以用普通神经网络构建。总体来说，HTM需要进行大量调整才能获取与其它机器学习算法相当的性能。

接下来介绍AIXI，它是一个对通用人工智能的理论上的数学形式化表示。然而，它有一个显著的缺点——无法计算。事实上，许多机器学习算法均不能精确计算，只能做近似处理。AIXI表示如下:

AIXI的核心是一个强化学习智能体，在诸多方面与Schmidhuber开发的Godel Machine类似。然而，它们都是AGI的描述性模型，复杂程度高，无法执行，但不可否认，它们都是人工智能研究人员的灵感源泉。

相反，ACT-R，即理性思维的自适应控制系统 (AdaptiveControl of Thought—Rational)，它不仅是一种理论，而且是一种用LISP编写的软件框架。

ACT-R主要关注不同类型的内存，较少关注其中数据的转换。该理论试图理解人类如何获得和组织知识以及如何产生智力活动，其研究进展基于神经生物学研究成果并从中得以验证，且已成功地为许多不同认知现象建立起合理的模型。然而，它在实际应用中并未取得成功，最终只作为研究人员的工具。SOAR与ACT-R有着相似的根源和基本假设，但它更关注于实现AGI，而不是建立人类认知的模型。

ACT-R和SOAR是人工智能符号主义的经典代表，在认知科学的发展中起到了重要作用，但是应用它们相比现代联结主义需要更多的配置和先验知识。此外，神经影像和其他用于心智研究的工具越发详细和准确，而且ACT-R和SOAR在某一定程度上过于僵化，无法保持相关性。

人工智能

大多数个人电脑、智能手机和其他设备的硬件性能非常相似，由操作系统定义，通过下载其他软件“学习”。早期计算机的学习完全依赖于与人类的交互，而现在则通过互联网接收更新。

随着越来越多的数据存储到云端，服务器代理的作用不断增强。这些代理负责计算密集型任务，类似于中枢神经系统。相反，面向消费者的电子产品正在改善它们的输入/输出能力，变得有点像外围神经。

由此也衍生出了物联网。在物联网中，拥有数十台高度专业化的微型设备，每台只执行一项或几项功能。基于云计算的中央“大脑”负责协调所有设备来控制房屋、工厂甚至整个区域。

相比之下，机器人技术专注于更加自主的主体。机器人必须实时处理复杂的现实情况。自动驾驶汽车就是典例:

图中简化了结构，真实的系统有超过100个传感器，具有恒定的输入流。自动驾驶汽车的设计是当今人工智能研究中最困难的领域之一。

面向消费者的机器人只是人工智能研究中的微小分支，是一个相对较新的趋势，而大多数机器人是为工业和军事需求设计的。与武装无人机或核电站控制员的失误相比，自动驾驶出租车的不当行为更像一场小型事故。此类系统的策略编程不依赖于黑盒算法，但其工作的每个方面均需要严格的数学规范。

量子世界(Quantum world)

量子力学是人工智能和生物智能的共同基础。量子力学的出现，为以半导体为核心的计算机技术奠定了基础。

300多年前发展起来的计算行星运动的数学方法作为了反向传播和梯度下降的基础。概率论、统计力学和矩阵力学成为了量子力学的基础，是现代人工智能的近亲。目前，深度学习就像炼金术，物理学则可以帮助我们更好地理解它。

虽然量子计算机还处于起步阶段，但目前的实验表明它能有效地加速处理某些优化问题。例如，玻尔兹曼机器是一种人工神经网络，但难以在大多实际场景中进行应用，所以研究学者提出了一种受限的变体，成为最早的深度神经网络之一。量子计算机则有可能结合玻尔兹曼机器和其它概率模型的全部计算能力。

理解量子力学非常难，概率振幅只是冰山一角。尽管许多人批评人工神经网络的解释性很差，但他们也无法直观地描述量子力学。

生物智能(Biological Agents)

生物智能存在了约30亿年。地球上数百万种生物都有一个共同点:DNA。

DNA是细胞的“中枢神经系统”。人们认为，在基于DNA的生命出现之前就有基于RNA的生物体，它们在功能和结构上非常相似。

生物学家们在很长一段时间里都认为，约98%不编码蛋白质的DNA是无用的。但后来的研究发现，它们在控制编码DNA以适应动态环境中起着关键作用。DNA自身的某些部分可能会被甲基化失活，但这是可逆的，且在整个生命周期中发生多次。

现代科技已能合成和编辑我们想要的DNA，人工和生物智能已无太大区别。

细胞(Cells)

具有基本功能的细胞称为原细胞：

它们代表了最初生命有机体的样子。大约30亿年前的地球环境模型表明，在足够多的核苷酸中能够捕获脂类气泡，从而产生第一个基因组，而基因组又能通过从周围环境中捕获营养物质实现复制。在积累了足够数量的基因和其他化学物质后，这些气泡在内部压力的作用下分裂。

另一个简单的例子是病毒。两者的主要区别在于病毒不维持内部代谢，需要利用其他生物体进行自我复制。病毒的基因组通常很短，只编码1到2个蛋白质。然而，病毒可以通过DNA交换与宿主进行“交流”，这一过程称为水平基因转移。许多单细胞生物都有这种能力，它在整个进化过程中扮演着重要的角色。

相比之下，细菌可以对不同的化学物质，光，压力，温度等进行感应。许多细菌在分子水平上具有类似于普通内燃机的运动机制。

此外，它们有相当强的沟通能力，可以成群结队地聚集在一起，能借助自身基因组和周围的蛋白质消化大量的营养物质，并执行相当复杂的行为。它们的结构与原细胞和古细菌非常相似。

真核细胞与此相反，它们有许多细胞器。其中，像线粒体和叶绿体都有自己的DNA片段，在过去可能是独立的生物体。此外，线粒体在克雷布斯循环中发挥着至关重要的作用，能够促进新陈代谢。

真核细胞内部结构虽然复杂，但缺乏自行移动的能力。动物细胞也缺乏叶绿体和细胞壁，使其失去自主性。生物细胞虽然逐渐失去了独立生存的能力，但却获得了更为复杂的“社会”能力.但动作电位信号仅限于源细胞和与其有直接膜-膜连接的细胞。它可以通过信号分子传递给其他细胞，但过程耗时长。大多数动物进化出了专门的细胞——神经元克服该问题。

神经元形状各异，可以长出新的突触或移除旧的突触。外围神经元通常只有几百个连接，而中间神经元的连接可能超过10000个。这些机制使它们能够快速移动信号，并通过调整突触强度进行转换。此外，脊椎动物的许多轴突都有髓鞘，可以使电位移动得更快，同时激活更少的膜通道，节省能量。

下面介绍到目前为止研究得最好的神经系统之一，线虫：

研究人员对其进行了长达50年的剖析，了解其全部302个神经元的详细结构，其中包含5000多个突触：

即使只有302个神经元，研究人员也很难判断它们在做什么。它们持续地“学习”，且功能可能会实时变化，而人类大脑拥有数十亿个细胞。

考虑到复杂性，神经科学的大多数研究都集中在特定的区域、通路或细胞类型上。大多数进化的旧结构负责呼吸、心跳、睡眠/苏醒周期、饥饿和其他重要功能。大脑皮层是最受研究人员关注的。

大脑皮层是一层折叠的层状薄片，厚度约为2-3毫米，大脑的其他部分被一块类似于餐巾纸的结构所覆盖。

大脑皮层涉及一些高级认知功能，如语言、意识、计划等。新皮层约占大脑皮层的90%。

另一研究充分的区域是海马体：

所有的脊椎动物都有一个类似的结构叫做苍白球，但哺乳动物有一个更进化的版本，海马体。它在空间记忆和情景记忆中起着至关重要的作用，其功能类似一个时空地图。有了这张地图，大脑就可以把复杂的记忆储存在专门用于视觉、听觉和其他表现形式的区域。

最初对大脑的研究集中在损伤外伤和内部损害上。在大脑皮层中，大脑区域缺失和认知功能缺失之间的相关性较弱。研究结果表明，记忆分布在整个大脑皮层，甚至在手术切除邻近神经元的某些部分后，还可以重新学习缺失的功能。研究人员提供了如下区域图:

但上图在实际和理论两方面都缺乏精确性。在实验环境中，你可刺激大脑的某一部分，观察其反应。但是，除了主要的感觉和运动区域外，得到的结果并不准确。另一方面，功能性磁共振成像可以跟踪受试者，判断在执行某些任务时大脑的活跃部分，但这些区域并非专门处理特定任务，结果也不准确。同时，功能性磁共振成像实际上是在测量氧气的供应水平，所以仅仅测量单个神经元的活动水平是不够的，就像这样:

大脑活动的另一个有趣的特征是它以波的形式进行：

以上研究能够帮助理解和治疗神经系统疾病，却并不能描述人类的行为。但是，这种自下而上的思维研究方法仍然取得了重大发现，比如基于神经活动来预测一个人的选择，以及大脑没有“中心”部分。

从心理学角度分析，人类行为在很大程度上受到遗传、文化和环境因素的影响。智商及智商测试方法是其中最著名的研究成果。虽然有理论试图对智力做出解释，如多元智能理论，智力的三位一体理论等，但并未被广泛接受。

这些理论的主要问题在于没有提供一种定量证明的方法。即使是像走路或说“嗨”这样简单的行为，涉及到的神经结构也极其复杂，再加上考虑到每个细胞内DNA和其他生物机制的复杂性，对神经科学研究的做出心理学解释往往比实验本身还要复杂。

什么是智能?

答案虽然多样，但到目前为止都没有一个被广泛接受的统一理论。也许AIXI和IIT的结合会推动其产生。要把两者结合起来，需要一个奖励的概念，这个概念可能来自医学和经济学，适用于每一种人工和生物智能。

当前几乎所有的智能衡量都基于某些任务的性能，这在瞬息万变的现实环境中不够灵活。或许，将意识定义为“任何可能的经验”，以及与AIXI背后的智能框架相关联的IIT框架，可以提供一幅更广阔的认知图景。

任何主体工作都可以被描述为量子系统的波函数，但这不仅难以计算，还对习得的中间表征以及生物智能和人工智能的解释提出了巨大的挑战。

虽然人工智能的进步和对人类智能的深层次理解有着巨大的应用前景，但仍存在一些挑战：

1、隐私(Privacy)

2、偏差(Bias)

3、一致性(Alignment)：大多数人工智能训练都是基于效用最大化或误差最小化，而这些目标函数并不能代表所有的人类价值和道德。

4、替代(Displacement)：科技取代人类完成特定任务已经有一段时间了，但人类的进化比人工智能要慢得多。

5、网络攻击(Cyberattacks)

6、心理工程(Psycho-engineering)：大量的心理实验和历史教训表明，即使没有任何暴力倾向的人，如果被适当地操纵，也会对别人造成伤害。

-END-

来源：聊数大数据

免责声明：部分文字及图片来源于网络，仅供学习、交流使用，不具有任何商业用途，版权归原作者所有，如有问题请及时联系我们以作处理。本声明未涉及的问题参见国家有关法律法规，当本声明与国家法律法规冲突时，以国家法律法规为准。

长按上方二维码识别

即可快速关注我们的公众号！

【网舟科技】

网舟联合科技（北京）有限公司，官网（www.eship.com.cn）成立于2004年，注册资金2000万元，目前拥有13年互联网大数据服务经验，公司长期专注于金融保险、通信、互联网、旅游酒店、新零售等行业的电子渠道大数据运营，为客户提供全球领先的电子渠道转型咨询、大数据挖掘和应用定制服务，助力客户互联网转型，提升数字化运营和数据营销能力。

网舟科技是Adobe数字营销的全球解决方案级合作伙伴，具备一流的数字营销一体化解决方案能力。

继续滑动看下一个