《认知》——赫伯特·西蒙

引言

人是如何接受信息、存储知识并对相应的场景做出反映,一直以来都是认知心理学的研究重点。赫伯特·西蒙在《认知:人行为背后的思维》一书中详细讨论了人类认知的产生与形成过程,为我们了解大脑认知的层次结构描绘了一幅清晰的画卷。总的来说,本书主要讨论了以下几个问题:

信息加工心理学

信息加工心理学的理论基础是物理符号系统的假设。研究表明,人脑具有思维和解决问题的能力,可以认为人脑具有物理符号系统的功能。人可以解决各种各样的认知任务。实验材料证明,信息加工理论能够解释人类完成认知任务的心理过程。人在复杂的环境中生活,他必须适应环境,否则就不能生存下去,这是进化论的基本观点。适应环境的需要使人发展了各种各样的认知技能,也使人产生了有限合理性的行为。所谓有限合理性的行为,是指人并不一定要确切地解决复杂的问题,而只希望得到满意的解决,满意的程度则取决于人脑的能力和所获得的信息。然而,对问题的满意的解决也促进了确切的解决。因为人的行为的有限合理性,所以,在一般情况下人并不进行大量的计算,以得到确切的解决,而只借助于启发,以获得满意的解决。另外,人能够把注意集中到某一活动上,这也是能使人适应复杂环境的基本机制。总之,以有限合理性满意地解决问题,运用启发式和能集中注意,这是人脑的信息加工特点。

从信息加工理论来看,人脑神经系统的组织结构包括三个部分:输入、记忆和输出装置。了解了记忆的组成(短时记忆和长时记忆)及其工作原理,我们就可以预测人在一定情景下的活动。记忆量的单位叫作组块。无论是视觉信息还是听觉信息,组块在短时记忆中保持的时间都不到1秒。短时记忆的输出比较快,1秒钟约可以输出5个组块,其输入也比较快。然而短时记忆的容量却很有限,一般是6个左右的组块。所以,短时记忆的功能就是保持那些工作中需要的信息。对口语记录的分析表明,被试的短时记忆的内容是随时在更换的,它总在不断地输入和输出。计算机也有类似的情况,它的存储也有水平上的差别,有提取快而容量小的存储,也有提取慢而容量大的存储。前者用于当前的计算,后者用于以后的计算,这与人的记忆是一样的。

短时记忆是非常重要的,它直接决定了人当前的活动。顺便提一下,人即使做一件很简单的事情,如算一道乘法题,由于短时记忆容量有限,也需要一些长时记忆里的信息,或是外在记忆的信息,如用纸笔记录下来的材料。

人的长时记忆的容量是非常大的,但是,它的输入和输出很费时间。一般输入一个组块需要8秒,输出一个组块需要2秒。长时记忆有以下几种不同的信息:(1)用于再认熟悉事物所需的信息,如EPAM系统进行再认时所利用的长时记忆中的信息。(2)各种图式和知识结构。当我们再认事物时,首先出现的是事物的图式。有了这些知识图式,就能迅速地再认事物,即产生直觉。(3)执行活动所需要的产生式。至于数据与加工过程之间的界限、两者在脑中的呈现方式,目前还是不清楚的。

人的长时记忆的容量是非常大的,但是,它的输入和输出很费时间。一般输入一个组块需要8秒,输出一个组块需要2秒。长时记忆有以下几种不同的信息:(1)用于再认熟悉事物所需的信息,如EPAM系统进行再认时所利用的长时记忆中的信息。(2)各种图式和知识结构。当我们再认事物时,首先出现的是事物的图式。有了这些知识图式,就能迅速地再认事物,即产生直觉。(3)执行活动所需要的产生式。至于数据与加工过程之间的界限、两者在脑中的呈现方式,目前还是不清楚的。

认知的基本信息加工过程

一般来说,人类认知有三类基本过程。第一类是问题解决。问题解决采用了启发式方法,其中的一种是手段-目分析法,即解题者通过当前情况与目标的不断比较而找到一个更好的算子。另一种是计划过程。这是一种简约的解题过程,当然,根据具体的任务又可采取不同的策略,例如解决河内塔问题时有知觉指导和机械学习等策略。

人类的第二类基本认知过程是模式识别。人要建立事物的模式,就必须认识元素之间的关系。元素之间有各种关系,例如等同关系、连续关系等。根据元素之间的关系,就可以构成模式。解决问题和认识系列模式之间具有共同性,这在科学发现的研究中可以得到应用。

人类的第三类认知过程是学习。学习就是获取信息并把它们存储起来,便于以后使用。学习有不同的形式,一种是辨别学习,如EPAM就是模拟的辨别学习;另一种是阅读和理解,如UNDERSTAND程序;第三种是样例学习,它可以创造出新的适应性的产生式。然而,我们还不十分了解人类的学习活动。随着研究工作的进一步深入,一定能发现以上三种学习以及其他学习形式的内部过程。

人的内部表征是信息在长时记忆中存储的方式问题。关于这个问题的讨论仅仅是开始,还有很长的路要走。这方面的研究有一定的困难,我们对视觉表象这类问题还不十分清楚,因为信息存储的内部结构不能直接为人所观察。我们不能像计算机那样把解题过程打印出来,只能通过间接的办法进行研究。我们可以用计算机模拟的方法来研究表征。可以假设表征的方式是一张有许多节点的图画。这看起来是心理学上联想主义的古老看法,但是,把这一假设与计算机联系起来,就可以使研究更加细致。我们虽然提到了一些研究,但是对这些问题的最后解决并不能表示乐观,但也不能悲观。

RL与通用人工智能

在本节中,将讨论RL是否可能是未来发展通用人工智能(GAI)的合适手段这一问题。在最近的一篇论文中,Silver et al. (2021)认为,为了在agent中形成智能行为,所需要的只是一个奖励指标,该指标将通过代理实施的一些学习程序而达到最大化。该假设可称为:“奖励是足够的(Reward-is-Enough)”。具体可表述为:智力及其相关能力,可以被理解为agent在其环境中行动时对奖励的最大化的附属产物。

该假设背后的假设如下。如果一个agent被置入到一些环境中,它必须学会以一种方式行事,从而使给定的累积奖励指标得到最大化,agent最终会发现越来越复杂的行为,以实现给定奖励指标最大化的目标。因此,从长远来看,代理将发展足够复杂的能力,最终被认为是智能的。Silver et al.(2021)认为,他们论文中讨论的奖励最大化任务与RL的概念完全兼容。因此,RL可能会在未来引起GAI的出现。

此外,他们的假说甚至可能对包括人类在内的动物中存在的自然智能的出现做出适当的解释。试图将自然智能的出现解释为解决一个单一问题的副产品,即进化压力的副产品,这种方法已经在人工智能 (Davis, 1998) 和进化心理学领域的早期工作中被采用。因此,似乎有很多人支持相信这个假说,认为它可能是解决智能最终在自然界中如何和为何产生的问题。

然而,当使用Reward-is-Enough假说来解释自然智能的出现和未来如何达到GAI(例如通过RL)时,我们必须注意这两种情况之间的微妙差别。在谈论自然智能的进化时,我们考虑的是发生在整个个体群体中的进化过程,而不是个体内部的智能进化。然而,当考虑到未来在Reward-is-Enough的背景下出现的人工智能时,人们关注的是人工智能如何在一个可能有无限寿命的单一人工代理中出现的问题。这种差异是由以下原因造成的。有一些证据表明,人类智能取决于生物因素(Bouchard, 2014)。因此,如果一般智力水平是由生物体规定的,例如由一个所谓的因素\(g\),自然智力不可能同时由个体内部的奖励最大化引起。请注意,Silver等也承认这种微妙的区别,它的重要性在于它表明自然进化在形成自然智力方面的成功不能被看作是对Reward-is-Enough假说在发展GAI方面的合理性的直接支持。由于RL被认为是测试Reward-is-Enough假说的合适手段,提供一个证明该假说真实性的实际实施是特别重要的,因为尽管在RL领域已经进行了大量的企业和学术研究,但是还没有公开的案例表明GAI是从训练RL的agent中产生的。

在下文中,我想对GAI可能产生于RL的观点提出质疑。回顾一下,当代RL的研究利用(循环)神经网络架构来实现代理人的决策策略。到目前为止,在当今可用的硬件上可以训练的网络架构的模型容量是否大到足以容纳导致真正智能行为的决策策略? 此外,最终所有的神经网络架构都可以被看作是单一的、连续的信息处理流。相反,生物大脑(是目前唯一已知的真正智能的来源)是由多达上千亿的神经元组成的,这些神经元经常被观察到形成集群、与专门的认知能力相关,神经元之间在并行地工作。从这个角度来看,人们可能会问,只利用信息处理的顺序流,而不利用允许真正平行信息处理的分布式系统架构,是否是寻求出现GAI的适当方法。另外,正如Davis (1998) 所论述的,进化过程往往不能提供对某些问题最有效的解决方案。因此,从工程的角度,而不是从进化的角度来处理开发GAI的问题,可能最终会导致更有效的解决方案。

个人感悟——AI与认知

人脑从功能的角度可以分为几个模块:寄存器、短期记忆、长期记忆、中央控制模块。人脑通过五种感官——触觉、嗅觉、味觉、听觉和视觉,从外部接受信息,存储在寄存器中,如果我们的注意力关注这些信息,大脑可以把这些信息变成短期记忆里的内容,短期记忆可以持续30秒左右,如果我们有意识要记住这些内容的话,大脑又会将短期记忆中的内容转存到长期记忆中。

长期记忆的内容既有信息,也有知识。简单来说,信息表示的是世界中真实存在的事实,而知识表示的人们对世界的抽象理解,两者之间不一定有明确的界限。人在长期记忆里存储信息和知识时,新的内容和已有的内容联系到一起,规模不断增大,这就是长期记忆的特点。长期记忆实际上存在于大脑皮层,记忆意味着改变细胞之间的链接,构建新的链路,形成新的网络模式。

现在的人工智能是没有长期记忆的,更无法自动从感官输入中构建对世界的抽象认知——也就是我们俗称的知识。无论是AlphaGo,还是ChatGPT,都是重复利用已经学习好的模型或者已经被人工定义好的模型,不具备不断获取信息和知识,并把新的信息与知识加入到系统中的机制。

如何为AI构建认知能力是人工智能下一阶段的前进方向,空间认知作为一种最简单的认知能力,或许会成为构建基于认知AI的突破口。畅想未来某一天,有可能构建这样一个系统,在这一系统中有感知输入模块,有认知—记忆模块,有动作输出模块,系统能自己不断去读取数据,能把数据里面的知识压缩后放入到长期记忆模块。构建具有长期记忆与空间认知的智能系统,正是我们现在的初步愿景。

参考文献

  1. 西蒙. (2020). 认知: 人行为背后的思维与智能. 中国人民大学出版社.
  2. Silver, D., Singh, S., Precup, D., & Sutton, R. S. (2021). Reward is enough. Artificial Intelligence, 299, 103535.
  3. Davis, R. (1998). What are intelligence? and why? 1996 AAAI Presidential Address. Ai Magazine, 19(1), 91-91.
  4. Bouchard, T. J. (2014). Genes, evolution and intelligence. Behavior genetics, 44, 549-577.