4.6 感情与评价

    感情与智能的关系和感情在认知过程中的作用长期以来是科学研究的空白,没有受到应有的重视。由于逻辑主义和符号主义的影响,人们往往把认知和理性的核心问题看成是真和伪的问题,在判断真伪的过程中,感情处于无足轻重的地位,甚至是一个干扰和妨碍的因素。文学家们也很热衷于描写感情与理性的冲突,但是如果我们把认知的核心问题看成是认知主体建立内部的智能模型的优劣问题,是一个评价问题,那么感情作为价值观体系就具有举足轻重的地位。从根本上讲,崇尚理性本身也是一种价值观,所谓感情与理性的冲突,实际上只不过是生物价值观与文化价值观之间的冲突的表现而已。从这个观点出发,我们可以认为感情是认知、智能和理性的领航员,起着决定方向的作用,因而在与认知有关的研究之中,感情是一个不容忽视的起着关键作用的因素。对于不需要学习或只进行固定学习算法控制的学习的动物来说,感情并没有存在的必要。对于这些动物来说,行为方式或一定程度的学习方式是由基因决定的本能实现的。这些动物行为方式的改进由进化过程完成。由于进化过程本身具有明确而单纯的评价原则,即达尔文的适应度,所以这些动物并不需要再具备其他的价值体系。但是对于学习能力较强的动物,特别是像人类这样学习所得到的技能远远超过本能,学习内容丰富而复杂,学习算法也可以由学习产生的认识主体来说,感情作为评价体系就成为必不可少的先决条件了。这是因为进化与学习虽然都遵循变异与选择这一相同的原理,但是进化中的选择可以通过不适者的淘汰即死亡或不育来进行,而死亡对于学习来说不起任何积极作用,因为学习是生存期间中的过程,动物不可能把死亡作为学习中的选择基准,因而学习的选择就要求有在生存期间中起作用的评价体系,这个评价体系就是感情。因而感情现象与学习能力在动物中呈相关关系也就决非偶然了,人是学习能力最强的动物,同时也是感情最丰富的动物。

    评价的高低(正负值)就表现为感情上的好恶和行为上的趋避。一个价值体系的简化模型可以表现为一个价值向量,向量中的每一个元素可以代表一种价值,元素可以取正值和负值,正值代表正的评价,可以引起喜好的感情和趋向的行为,负值则代表负的评价,可以引起感情上的厌恶和逃避行为。评价值的绝对值越大则表示对生物有适应上的意义或认知上的意义,绝对值为零的评价则代表无意义的因素,不引起生物或认知主体的注意。如果用这种简单的模型来表达生物头脑中或认知主体中的感情运行机制,可以认为生物或认知主体中由一个评价向量表现其当时的整体感情状态,而每一个模式信息中都带有一定的感情色彩,可以是与评价向量对应的一个子向量。模式信息中感情子向量与整体感情状态向量之间的相互作用和相互影响则构成了感情状态向量的变化,以及通过学习改变模式信息中感情色彩子向量的根据和机制。

    我们的感情状态向量到底有多少个元素,或是说我们人类一共有多少种感情,是一个尚未得到充分研究的问题。中国古代有七情六欲之说,现代的情绪心理学也有各种不同的说法,对此可以暂时不下结论,至少当我们把价值观也作为一种文化现象来考虑时,有理由认为对于不同的个人来说感情状态向量的维数有可能是不同的。人的感情评价系统按其来源的不同可以分为生物评价系统和文化评价系统两大部分。生物评价系统来源于人类的进化过程,在个体中被基因所决定,表现为人的天生的性格特征。每个人的性格的区别以多样化的价值为根据,而人类生物价值观的共性则由共同的进化过程所保证。生物价值评价系统和一切其他性状一样,在进化过程中由随机因素而产生,由其对适应度的贡献而被维持。对于不进行学习的动物来说,这些适应的性状表现为某种功能结构或固定于基因的行为方式,而对于善于学习的动物来说,由于其行为方式不固定于基因,而在后天学习而得到,因此适应性状只能在基因中表现为作为学习导向的生物价值观,即趋利避害的方向性指引。由此可知生物价值观在进化过程中的形成机制与其他性状是完全相同的。例如在鹰鸽博弈模型之中,对于不学习的动物来说,鹰战略直接体现为引发具体的战斗动作,鸽战略直接引发具体的逃避或臣服动作,这些动物的行为方式是固化在基因之中的;而对于靠学习获得行为方式的动物来说,鹰战略不是直接引起战斗动作,而是引起战斗欲望,引起一种斗志,一种激愤情绪,而具体的战斗动作则是要在战斗中逐步学习的,为了引导这种学习,则需要重创对手时的快感,自身负伤时的疼痛感等一系列具有感情评价色彩的感觉。在经过学习获得了一种或几种战斗动作时,由于这些动作都是在战斗情绪之下学到的,具备与战斗情绪之间的模式联想(情绪也是一种模式),战斗情绪就可以引发这些战斗动作。这是心理学中熟知的一种现象,即某种情绪可以引出与该种情绪有关的联想,悲伤时容易想起过去悲伤的事件,欢乐时也容易想起欢乐的事件。

    文化评价系统的产生需要一个当然的前提,即文化现象的存在,这意味着该种动物具有足以支持文化现象存在的智力本能。这种本能主要体现为对于文化的模仿和再建的能力与欲望,同时也体现在文化价值观的传递能力上。文化进化的基本原理与生物进化是相同的,都是依靠变异和选择进行的,但是又有其各自的特点。现代进化论的发展逐步否定生物进化中集团选择的因素而重视个体选择甚至基因选择,走向“自私的基因”这个基本原理,但是由于文化本身是超个体的,主要是集团的现象,在文化进化中个体选择虽起一定的作用,但集团选择往往占有主要地位,当一个文化集团在经济或军事上处于强盛地位时,它的文化价值观体系及意识形态和艺术风格都会具有较大的渗透能力。当然在文化进化之中个体选择也还起着重要作用,例如一种新产品能否在市场上站住脚基本上取决于用户的个体选择。文化进化的另一个特点是产生“逃离效应”的危险性比生物进化要大得多。在生物进化的过程中,产生逃离效应的条件是比较苛刻的,因此偏离最佳点的现象在生物进化中并不常见,认为某种性状总是使生物处于适应度的最高点通常不会导致错误结论。但是在文化进化的过程中,引起逃离效应的因素相当普遍,虽然文化价值观归根结底受到生物价值观的约束,但是文化价值体系偏离最佳点的情况是很常见的。因此对于生物的性状或作为生物性状的生物评价体系来说,我们认为它在几十亿年或几百万年的进化过程中已经作到了充分的优化是大致不会错的,但是文化价值观体系却未必有这样高的可靠性,根据某种文化现象已经存在了几千年就认为它当然合理是很危险的。

    在文化进化的过程中,存在着多种导致逃离效应的因素,其中一个重要的因素就是从众心理。由于文化价值体系中有很多价值观是对于集团或社会起作用的,当某个个体偏离这种价值观时,尽管这种偏离有可能是更有利的,但偏离本身却使得这些个体对于多人来说可预测性下降,合作变得困难,与社会结构发生冲突,带来的损失会超过个体价值观向有利方向偏离所带来的利益。这种因素也可以体现为标准化的利益与改良之间的冲突。从众心理是保持文化稳定性的主要力量,也是文化进化的阻力,这种力量使得文化在一些方面总是落后于现实所要求的价值观体系。导致文化进化的逃离效应的另一个重要因素是文化价值观的反生物性。文化价值观独立于生物价值体系的根本性理由在于囚犯困境问题的哈丁解,也就是一个集团和社会在某些问题上总是需要一种外在于个人的权威力量来维护整体的(因此也就是每个个人的)长远利益不被局部而近视的生物价值观所误导。为了实现这种功能,通常以风俗、道德或法律形式表现的文化价值观必须具有足以克制生物价值观的力量,而且几乎总是代表一种与生物价值观相反的评价倾向。因为与生物价值观同方向的文化价值观通常没有存在的必要,我们用不着把每天吃饭看成是一种道德的行为。文化价值观的这种反生物性的方向和力量,使得用生物价值体系对其进行约束变得相当困难。为了保持这种力量,文化价值观往往被涂上神圣的色彩,这也就是宗教产生的根源,而宗教教义从来都是天然地处于免受批判的地位。某些形而上学的价值观虽然没有打着宗教的旗号,但只要它同样被涂上神圣的色彩,就具有和宗教相类似的拒绝批判的性质。对于文化价值体系进行批判和修正的困难还在于,任何一种批判或比较都必须有价值体系作为依据,而处于文化深层的价值体系自身就起到这种作用,从而使自身处于不可能被怀疑的地位。只有在不同的文化之间发生冲突时才可能产生对文化价值观的质疑,但是由于不同的文化之间通常不存在共同的基础,使得有效的争论无从开始,除了各执己见之外别无他法。因此文化价值观的进化通常不是通过争论达到一致的,也不是可以靠通常的逻辑推理解决的,而是靠人的生物价值观所造成的直觉决定取舍的。建立可以作为讨论价值观的依据的价值理论体系需要从更深层的生物价值观人手。

    在模块结构的信息系统之中,由于上层模块共用下层模块的可能性,以及动作目的不同所产生的制约,使得上层模块必须避免同时动作,从而使上层模块之间具有互抑制的关系,即一个模块的工作状态导致其他模块的休止状态。而该由哪一个模块工作,可以由模块之间的竞争来实现。即使这些上层模块都由一个中央集权的最高级模块进行集中控制和协调,其控制机制也仍然是竞争的。竞争的胜负总是体现出某种评价,因而模块之间的竞争可以说是评价过程的最基本的表现形式。我们用蚕吃桑叶的简化模型作为具体例子来说明这竞争过程。假定蚕有两个运动模块,一个是咬吃,一个是爬行,在没有桑叶可吃时,咬吃模块处于抑制状态,爬行模块工作使蚕爬到有桑叶的地方,一旦碰到桑叶,某种传感器的信号使咬吃模块起动,爬行模块被抑制,使蚕能吃桑叶,一旦头部摆动范围之内的桑叶被吃完,咬吃模块兴奋度下降,对爬行模块不再抑制,蚕再次爬行以吃到别处的桑叶。从这个过程来看,要使蚕完成必要的生理机能,咬吃模块的评价优先度必须高于爬行模块,如果评价发生反转,爬行的优先度高于咬吃,那么蚕就会永远走下去没机会吃桑叶了,如果真有这样的蚕当然会饿死而被自然淘汰,因此在进化过程中必然产生合理的也就是适应的评价体系。这个模型还可以进一步复杂化,例如我们考虑蚕需要脱皮,在脱皮的过程中既不吃也不动,那么可以假设还存在一个脱皮模块,其优先度高于咬吃和爬行,在需要脱皮时脱皮模块可以抑制咬吃和爬行模块,使蚕处于不吃不动的状态。在蚕的神经系统中未必真有一个与脱皮有关的神经节,很可能在脱皮时蚕的体内产生某种激素或某种酶,这种化学物质使得蚕的皮肤发生变化,同时又能抑制神经活动。但是作为一个信息模型来说,信息的作用到底是由物理的还是化学的变化来实现并不是一个值得注意的因素。促成脱皮的化学物质到底是一种什么样激素或什么样的酶,这个问题对于研究杀虫剂的人来说可能事关重大,但对于建立信息模型来说不起关键作用。

    蚕的简化模型不包括学习过程,所有的评价值都是由先天的本能决定的。对于能够学习的动物来说,有些评价值是可以通过学习而改变的。例如前文所述的蜜蜂学习颜色的过程,从评价的角度来看,可以认为蜜蜂通过学习改变了各种颜色对于近距离导航的价值。学习算法可以采用E S学习的算法。对于价值的学习来说,必须由更深一层的价值作为学习的引导价值,这在ES学习算法中体现为成败判断的基准,在蜜蜂对颜色的学习中表现为吸蜜成功的高价值评价。因此复杂的评价系统也可以由多次的学习逐层建构起来,其中最深的层次则是由本能决定的基础价值体系,由进化的机制保证其适应性。通过类似的学习过程,认知主体可以对于各种感觉信息进行评价赋值,由这些评价的对比可以像本能价值一样引起价值中断,以控制和协调行为和思考的流程。因此认知主体所接受的外部刺激对认知主体的扰动作用不仅仅取决于刺激强度,更取决于感觉信息所具有的先天的或在过去的学习中获得的评价值。

    利于价值中断的概念,我们可以对一些难解的心理现象作出解释。例如当我们睡着的时候,可能不被雷声吵醒,但有人小声叫名字时却会被叫醒,这是由于在长期生活的学习过程之中,自己的姓名总是与对自己有意义的事相连,这一信息被赋予了很高的价值,足以对睡眠状态进行中断,而雷声却往往不具备这种价值。但是如果你住的房子漏雨,雷声作为与雨有关的信息也会在学习中获得较高的价值。应用相同的原理也可以解释被称为“鸡尾酒会效应”的心理学现象。所谓“鸡尾酒会效应”是指这样一种现象:在鸡尾酒会上,你和朋友正在谈话,其他人也各自在谈各自的话题,你只听到朋友说的话,其他人的谈话则构成“背景噪音”,但是当你近处的某个人在谈话中提到你的名字时,你会清楚地听到,而且引起注意。为了分析这个现象首先需要假定我们的听觉信息处理处在较低的层次上(例如单词或短语这个层次)是可以并行处理的,即可以同时处理两组以上的信息,但是高层次的语句的语义理解由于需要智能模型的参与,只能处理一个语流。在主通道进行语言的全面信息处理的同时,副通道只需要作出词语的包括重要性评价和单词语义的简单处理。通常主通道抑制副通道的高层次语义处理,但是当副通道的评价值超过主通道时,会发生价值中断,使注意点及高层次语义处理切换到原来的副通道上,造成主副通道的互换。自己的名字具有很高的评价值,足以触发这样的切换。当然,价值评价是相对的,如果你和朋友所谈的问题极为重要,中断也可能不发生,反之,如果你正在被通缉,一个可疑的脚步声也可能引起中断。价值中断在多数情况下可以在短时间恢复,中断引起主通道切换之后,如果主通道中更高层的处理所得到的价值低于切换前主通道的信息价值,主副通道可以再次互换使中断得到恢复。鸡尾酒会上由于名字引起的中断,如果听下去之后并无吸引人的信息,和朋友的谈话又会继续下去。

    通过学习对感觉信息进行评价赋值,使得感觉信息带有评价值,不仅在与外部世界的信息交换过程中起作用,而且对于思考过程也起着引导作用。思考是动作的内化,思考的每一步的结果造成内部的感觉,由于这些感觉信息也同样在过去的学习过程中获得了评价赋值,所以可以作为思考推进的依据:当思考得到的感觉信息评价值较高时,思考可以集中于原路,当评价值下降时,思考会走向散漫,发生下意识的分路进行,准备在某一路出现评价值较高的感觉信息时,再次集中思路。这种过程如果看成一个搜索过程,感觉信息的评价值相当于启发信息。以上的分析为我们开辟了通过学习获得启发信息的途径。

    信息的评价值这一概念,为建立新的信息理论开辟了方向。信息论的创始人香农(CEShannon)从统计学的角度对信息量作出了严密的数学定义,阐明了信息与熵的关系,使得信息论成为一个坚实的理论,对于解决信息传输和编码等许多问题提供了可靠的工具,在信息处理中也起到指导作用。信息量这一概念的优点是其源于客观性的确实性,因此对于像信息传输这种客观的过程的研究和设计具有非常可靠的指导意义,但是单纯的传输本身并不使信息具有意义,信息只有在和认知主体发生相互作用时才体现其意义,因此更完整的信息理论应该包含信息与认知主体之间的作用。例如你的妻子(或你自己)生了一个男孩,与你不小心掉在地上的硬币正面朝上,这两个事件所代表的信息计算其信息量是完全相同的。如果排除人的主观感觉,一本无聊的厚书比一本精彩的薄书信息量要大,甚至同一内容的书有错别字的比没有错别字的信息量要大。信息量概念的这种明显的不合理性是早已被人们所熟知的,有不少人主张建立新的信息理论来解决这种不合理性,但是都没有成功。其原因在于历来的科学传统是重视客观性和确定性的,由于主观评价的不确定性,不可能被包容在一个可靠的理论之中。感觉信息的评价值概念,在确定的学习算法之下,是具有其确定性的,至少具有统计意义上的确定性。按照这一思路,我们可以建立关于主观评价的具有确定性的或者说具有客观性的理论。由此就可以建立起包含信息的发出者和接收者的主观评价因素在内的,同时又是科学而可靠的广义信息论。

    以上关于感觉信息评价值的讨论只考虑了评价值在竞争中的相对比较,而没有考虑感觉信息评价值在不同心理状况下取值的变化。为了讨论这种变化,我们可以不把评价值看成是某个感觉信息所固有的,而是感觉模式所具有的评价子向量与代表认知主体现实感情状态的感情向量之间相互作用而产生的评价值。这种即时的评价作用可以由具体的算法来实现,例如我们可以把感觉信息的即时评价值定义为该感觉信息的评价子向量与当时整体感情向量的内积。反之,对于整体感情向量对于某种感觉信息的评价子向量的影响,则可以采用和ES学习算法相似的方法,只是把调整概率改为调整评价子向量各元素的值。调整可以用以下的算法实现:学习后的评价子向量是学习前评价子向量与以成败作为正负号的即时感情向量的加权平均值。通过这样的相互作用,感情评价可以起到需要哪种感觉时哪种感觉的评价值就较高,而与成败无关或导致失败的感觉信息获得较低评价的引导作用。这种感情评价的引导作用比起模块之间直接的互抑制或互兴奋具有更高的可塑性和对环境变化的即时响应及变通能力。

    对于行为方式固定而简单的动物来说,行为模块之间固定的优先度排序已经足以应付评价的需要。例如在蚕吃桑叶的例子中,蚕在没有受到中断情况下只管一路吃下去,这种行为方式所表现的永恒的食欲在行为机制内部并不需要食欲的概念。食欲只有在可能发生变化和可能与其他欲望进行比较和竞争时才能成为有意义的概念。对于行为方式复杂而且可以通过学习加以改变的动物来说,欲望作为某一类行为的代表进行各类行为之间的比较和竞争就具有简化竞争方式的重要意义。从学习的角度来看,像蜜蜂学习颜色或乌鸦区别对象这种依附于固定行为方式的目标识别学习,以及像马戏团驯兽这样的出于固定目的的行为学习,由于键刺激与行为之间形成固定关连,而学习所依据的一方已由本能固定,欲望的作用也不太大。对于像人这样在诸多方面具有复杂而多层次的学习能力,往往在RS两方面都要进行学习,学习所得目标识别和行为之间的关系又可随环境因素而变化的认知主体来说,欲望这种相对稳定的评价基础就有其极为重要的意义了。欲望反映了人类先天本能的基础评价体系,虽然后天的学习过程和所处的文化环境可以使其发展、对其进行修饰或抑制,但难以完全消灭。在S型学习和R型学习交互完善的复杂学习过程中,欲望起着始终一贯的评价支持作用。例如婴儿在通过R学习过程学会抓东西放在嘴里,由此就可以通过味觉经验学会从视觉和触觉分辨可吃和不可吃的物体,从而产生从欲望到目标的联想,再后又会逐步学习获得目标物以满足食欲的丰富多彩的行为方式,形成从欲望到目标的联想,学会由目标起动行为,进而由各种行为经验反馈出目标之间的评价,以及评价值与环境的关系等等,所有这些复杂的学习过程都需要由食欲这个统一而稳定的评价基础作为其先决条件。在通过多层次的反复学习建立起从欲望到目标和从目标到行为的联想能力,以及各种目标及行为方式在环境条件下的评价系统之后,就可以在欲望产生时利用这个评价系统找出满足欲望的最佳行为方式。在学习目标和行为之前,欲望成为学习的动力和导向,动力体现在产生不满足感,中断其他欲望产生的行为,在情绪上表现出焦躁不安,促进认知主体对环境进行搜索,增大发现目标的概率;导向则体现在设定整体感情状态向量处于与欲望相符的取值,使得能让欲望得到满足或与欲望有关的感觉信息能够获得较高的评价,成为发现目标的引导信息。因此在我们饥饿时会产生空腹感,能够对食物的气味产生比平时更为灵敏的感觉。在经过对目标的学习之后,食欲往往会引起对各种具体的食品的形象及味道的想象。

    欲望是具有复杂学习能力的动物实现学习与行为的基本动因,起着设定整体感情状态向量的作用,各种欲望之间的竞争结果,最终决定认知主体的学习与行为。但是在我们的带有感情评价色彩的感觉信息之中,有些感觉并不一定只与某一种欲望有关,有些则很难归属于某种欲望,因为欲望这个词在语义上带有积极的意义,体现某种主动追求的倾向,所关联的多是一些正向的评价,而在感觉信息中还大量存在着负向的约束性的评价,体现出对某种因素的逃避倾向。如果硬要造一个在这种情况下与欲望相对应的词汇,也可以称之为某种“负欲望”。但是这个词汇用起来很困难,因为很难从日常生活中找出属于“负欲望”的例子,我们熟知食欲、性欲、求知欲这种表现正向欲望的概念,却没有像“避痛欲”这种表现负向欲望的词汇。尊重我们的语言习惯,对于负向的一些评价因素可以不从欲望出发而分别讨论具体的带有评价色彩的感觉信息。对于无法归属于某种欲望的感觉,可以从评价的更深层的基本原则来加以讨论,而欲望本身的合理性也是由于符合这些基本原则,即我们在第二章所讨论过的存在原则、经济原则和预测原则。不言而喻,食欲和性欲是符合存在(生存)原则的。

    存在原则不仅体现在食欲和性欲这种趋利型的正评价之中,更多地体现于保护肌体不被破坏的避害型负评价。避害型负评价的各种因素之间竞争的评价优先度是根据“轻重缓急”原则排列的,轻重是指对机体的危害程度,缓急则是造成危害所需的时间长短。这些固有的负评价值在进化过程之中趋于合理,为动物或认知主体指示出为了生存在当前需要解决的问题。饥渴、缺氧、外伤都会威胁动物的生存,但缓急程度不同,饥渴的时限是数天,窒息是数十秒,外伤则要求瞬时的反应。因此,一般来说,造成外伤的高温、外力的负评价值大于窒息,而窒息大于饥渴。实际的中断竞争则取决于不利刺激的强度,而具有经时效果的不利刺激的强度则随其持续时间的增加而增大,在接近时限时则急剧增加。

    在存在原则所支持的诸多保护性、避害性的负评价感觉之中,具有代表性的是疼痛感觉。痛觉可以由压迫、撞击、刺切、感染、化学腐蚀等多种破坏性因素所引起,是避害性感觉中最典型的例子。由于痛觉的存在,使人生增加了一些痛苦,但是痛觉却是人所不可缺少的一种感觉。曾经见到过先天缺失痛觉的病例的报告,在其他人看来,没有痛觉似乎是人生一大幸事,可以免去很多痛苦,但是对患者来说,却造成了他人难以想象的麻烦。由于没有痛觉,患者不能像正常人那样及时获得肌体被破坏或可能将被破坏及损害程度的信息,这样就会使动作学习免受损害的功能难以发生作用,因而患者经常被碰得伤痕累累,即使在事后可以发现自己的伤痕,但却无法得知是在哪一个动作过程中碰伤的,因此对动作的修正变得相当困难。痛觉是一种主观感觉,压力、内部接触、高温传感器都不能直接作为“痛觉传感器”使用,作为痛觉必须加上对损害程度评价的翻译过程。这种翻译过程并不是对所有动物都是必要的。对于简单的动物来说,避害动作是由基因决定的神经互连来完成的,某种对动物不利的刺激直接引起相应的逃避行为,如蟑螂对振动的敏感反应。在这样的行为模式之中,痛觉这个中间环节毫无存在的必要。对于固定的单一因素的学习过程,例如蜜蜂对颜色的学习来说,颜色评价只与近距离导航有关,并不与其他行为发生竞争,因而关于快感和不快感之类的感觉也是没有存在必要的。只有在具有复杂的学习能力,需要广泛而多变的评价竞争的认知主体之中,像痛觉这种具有通用评价可能性的感觉才是有必要的。从这一点出发,我们可以推断节肢动物是没有疼痛感觉的。据报载澳大利亚颁布了一条法律,由于龙虾具有神经系统,为了减少龙虾的痛苦,在烹调之前必须弄死,禁止活杀或活煮。且不谈造成动物的痛苦是否违反道德的问题(对于这一点孔子已有一个很精彩的解决方案:君子远庖厨),即使承认减少痛苦的必要性,龙虾这种节肢动物也没有资格成为考虑的对象。龙虾在热锅里乱爬仅仅是直接的动作反应,并不存在疼痛这种中间环节。就像我们在第一章中谈到的挨打机器一样,它没有也不需要有疼痛的感觉。

快与不快的评价性感觉在认知主体中有两个主要作用,一个是作为学习中对行为进行修正的引导信息,一个是作为将来的行为决策即模块竞争的评价信息。洛伦兹(Von KONRAD  LORENZ)把这种学习与决策的过程比喻为法庭的判决,但是这种比喻只适合于比较简单的动物,对于更复杂的动物,用市场作为比喻可能更为恰当,法庭的比喻适合于中央集权的系统,而市场则是分散自律系统,法庭从理论上依靠不变的法律进行判决,而市场上的价格和汇率总是不断变动的,法庭不包含立法机构,而市场可以自发产生市场规则。对于简单动物来说,模块之间的优先度顺序是由进化过程赋值并固定于基因中的,其行为方式也是由基因决定程序完成,不能由学习加以改变,在这种情况下,行为的起动近乎程序安排,而行为的完成也只需要给出完成信息以结束行为即可,完成信息之中不需要包括评价成分。而对于具有学习能力的认知主体来说,不仅需要保护性的不快感觉(例如痛觉)来即时约束不正确的动作,而且需要行为成功时的快感以巩固正确的行为,这种对行为结果的评价也需要记忆起来作为今后与其他行为竞争决策的评价赋值。对于一生只交配一次的昆虫来说,其交配行为方式只能由基因决定,不可能借助经验进行学习,而且也不需要未来的竞争参考,因此在这样的动物的交配过程中,观察不到情绪高昂的表现,看起来像完全程序化的例行公事。对于具有高度而复杂的学习能力的动物来说,情况完全不同。本能规定的行为方式减少,而作为学习引导的评价功能则高度发达,基因不再完全规定具体的行为方式,而改为规定高层的欲望。把两只性成熟的猩猩放在一起,它们从未见过其他猩猩的交配过程,结果猩猩虽然表现出极度的兴奋,却不知如何解决这个问题,通过试错的方法它们或许可以发现性行为的动作,但是在没有示范的情况下,恐怕需要较长的过程。

    从上述观点出发,我们就可以回答那个古老的问题“子非吾,安知吾不知鱼之乐?”鱼的游泳动作是一出世就会的,而且不会通过学习改变游泳的姿势,因此对于鱼来说,游泳时判断哪种姿势更好是没有意义的,当然也不会有游泳时的痛苦与愉快之分。观鱼者认为鱼游得快乐,仅仅是因为鱼游动时动作频率较高,而人又是在快乐时容易有较高频率的动作出现,从而作出鱼游得很快乐的猜想,而作为鱼的自身感觉来说,并不需要游泳时的苦乐之感。当然这是对鱼而言,如果所讨论的不是鱼而是海豚,情况就大不一样了,因为海豚是很善于学习新动作的动物。这个古老问题的深刻意义在于,在看到行为主义的缺陷之后,我们用什么方法去判断除了我们自己之外的认知主体(不论是动物还是机器)是否能思维,是否有主观感觉,是否有感情,是否有意识。所有这一切,都取决于我们能否对这些通常表现主观世界的词汇给出客观的模型和阐明其机制,从这一点出发,我们就能通过结构和动作原理从客观的角度分析一个认知主体的主观世界。

体现经济原则的约束性负价值评价感觉的典型例子是疲劳感。从生物化学的角度看,疲劳产生的机制是肌肉运动时乳酸和二氧化碳之类的代谢产物来不及随血液排出而积累起来,使肌肉酸度增高,酸度由相应的感觉神经检测出来传递到大脑,从而产生疲劳的感觉。疲劳感可以起到一定程度的保护作用,走路走累了坐下休息一下,可以使积累的代谢产物有时间排出,恢复肌肉的正常功能。然而,疲劳感觉的意义远不止这些,疲劳感在不同层次的学习和决策之中起着极为重要的作用,是认知主体对于行为所付出的能量代价的度量。按照经济原则,动物行为所付出的能量越小越好,因此疲劳感带有负的评价值。在低层次的动作学习之中,疲劳感是对动作进行优化的关键信息。在某种技能的熟练过程中,或是动作的反复练习之中包含着一种渐近性的学习过程,每一次的动作都有小的随机变化,而用疲劳这种反馈信息决定动作修正的方向,以达到在完成相同目的时所付出的能量代价最小这一原则。熟练的动作往往比较圆滑,不像简单的机器人那样作折线运动,如果给机器人加上加速度最小化的学习程序,则机器人的动作也可以变得圆滑起来,而对动物的肌肉来说加速度与力肌肉紧张程度成正比,而肌肉紧张要消费能量。在动物或人学会某种基本技能之后,熟练的最重要任务就是消除不必要的肌肉紧张,因为在掌握基本技能时需要积极的多方向搜索,多余的紧张是不可避免的。这就像一个新产品进行原理性试验时可以不计成本,但要投入大量生产时成本就成为重要因素了。在降低运动成本的学习过程中,疲劳就成为重要的信息了。刚学会骑自行车的人,长时间骑车会感到手臂很累,这是由于学习平衡动作而产生的过度紧张还没有消除,经过一段时间的练习之后,在疲劳信息的指引下,过度紧张就会消除掉。初学游泳的人,只能游几十米的时候,还不能算会游泳,此时基本动作虽然差不多,但用力还很不得法,游几十米体力就支持不住了,到能游几百米时,才可以认为已经基本上掌握了正确的用力要领。疲劳状态本身也促使紧张的消除和多余用力的减退,迫使搜索向减少用力的方向进行。当然经济原则不是只省力,而是效果与成本之比,因此在对支出作出负评价的同时,应对效果作出正评价。在游泳的例子中,速度感是带有正评价的感觉。只有在正负评价的共同作用下,动作才能实现经济意义上的优化。对人来说,速度的正评价是比较普遍的,开汽车兜风的乐趣也是这种正评价所产生的快感。从决策的角度来看,疼痛感的记忆可以使未来的决策避免导致伤害的行为,而疲劳感的记忆则使决策能正确估计能量代价,避免不经济的行为。我们所说的“懒得干某件事情,就是通过代价与效果的评价所得到的否定性结果的语言表现。

体现预测原则的一些评价性感觉不像疼痛和疲劳那样明显,但在复杂的认知过程中的重要性却不亚于前两个原则。好奇心和求知欲可以说是预测原则的集中体现。关于脊椎动物眼睛的分布与预测能力的关系,洛伦兹的研究很有启发意义。脊椎动物的两只眼睛的分布有两种类型,一种是两侧分布的,其视野较宽阔,但两眼的共同视野较小,另一种是两眼都朝前方的,总视野较小,但两眼视野的重合部分很大。大多数的鱼类的眼睛都是两侧分布的,这些鱼类对环境的纵深距离感觉主要依靠游动时视网膜中景物随移动而产生的变化来获得,对于这些鱼来说,运动过程中的随时的反馈足以使其避开障碍,游向目标。但这些鱼在静止时难以得到足够的空间信息,因此会有这样的情况发生,当鱼在前方有障碍而处于静止状态时,先向前方游动之后才作出躲避障碍的动作。有一些鱼类处于向陆生动物进化的中途,浮膘已经退化,不能在水中游动,只能在水底或水边的岩石或沙滩上生存,靠跳跃来移动身体。对于这种鱼来说,跳跃之前总是处于静止状态,为了准确地跳跃,必须能在跳跃之前正确测定距离以决定跳跃的力量,因此这种鱼进化成两眼朝前方的分布,可以在静止时不依靠运动视差而只靠两眼视差来测定距离。动物就是通过这样的进化过程获得了初级的预测能力。在鸟类中也有类似的例子,大多数的鸟的眼睛都是两侧分布的,只有猫头鹰是个例外。普通的鹰是在飞翔过程中发现猎物的,因而运动视差足以满足测距要求。但猫头鹰要抓老鼠,成为夜行性动物,而在夜间听觉比视觉更为有效,因而猫头鹰长了两个羽毛构成的耳朵,由于飞翔中气流所引起的背景噪音太大,为了听取猎物的声音,猫头鹰只好站在树上发现猎物。为了能在静止状态下正确判断距离,猫头鹰的眼睛是双眼朝前分布的。在哺乳动物之中,猫是双眼朝前分布的典型,因为猫的捕食方式是在静止埋伏的状态下突然扑向猎物的,双眼视差的测距作用对生存有重大意义。猴子在树上从一个树枝跳跃到另一个树枝时要不失时机地握住目标的树枝,而且在飞跃过程中无法控制自身轨迹,必须在跳跃之前的静止状态下正确测量距离,因此灵长目是两眼朝前分布的。人类的高度预测能力就是起源于此。

预测原则在认知主体的复杂逐层学习的过程中也是不可缺少的。体现存在原则的保护性负评价只起约束作用,不起正向引导作用,而只靠经济原则的效果作为正向引导的话,效果的表现又成为一个问题。特别是在低层次的学习过程中,行为通常不引起直接的利益,此时预测原则成为最重要的学习引导的正向评价信息,它使得通过学习建立的智能模型具有预测能力。这就是为什么我们通常用胡萝卜加大棒的政策驯养动物,但没有必要在小学课堂上发糖果。预测原则有别于存在原则和经济原则之处在于其非短期功利的导向,这就为人类的认知超越动物认知开拓了道路,当然从长远和整体来看,预测原则仍然是合乎功利主义的,这样才能解释预测原则在进化中为什么能够产生而不被淘汰。求知欲在进化过程中被加强,显然是缘于其对适应度的提高,幼年的猴子乐于学习,但随着年龄的增长其求知欲逐步下降,这是由于年轻时学习到的技能可以用很多年,学习所花的代价可以从一生的利益中得到充分补偿,但是对于老年的猴子来说,由于其后的时间不多,学习新技能可能得不偿失。随着智力与文化协同进化的发展,学习的利益越来越大,人保持求知欲的年龄也逐步增长,趋向于幼年成熟,因此人的头盖骨形状与幼年猴子的头盖骨极为相似。虽然出于同样的价值核算人也是年纪越大越趋于保守,但与猴子相比,人可以算是终生学习的动物,其中不乏像科学家这样的活到老学到老的例子,因此可以说,人是永远长不大的猴子,而科学家则是永远长不大的人。由此可知人的生涯是有其特殊性的,根据其他哺乳动物性成熟期与寿命的普遍关系来推断人的寿命应为150岁可能是不对的,人的幼年成熟的特性可能推迟了性成熟。

求知欲主要表现在好奇心和保守性两个方面。好奇心是对未知的或者说是不可预测事物的关心和兴趣,保守性则是对事物可预测性的渴求和对新事物用原有智能模型进行解释的倾向。对事物进行理解以增加知识的过程大致可以分为两个阶段,在遇到输入信息时先是驱动智能模型进行预测,如果预测成功而且所得结果并不重要,则不引起价值中断,如果预测成功而结果重要,则引起中断并进行进一步的思考决策,如果预测失败则也引起中断,换用非典型的其他模型试行预测,视其成败改变典型模型分配,或通过进一步思考修正模型本身。好奇心也就是对预测失败给出比较大的价值的绝对值,使认知主体通过学习改变智能模型,而改变后得到的智能模型应能在更大范围得到正确的预测,这是保守性的要求。对于婴幼儿来说,整个环境都是未知的、新奇的,作为认知主体内部的智能模型还很少,此时认知主体通过对具体事物的记忆得到智能模型,然后利用这些模型进行预测,对预测有效的模型得到保留。无效的被淘汰。在建立了一些有效的智能模型之后,逐步在进一步的预测理解的过程中推广模型的使用范围,并通过建立模型之间的关系组合成更高层次的智能模型。在这些过程中,预测失败的中断是起动思考或行为尝试建模的重要信息,其表现就是好奇心,所谓“奇”就是用认知主体中原有的智能模型难以解释即难以预测的信息。

    但是人并不是对所有自己不懂的事情都感兴趣,好奇心仍然受到短桥原理的约束。人所感兴趣的,是那些对智能模型稍加修改或简单组合就可以解释的问题。但是在多次的修改和逐层的组合之中,智能模型可以逐步完善和向高层次发展。具有一定语言理解能力的儿童,喜欢旁听成年人的谈话,虽然他们还不能理解谈话的全部内容和深层的意义,但儿童可以在这些话中选择在他当时的水平上经过思考可以理解的部分加以理解,同时逐步改进智能模型,扩大理解的范围,最终达到完全理解的程度。这种选择所依据的原则就是短桥原理,非常容易理解的部分不引起中断思考,太难以理解的部分则引起理解的失败或错误,这些错误有待将来理解能力进一步提高之后加以修正,起作用的是那些在短桥距离之内的内容,即通过思考可以完善和提高智能模型的信息。这就是容易引起人们兴趣的信息。具备初步外语水平,然后生活在外语环境之中的人,可以经历类似的学习过程,在一开始只能依靠几个单词去推断语句的意义。根据语句的意义再去推断其他单词的含义,逐步提高语言能力,最后达到能够理解话外之音的程度。从基于预测原则的评价的角度看,可预测性太高的信息评价较低,我们看一部不久前看过的电影或是废话连篇的电视剧会感到无聊。反之,新奇性太高而超过短桥距离的内容也会引起不快的感觉,例如过于离奇的故事或超越自身理解水平的讲课,以及别人用完全听不懂的外语讲话,都不能引起我们的兴趣,因为这些信息无助于智能模型的增长。

感情评价的外部表现就是表情。人类表情的丰富程度远远超过其他动物,但表情的生成与识别仍是以本能为依据的。婴儿从一生下来就会用哭与笑表达其快与不快的评价感觉,不同民族的不同文化并不会使表情产生相反的理解,用点头表示否定而用摇头表示肯定的民族是存在的,因为点头摇头是由文化所规定的信号,但是用笑表示悲伤,用哭表示高兴的民族是不存在的,因为表情受本能的控制,不因文化而改变其表现形式。因此表情要伪造得很像也是很困难的,假笑与真笑很容易分辨。这也就是斯坦尼斯拉夫斯基体系的理论根据。人的表情如此丰富,也是产生于智力与文化的协同进化过程。随着文化对于生存的重要性逐步增大,文化的高效率传递方式对于提高适应度具有越来越明显的效果,而文化的核心部分又是该文化的价值观体系,因此表情的生成与识别的能力作为传递非本能文化价值观的有效方法在进化过程中成为一种适应的本能而得到保存和发展。

    人类表情的典型例子是笑。笑又分为微笑与大笑两种,表现不同的感情。微笑产生于愉快的心情,进而对他人表示赞许和友好。大笑则是对新奇的或超乎常态的事物或说法的反应。司空见惯的事不会引起大笑,引起大笑的事情多少有些怪异,因此大笑可以说是在短桥距离之内的新奇事物引起的中断状态。大笑总是中断平常的思路,对引起大笑的原因造成反复回忆,增加记忆的深度,达到学习的目的。

在前面的讨论之中我们没有对感情与评价作明确的区分,实际上在日常语言或心理学中所说的感情通常是指可以被意识到的感情状态,而无意识之中的评价过程通常不被认为是一种感情状态。严格地说,评价是感情的基础,感情是被意识到的评价结果的表现。除了有意识的决策过程之外,评价过程本身通常是不被意识的,但评价的结果会引起身体和思考状态的变化,例如心率的变化,表情的变化,激素分泌的变化等。这些变化的作用本来是使动物为评价决策之后的行为作出充分的心理和生理的准备,或是生成表情信息或语言信息向外部进行表现以影响其他个体。评价结果的外部表现是一切社会性动物的必要功能,例如蜜蜂对蜜源或分封时筑巢地点的评价结果可以用舞蹈的方式加以表现,狗也可以用摇尾巴表现其好感,争斗向仪式化方向的进化也可以形成评价结果的外部表现。评价结果所引起的身体状态变化和外部表现通过感觉被意识到时,就形成我们通常所说的感情。因此感情是与意识密切相关的概念,要理解感情的作用需要以对意识的理解作为基础,这里只能先指出一点,即感情作为评价进入意识的途径,使得对评价系统的“事后”的修正成为可能。