4.8 创造与灵感

生物的进化是自然界中最活跃的创造过程。为了理解人脑的创造能力,生物的进化是最好的理论范式。图4.9表现了生物进化与文化进化中创造过程的对应关系。

图中的对应关系在很早以前就被生物学界所熟知,生物的进化过程与生物个体发育过程之间存在着不十分严密但很明显的对应关系,即胚胎发育过程在某种程度上重复着从单细胞生物到多细胞生物的进化过程,因此胚胎学曾经成为进化论的重要证据。从广义进化论的观点来看,这种重复可以用硬化机制来解释。在基因的变异和生物成体性状变化之间存在着漫长的因果链,即胚胎发育过程。在变异受到成体性状是否有利的考验之前就已经受到胚胎发育能否完成的考验。甚至可以说,与搜索生物成体适应环境的性状相比,搜索成功的制造工序是进化的更为核心的问题。由于后工序对前工序的硬化以及互适应协同进化的不可逆性,前段工序被顽强地保存下来,可以在几十亿年中不发生大的变化。换句话说,除了重复进化过程,生物无法知道其他的制造自己的方法。

    49中②所示的对应关系不像①那样明显。一般看来,个人学习过程并不一定重复文化发展史,例如人不需要先学古文再学现代文。在这里我们需要区别看待两种不同的文化,即进化型文化与非进化型文化。进化型文化的典型例子是科学,非进化型文化的典型例子是宗教。进化型文化的最主要特征是具备软硬结构,因此发展很快而且水平不断提高。科学中有争议的部分是软结构,处于已知与未知之间的领域,通过研究达到众说归一的阶段,则该领域硬化,软结构被推向原来未知的领域。按这种方式发展起来的文化具有较强的阶层性,不具备前层知识则无法理解后层。在科学发展史上有不少人同时创造类似理论的事例,这说明在科学发展的当时水平已经具备了创造该理论的必要条件。当这些条件不具备时,不仅不可能创造出这一理论,甚至理解它也是很困难的。对于进化型文化来说,图4.9中②的对应一目了然,只要看一看标准的教科书,就可以看出关于科学的部分的学习顺序与科学发展史的顺序是大致一致的。

4.9中的③所表示的对应关系是很有启发意义的,它是①和②两个对应关系之间的对应关系,表现了文化进化与个人学习之间的关系和生物进化与个体发育之问关系的某种相似性。这种对比可以使我们对于创造过程有一个更深层的认识。我们通常所说的创造是指通过头脑的活动产生出前所未有的思想、理论、方法、技术、作品等,加入到文化总体之中去,从宏观上看,是文化进化的软结构对硬结构的建构过程,而这个建构又是受到硬结构支持的。通过对应关系③,可以看到文化进化中的创造与生物进化中的“发明”相对应,而文化进化中的创造与个人学习中的理解之间的关系则类似于生物进化中的“发明”与个体发育中基因控制的建造之间的关系。从这个对应关系出发可以看到,像生物个体发育重复进化过程一样,个人学习的理解也是重复文化进化的创造过程。所以说,理解就是再创造。理解与创造的共同点是,两者需要相同的前置知识,相同的认知模型,同样受到短桥原理的限制;二者的区别则在于,理解具有明确的目标,通常不需要搜索过程,而创造则没有明确目标,往往需要困难的搜索过程。由此可见,不知道创造的机制,就不可能知道理解的机制,只是理解由于免去了搜索过程,比创造的效率高得多,几千年文化进化所创造的知识体系,可以在几十年或十几年中被理解,就像生物个体几十天,几个月的发育,由于没有搜索过程,可以重复几十亿年的进化。

从文化进化与生物进化的类似性对比之中可以得到的另一个重要的启发是,在文化进化的软结构之中所发生的创造过程与生物进化的软基因中的“发明过程可以用相同的原理来实现,这个原理就是变异与选择的原理。当然,人脑之中的创造过程与生物的进化过程既有相似之处,也有很多不同之处。生物进化中的变异的机制主要是基因的突变和重组,而选择的标准则是达尔文适应度,即包含了发育成长全过程在内的综合繁殖效率,评价准则是比较单一的;而人脑的创造过程中的变异机制与选择时的评价标准则要复杂得多,但是按照变异与选择这个思路可以对创造过程建立起比较有现实意义的模型。创造过程中的变异可以有多种不同的方式,最简单的是扩大智能模型的应用范围。在通常的行为和思考过程中,每一个智能模型都有其特定的应用范围,从而可以在解决特定问题时能够根据问题的特征直接调用智能模型进行预测。但是当认知主体遇到新问题时,会落人不知该调用哪个智能模型的处境,此时如果问题是处在短桥距离之内,认知主体之中有可能存在着可用的智能模型,只是缺乏调用这一模型所需的索引信息,这就需要动用搜索的方法,对于合用的可能性较高的智能模型进行逐个的调用试验,调用如果成功,调用时所用的检索信息就被固定下来,使得以后遇到同类问题时可以直接调用这一模型。变异的另一种较为复杂的方法是智能模型的重新组合,有点类似于遗传的杂交过程,在思考过程中由问题与环境信息调用不同的智能模型,不断编出新的“故事”,当这一故事较好地符合当时需要的评价准则时,就会进入意识而被记忆,以这个“故事”为雏形,逐步加工成新的智能模型。无论用什么方法,变异的目的都是产生大量的新的智能模型,而选择的任务则是从中挑出对解决问题有用的部分。因此选择时的评价准则就不会像达尔文适应度那么单纯,而是随要解决的问题而变化的。

    灵感是与创造密切相关的思维现象,结合探讨灵感产生的机制可以对人脑的创造过程作出更详细的解释。灵感作为一种思维现象早已引起很多研究者的关注,我们可以引用刘奎林在《灵感发生论新探》(载《关于思维科学》钱学森主编,上海人民出版社,1986)中所述的王国维对于创造境域所划分的三个阶段作为灵感现象的概括。第一阶段是“昨夜西风凋碧树”、“独上高楼,望尽天涯路;第二阶段是“衣带渐宽终不悔,为伊消得人憔悴”;第三阶段是“众里寻他千百度,蓦然回首,那人却在,灯火阑珊处”。这里的第一阶段是指进入问题环境,第二阶段是对问题百思而不得其解,第三阶段则是一种顿悟,此时会有一种茅塞顿开,豁然开朗的感觉。

上述关于灵感的一些现象只是我们的意识可以觉察的部分,单凭这些现象还不足以推测出灵感产生的机制。为了对灵感的现象作出解释,我们还需要知道无意识领域中的信息处理过程。灵感现象是意识与无意识相互作用的结果,这一点已经是很多研究者的共识,但是对于无意识领域中到底是什么样的过程,则是众说不一,缺乏有说服力的看法。大多数的看法都过于模糊,不具备工程可实现性。其中比较清晰的一种说法是潜意识推论说,基本思想是在意识领域提出问题之后,无意识的领域为之进行一系列的推论,当推论得到合乎要求的结果时,再进入意识,表现为灵感的产生。由于用计算机进行推论的问题在人工智能领域已经进行过广泛的研究,所以潜意识推论说的工程可实现性是显而易见的。但是这种理论也还有不少缺陷。首先是推论的方法问题,据我们所知,并不存在一种“发明的逻辑”,因此通过什么样的推论可以最终产生灵感的效果是一个未解决的问题。其次是复杂度问题,如果推论是一个搜索过程,那么应该如何避免指数爆炸就是很关键的问题了。第三是效率问题,由于神经元的计算速度比计算机低好几个数量级,即使把并列计算考虑在内,有些逻辑深度较大的问题仍然难以避免串行过程,这就造成对于一些出现很快的灵感在时间上与推论难以吻合。第四是与外界刺激的关系问题,有时灵感会由某种外界因素触发,这是潜意识推论所难以解释的。因此对于灵感的无意识过程还需要进行更进一步的探讨。

为了回避指数爆炸,创造的灵感所面对的问题必须满足一个前提条件,也就是将要作出的创造产物必须处于短桥原理所规定的距离之内。从另一个角度看,这意味着要想创造出一种新的理论,其必要条件是与之有关的前置理论已经存在。在历史上不同的人在相近的时间各自独立地创造相同理论的现象是不乏其例的,其原因就是当时的科学水平已经发展到使该理论处于短桥距离之内,或者说该理论所必要的前置理论已经完备了。例如牛顿与莱布尼兹基本上同时发明了微积分,其必要前置理论之一是笛卡尔的解析几何;达尔文与华莱士先后创造了进化论,当时的科学界已经有了拉马克的原始进化学说,而两个人在进化机制上的发明又都是受到了马尔萨斯人口论的启发,其区别仅仅在于达尔文是在偶然翻阅人口论时受到启发,而华莱士则是在思考过程中回忆起马尔萨斯人口论而受到了启发。产生创造灵感的另一个必要条件当然是创造的愿望。这种愿望有时产生于现实出现的问题的需要,更多的是产生于对于现存理论的缺陷的不满,因此即使新理论推翻了旧理论,旧理论仍然可以是新理论的必要前置理论。例如我们可以说相对论的前置理论是牛顿力学、麦克斯韦电磁场理论和洛伦兹变换。虽然爱因斯坦的相对时空观与牛顿的绝对时空观完全对立,但仍然可以说相对论完成了牛顿力学。从文化进化的宏观角度上看,前置理论的存在体现了硬结构对软结构的支持,而新理论被广泛接受则是软结构对硬结构的建构。

    创造灵感的三个阶段之中,第一阶段是明确问题的阶段。在这个阶段中可以意识到的是新问题导致对于新的理论或方法的追求,或是对于旧理论的缺陷所产生的不满。而在无意识之中,所进行的是对价值观的设定,虽然在这个阶段认知主体还不知道新理论或新方法是什么样的,但是新理论应该满足的要求却逐步明确起来了,也就是说为选择机制准备了明确的评价准则。发明创造的灵感产生的机制与回忆起老同学姓名的机制基本上是相同的,第一阶段的作用是在不知道所要回忆的姓名的情况下把要回忆的人确定下来,其根据则是关于此人的其他信息,例如相貌和一些特定的行为。而对于所要发明创造的新理论和新方法来说,在这一阶段就明确了这个理论应该满足哪些要求,对于旧理论的不满,也意味着对于不满之处的相反方向设定较高的价值。

灵感的第二个阶段是搜索阶段。在这个阶段中我们能够意识到的是集中注意力对该问题进行思考,不时有一些新的想法浮现出来,但由于不完全满足要求而被否定掉。在无意识之中进行的工作则是搜索过程,或者说是变异选择过程。从提高效率的经济原则出发,完全随机的搜索显然是不合理的,搜索应该按照可能性大小顺序进行,就像我们平常找东西一样,总是从找到这个东西可能性最大的地方开始,这是与基因突变不同的地方,而和带有性选择的基因重组有些类似。这种有序的变异可以用以下的机制实现。我们假定用问题检索智能模型时依靠某种特征向量,而在检索过程之中总是找出特征相似度最大的智能模型,如果检索得到的模型操作后不能得到满意的结果,则按照ES学习准则修改特征向量,使其与该模型相似度下降,这样原来处于第二位的模型就会上升到第一位,在接之而来的检索中被选择,依此类推,就可以实现有序的变异,直到模型操作结果满足评价准则时唤起意识的注意,进入第三阶段。如果在第一次检索中就得到了足以解决问题的模型,那么这只是一种顺理成章的思考过程,不会引起产生灵感的感觉,而只是已有知识的一次应用,这说明已有的智能模型及其检索信息对这个问题来说已经合乎要求,不需要记忆和变更,因此也不会在意识中造成太大印象。反之,随着检索失败次数的增加,在意识中有一种百思而不得其解的经历,而在无意识领域中,这个过程使得能解决问题的方法的评价值大大增加。评价值的增加有两方面的理由,第一是多次的检索失败意味着智能模型及其检索信息存在着不适应的一面,有必要进行修改;第二是经多次检索失败而仍不放弃这个问题,意味着该问题是很重要的。因此百思而不得其解的过程对于产生灵感是必要的,它造就了很高的评价值,使得在一旦得到解答时能够造成很高的评价情绪,在意识中造成豁然开朗的快感。长时间思考及多次检索的作用不仅仅是提高了正确答案的评价值,在思考中得到的部分正确答案也使问题的周围情况变得清晰,而使问题需要解决的核心更为突出,就像在回忆人的姓名的过程中,即使姓名没想起来,与此人有关的信息也会逐步增加,为成功的检索增加可能性。很高的评价值和丰富的相关信息在冥思苦想中断或结束之后也能保持相当长的时间,这样在我们并未有意识思考该问题时,只要注意力不被更重要的事所吸引,处于散漫的心情时,该问题也会由于其高价值而自动占领检索过程,在无意识中被搜索,当搜索得到所要答案时通过高的评价值唤起意识的注意。也可能偶然在观察或思考其他问题时碰到有用的模型,引起该问题解决的灵感出现,这些也都依赖于过去不成功的思考所积累的周围信息与评价值。因此人们常说,机遇只偏爱有准备的头脑。

    灵感的第三阶段是豁然开朗的阶段,通常称之为灵感的也多是指这个阶段,但是没有前两个阶段这个第三阶段是不可能到达的。有意识的思考所造成的评价值增高和周围信息的丰富,使得在有意识或无意识的检索过程中,或受到外部信息启发所获得的问题的答案获得很高的评价,从而引起意识的注意,并由于其高值的正评价产生很大的快感,造成了豁然开朗的感觉,阿基米德也就是在这种情绪下光着身子从浴池里跳出来,大喊大叫的。当然,灵感出现时只带来了解决问题方案的雏形,要将其变成可以对文化进行建构的成品则还需要乘胜追击作进一步的加工和完善化,但这个过程通常是通过常规的思考过程完成的。

从灵感产生的全过程特别是第二阶段来看,创造过程包含很多的随机因素,具有偶然性。有序的搜索虽然比随机搜索效率高,但是真正具有创造性的模型正是意味着它不处于有序搜索的前几名之内,而对于检索类似度较低的智能模型来说,必定是数量大而且类似度大小顺序并无多大意义,此时的搜索效率与随机搜索没有太大差异。因此创造活动都是风险很大的,失败的结局比成功的结局多得多。当然从统计意义上讲,已有的智能模型越丰富,搜索时间越长,获得灵感的可能性越大。但是搜索不可能无限地进行下去,认知主体只能根据问题的重要性来决定继续思考下去是否值得,因此对问题的评价也是影响创造灵感的重要因素之一。当然,失败的检索并不一定是百分之百失败的,往往可以得到部分解决问题的成果,这种成果能够突出问题最困难的核心,也会增加该思考过程的价值,因此在思考过程中可以得到是否应该继续思考的决策所需的信息,这也是认知主体判断问题是否处于短桥距离之内的根据。

    基于上述的对于创造过程的认识,以及非本体论的认识论的立场,我们可以进一步探讨与休谟悖论有关的问题,即归纳法是不是合乎理性的。归纳问题可以从两个角度来看,一个是逻辑学的角度,一个是心理学的角度,休谟和波普尔都对两者作了严密的区分,而且都是只从逻辑的角度讨论问题,而把心理学的角度放在自己的视野之外。从逻辑的角度看,归纳是不合乎逻辑的,从过去每天太阳都升起的事实不能合乎逻辑地推论出明天太阳还会升起。但是从心理学的角度来看,我们每个人都对于太阳明天还会升起这一点深信不疑。在本书的第二章我们已经通过取消真理这个概念从逻辑上消除了休谟悖论的起因,我们已经知道,无论是归纳还是演绎都不可能证明真理,逻辑的作用在于维护理论的一致性,从而使得理论具有稳定性和预见力。由于本书的目的在于研究认知过程,没有理由像休谟或波普尔那样把心理学的问题拒之门外,因此我们需要解释心理学意义上的休谟问题,即归纳法为什么看起来是可行的,为什么大量符合理论的事实会使我们增加对于理论的信任,为什么掌握大量的事实有利于我们创建较好的理论。

按照我们对创造灵感的内部机制的解释,所谓的“归纳”过程实际上可以分解为一系列的假说验证过程,即对于不同智能模型或模型的组合所进行的搜索过程。虽然事实不可能直接导致新理论的建立,即真正的“归纳法”是不存在的,但是在对智能模型的搜索过程之中,大量的事实却可以起到重要的作用。首先事实可以为智能模型的检索提供索引信息,而大量不同事实所具有的共同特征可以使索引信息更为可靠;另一方面,大量的事实为检索之后的评价提供了更为严格的约束,满足一两个事实的智能模型很容易找到,但由此而产生的理论稳定性差,而且预见力也未受到检验,很可能不满足更多的事实,而且容易出现若干理论难分优劣的局面,而大量的事实和现象则可以克服上述的缺点。公鸡哲学与守株待兔从逻辑上看只是一步与百步之差,但从认知过程来看则有很大的不同。从一只兔子在树上碰死可以引发出很多理论,也可能是纯属偶然,也可能像农夫所期待的那样今后每天都有一只兔子碰死,也可能是每两天、三天、一周、一个月或一年周期性的碰死,也可能以某种概率随机地碰死,但只凭一只兔子碰死的事实无法区别这些理论的优劣,也就不可能选定一种理论进行预测。因此对于建立理论来说,事实太少是不行的。公鸡哲学的情况就大不相同了,如果公鸡在第10天进行思考,得出每天能吃米的结论,那么这个理论在其后的10天都能进行成功的预测,而10天的经验已经足以排除两天或三天吃一次米的理论。从逻辑上讲,对于任何有限个事实都可以有无限个理论与之符合,因此一个事实与一百个事实没什么不同。但是从认知过程来看,认知主体中已经具有的智能模型只能是有限个,其组合也是有限的,一百个事实可以比一个事实造成更强的约束,有助于对理论的选择。

因此,知道大量的事实不仅有利于对智能模型的检索,也有利于对新理论的稳定性和预见力的检验。特别是用这些事实中的一部分作索引而另一部分作为检验时,所得到的理论更为可靠,正如我们过有限个点可以画无限条曲线,但过其中的一部分点所画的曲线正巧使得其他点也都在曲线上则要困难得多。这也就是归纳法的合理之处。特别是当某个理论能够预言未知的事实而又经受住预见正确的检验,则更可以提高理论的价值,因为这足以证明我们在创造理论时并没有参考这些事实,对未知事实的预见是货真价实的预见。当然,过去预测的成功从逻辑上不能保证未来预测的成功,但是在实际的认知过程中我们只能期待这种成功,寄希望于客观世界的相对稳定性,正是相对稳定性假定使得理论的预见力也保持相对稳定,没有这个假定,一切进化与学习在逻辑上都是不可能的。然而,我们也不应忘记这种稳定性是相对的,繁荣一时的物种也可能灭绝,鼎盛的文化也可能衰亡。因此在认知过程之中,智能模型总是随时对自己所做的预测进行着检验,在预测出现偏差时进行修正,乃至建立新的模型。认知的可靠性存在于这个动态过程之中,而无需任何与真理有关的假说。