4.9  模式识别

    通常,模式识别是指把感觉输入的模式信息变换成符号信息的过程。更深入地看,模式识别是一个归类过程,对某一个模式判断它属于已经分好的若干类别中的某一类,如果给每一类加上一个符号作为其名称,那么就可以完成从模式到符号的变换。但是这个符号只对认知系统的外部观察者是有意义的,如果我们不把认知主体看成一个符号处理系统的话,那么分类的结果只要在其后的信息处理中起作用,它被赋予什么符号或是否赋予符号对于认知主体来说是没有意义的。站在符号主义的立场上看,模式识别仅仅是对输入信息的前处理,并不处于与智能有关的核心地位,但是从认知的角度看,归类的基础是分类,而分类是认知的极为重要的核心问题,或者说,识别(Recognition)就是再认知(Re-Cognition)

对于把模式信息变换为符号信息的工程模式识别问题,主要可以分为特征抽取和归类判别两个步骤,首先从模式中计算出若干特征的值,然后在特征空间中对特征向量进行归类。但是认知主体中的模式处理还要复杂得多,包括识别目的和背景信息等因素对模式处理的影响,以及通过某种行为主动获得信息的过程,而且归类判别的标准也不是先验地给定的,而是在学习中逐步完成的。这意味着归类即识别的能力是在认知过程中通过学习建立分类而逐步获得、不断完善的,或者说识别与认知是浑然一体的。因此归类所用的判别函数不仅随目的和环境而变化,而且随学习进程而改变。例如我们可以学会根据高度、平整度、支持能力等特征来识别椅子,但在特殊环境下出于别的目的,则又可以根据重量、可把握等特征把同一个物体看成武器,能够抡起椅子打人。

    因为我们把模式而不是符号看成是认知过程中信息处理的基本信息单元,所以模式识别问题不仅由于与认知的直接关系而具有核心地位,而且由于与所有的信息处理有关而处于基础位置。也就是说模式处理在认知过程中具有无处不在的普遍性,不仅对于输入的模式信息需要抽取特征或进行判别,模式信息的联想记忆的存取也需要特征进行索引,智能模型及感觉动作联合也是由模式联想串构成的,智能模型的检索也是靠索引模式的相似性即归类处理,由智能模型的预测所得到的信息依然是模式信息,输入模式经特征抽取所得到的若干特征组成的特征向量仍然是一个模式,评价向量也可以看成是一个模式,因此我们所讨论过的认知系统的所有低层次和高层次的信息处理最终都是建立在模式处理这一基础之上的。反之,我们不用符号而用模式作为认知过程的基本信息单元,也正是由于符号难以成为上述各种处理的基础,以符号为基础的系统不存在内在的距离定义,因而难以实现渐近的学习过程,难以自动具备类似度,也难以自发地形成语义,难以自行实现分类。

把模式识别的整个处理过程分为特征抽取和归类判别两个步骤,可以根据短桥原理来进行划分,其原则就是把判别函数限制在线性范围之内,也就是说特征抽取应使产生的特征空间中的归类是线性可分离的,从神经网的角度看就是归类可以在单层神经网中实现,这样就可以保证判别函数的学习过程保持高效率而不会遇到指数爆炸。这样通过学习达到适应分类的认知过程也就不困难了。在工程模式识别系统之中,这种学习可以是有监督或无监督的,有监督时模式的分类结果已知,即分类是由系统外部决定的,所谓无监督学习也是由外部输人模式及特征抽取方法暗中决定学习结果,学习所依据的原则是不明确的,无法保证学习结果的效能。这两种学习方法对于认知系统来说都是不适宜的。认知系统不可能完全指望外部给定的分类,而应该能在系统内部自行产生概念,所以有监督学习是不可取的。根据丑小鸭定理和认识论的逆境模型,像无监督学习那样以纯客观标准决定分类的企图也是注定行不通的。指引分类学习即概念生成的只能是认知系统内部的评价准则,所有评价准则归根结底要服从达尔文适应度,但适应度并不适合作为学习的评价准则,学习所需要的是符合适应度即存在原则而又可以直接起作用的原则。从感觉动作联合的角度可以得到一个比较直接的原则,那就是感觉信息的语义是由与之关联的动作决定的,分类的直接目的是引起某种动作或智能模型操作(内化的动作),因此动作或模型操作的成败可以作为最直接的信息用于判断分类是否合乎要求,通过ES学习或其他学习算法对分类进行修正,对特征进行选择。有效的分类应该满足的一个原则是使归类所引起的动作或智能模型操作获得成功,这也是概念形成的原则。

    与判别归类相比,特征抽取要复杂得多,对于模式来说特征抽取的方法有无穷多种,因此在原理上不可能存在客观上最佳的特征,较低层次的特征抽取方法是生物进化史上诸多发明的产物,与信息源的物理或化学基础有关,因此决定特征抽取的算法也是比较复杂的。在较高的层次上,可以根据分类学习的结果决定各特征的重要程度对特征进行选择;较低层次的模式信息处理则主要参考信息源和感觉器官的物理、化学特性和模式信息的性质;对于中间层次来说,则只能依靠普遍的评价准则即特征的稳定性和可预测性来进行选择。

从整个模式识别系统来看,模式的认知与识别也是一个广义进化系统,特征抽取是其硬结构,判别归类是其软结构,特征抽取对判别的支持是显而易见的;判别归类在各种价值观的引导下进行学习,形成有效的分类(聚类),完成一步认知过程,形成概念;与此同时,分类也构成一个层次的特征抽取,分类结果对于更高层次的分类来说是一组特征,这也就是软结构对硬结构的逐层建构。对于动物或人这样的天然认知主体来说,较低层次的特征抽取能力(算法)是在进化过程中获得的,对于个体来说则是先天的,而较高层次的特征抽取能力则可以靠后天学习逐层建构。后天学习对于低层次的特征抽取也并非完全没有影响,例如猫如果在出生后只看到过纵向条纹而未看到过横向条纹,其神经系统中对横向条纹起反应的神经元就会减少,而纵向细胞会增加,但这仅仅是一种选择过程,像神经达尔文主义所主张的那样,而这两种细胞或模块作为某一阶层的特征抽取算法,则是遗传决定的。由于学习所固有的低效率,从白纸开始的学习是不可取的。对于人工认知主体来说,模拟整个进化过程来产生特征抽取算法是极为困难的,比较现实的方法则是通过研究天然认知主体来得到设计低层次特征抽取算法的原型,或者从文化积累中利用已知的数学方法。而对于特征的选择则可以靠学习来进行,并通过学习过程实现更高层次特征抽取能力的建构。总的来说,设计人工认知主体时还有很多需要预置的信息,例如模块资源分配、学习算法、学习的大时间尺度程序、评价准则的安排等等,人类智能中由遗传决定的部分可能比我们想象的要大得多。