说明:本文取自邹晓辉的融智网站,特表示感谢--编者2001,6,23
-------

语言及语义信息的统一参照系

邹晓辉

摘要:提出义、文、物、意的融智概念体系,是对传统的意义理论以及人类知识概念体系进行的彻底变革。融智概念体系以及相应的数学模型是语言以及语义信息的统一参照系的最佳形式。

The Unified System Relate to Lingual and Semantic Information

Zou Xiao-hui

Abstract: It is completely revolution against the traditional meaning theory as well as knowledge or concept system for Human to propose Rong-zhi concept system of meaning,,1anguage,thing and idea. The Rong-zhi concept system and it's model is the best unified system lingual and semantic information.

      语言,是智能主体之间进行知识信息交流的工具。文字则是语言的一种表达形式。现代汉语这种语言文字形式体系,基本上是自古代汉语的方块文字的延续和简化而来的,由于近代100多年来受到英文等拼音文字的影响,中西两类文化或文明的融合,形成了现代汉语的这种字词并行的格局。

      古代汉语的基本语言单位是字。古代及现代的英语等西语的基本语言单位是词。现代汉语由于吸收了词的概念,许多古字则可以不用了,因为,无论是采用字还是采用字组做词,都可大大降低造字的需求数量,,即:组字成词或直接用字做词而不必再像古文那样造许多繁杂的字。这是引进英语等西语的表达形式的好处。

      遗憾的是,字与词分庭抗礼的局面,事实上阻碍了现代汉语自身的理论体系的建立或完善。可以说,以字为基础建立的"语义句法"和以词为基础建立的"语形句法"{1}各有千秋,而且,它们各自都有相应的语言事实做支持。这就造成了现代汉语同时受两套思维模式、两种句法体系和两类表达形式体系所支配的现实格局。

      不论是从有利于人类这种智能主体更好地理解现代汉语的角度,还是从有利于人工智能主体更准地识别、理解和再现或表达现代汉语的角度,都必须正视上述事实。

      从中文信息处理的角度看,以字为本位则更加便于机器识别单个的字,而以词为本位却不便于机器识别或切分词,因为,机器难于区分独字词、二字词和多字词。从理解和表达的角度看,无论哪一种或哪一级的语言单位,都能从"语义三角"的各个方面进行分析和表述。

  首先,意义,作为语义信息的核心,由于它暗含:“意=义”这样一个假设,因此,造成了极大的混乱。我认为:这正是语义这一概念或语义信息的定性及定量问题始终得不到根本解决的原因之所在。

因为,""是常例,"="只是特例。所以,意与义是决不能简单地混为一谈。为此,有必要提出义、文、物、意的融智概念体系,对传统的意义理论以及人类知识概念体系进行彻底的变革。在此,,指本真信息:文、物、意,都属于义的衍生形式或派生现象,其中,,指符号形象:,指载体载能:,指意识意向。从哲学的角度看,本体论的形成、认识论的发展、语言学的转向,这三次大的进步,实质上是从物、意、文三个方面分别形成了相应的立论体系。虽然它们都试图向本真信息迈进,但是,由于历史或时代的局限性和种种原因,至今,始终没有形成完整的义的立论体系。

例如:科学,虽然是以探求本质、机理及法则等本真信息为己任,但是,至今仍不具备形成完整的义的立论体系的条件,因为,科学的特征使得各个学科“只见树木而不见森林”。到目前为止,各门学科实际上都是在探索现象背后的本质,即:支配物、意、文的义,非常遗憾的是:其结果往往支离破碎而难以整合,因为,哲学、科学、艺术、技术、工程,都有各自相应的表达形式。

其次,这里所说的表达式,涉及广义真实文本,包括:数、文[注:狭义的文本(如:文字)]、图、表、音、像、立体、活体(注:在此,,可以被视为特殊的广义的文本)。

在此,指称的对象,可以是义、文、物、意的任何一个方面的具体内容与形式。从通俗的例子来看:曲、棋、语言的本质或机理或法则等,可视为义;乐谱、棋谱、文字等,可视为文;:琴、棋、器官或装置等,是物;:演奏者、下棋的人、智能主体的选择,可视为意。其中,只有义是唯一守恒的,而文、物、意都是可变的。

只有判断并选择变化的形式,了解与认识变化的法则,才能有的放矢地调整智能主体自身的行为方式,同时,相应地改造主、客体之间的关系(包括:主体与主体、客体与客体、主体与客体之间的相互关系〉。

由于智能主体,包括自然人和机器人或系统,是特殊的整合物,因此,对知识信息的识别、理解、表达,实际上就是一个智能主体上、下载知识信息的过程。既然如此,转载信息的基本单位是字或词并不是问题的关键。

或许对自然人而言,分别以字或词为基础,能构成不同的思维形式及相应的句法形式和表达形式体系。但是,对机器人或系统而言,关键是如何对构成字或词的基本元素的识别和计量的问题。

  全域数码定位系统对文化基因元素及其组合的计量或"编号排位"就是智能主体对知识信息的表达,反过来的"对号入位"则是对知识信息的识别和理解。

如果两个智能主体之间在传递知识信息数据的过程中,各自依据的参照系不同,即:各自进入了"编号排位"不同的"分剧场",就算双方的""""的形式都是一样的,但是,实际上却各是各的一一根本不搭界。现在,包括过去和近期的未来,各个智能主钵之间的知识信息交流或数据交换,往往就是属于这种"不搭界"的状态。

如果各个智能主体之间,在进行知识信息交流时,能够依据统一的参照系,那么,交流和理解的许多困难都将迎忍而解。人类的确是在向这个方向努力的。但是,由于作为共同参照系的科学范式以及相应的语言体系本身(注:特别是人类的概念体系)处于变化之中,加之海量信息和知识爆炸,使得人们往往只有招架之功而没有还手之力。

由于近、现代以来形成的相对时空观以及相应的逻辑体系,使得相应的思维体系、语言体系和软件体系都充分表现出各自为政的多样化冗余特性。因此,即使序、趣、简、美且非常适用的统一参照系展现在人们面前,人们也往往会视而不见。即:对它的存在不理解,也感觉不到。

各个国家、各个产业、各个行业、各个企业、各个人、各个学科,似乎都在忙于建立或维护各自的相对参照系,并在这种各自为政的忙碌之中随着生命周期的变换而消逝着。

义的形而上特性、文的形而中特性、物的形而下特性,都受到意的无形或变化不定的特性的影响或干扰而难以为人们所认识和把握。

至今为止,还没有其他任何人提出过这种具体的可操作的统一参照系。不知牛顿后半身追寻的""和爱因斯坦晚年试图证明的"统一场"是否就是上述这种统一参照系?

我认为:融智概念体系以及相应的多元数系就是上述这种统一参照系的最佳理论形式。

由此构成的文化基因通式就是绝对时空观和相对时空观的最简统一形式,又是唯一能够集中表达其它所有文化形式的基因元素及其组合的万能公式。

注:至于该理论以及公式如何具体地描述或表达,特别是如何利用该统一参照系为人类做事的具体方法和形式,在《一种知识信息数据处理方法及产品》(专利已提前公开)的发明专利说明书[2]中有详细说明及实施例。

  注:1、北京大学徐通锵《语言论》199710月东北师范大学出版社

    2、邹晓辉《一种知识信息数据处理方法及产品》CN1274895A国家知识产权出版社