信息自组织与知识信息处理

—与邹晓辉交流

    陈雨思 (四川大学)chenyusi@vip.163.com

 

一 . 从系统“点”描述到知识信息处理
二 . 信息三象原理
三 . 形式、内容、功用、目标系统的自组织
四 . 形式、内容、功用、目标系统自组织的形态
五 . 知识信息处理研究的进展与前景
     1.关于钟义信的全信息理论
     2.关于邹晓辉融智学理论
 

 

    知识信息的处理是个世纪难题,涉及到复杂系统的研究。故本文将从复杂系统研究说起。

 

. 从系统“点”描述到知识信息处理

 

作者在《 同态怎样成为科学的对象 ? 》等文章中指出 : 系统科学的深化遇到了怎样处理 系统“点”的问题。 

与牛顿意义上的“质点”不同的是,系统的 “点”不再是没有结构的质点 , 而成有结构的“结构点”, 因为系统的任何微小部分都可能有复杂结构,这种复杂结构对于系统运动的影响是不可忽略的 因而 , 怎样描述有结构的“结构点   , 就成了系统科学的深化面对的首要问题。

 

1. 系统的“点”与系统三要素

 

怎样描述“结构点”呢?结构的实质是有差异的部分相互联系在一起,并产生相互作用。故对“结构点 ”进行描述,即是对于结构中的差异、联系和相互作用进行描述。为了描述“结构点”, 我们要从系统的三要素物质、能量、信息说起,因为“结构点   ”中的差异与物质相关;相互作用与能量相关;联系则与信息相关。

 

2. 系统三要素与波粒二象性

 

系统的三要素是物质、能量、信息,这是一个基本常识。人们常常这样想、这样说;人们深入地研究质点运动、能量转换、信息传递、建立起了各种学说;人们认识到了在系统中三要素缺一不可。既然如此,系统的三要素还有什么讨论的必要呢?

问题的关键在于,从事物的一般属性的观点上看问题,系统的三要素给了我们什么启示呢?

这不竟使人想起了 17 19 世纪那场关于光的本性的论争。

关于光的本性问题,在 17 世纪曾经有牛顿的微粒说与惠更斯的波动说之争。两种学说都能解释光的反射、折射现象。但是,微粒说认为水中的光速大于空气中的光速;波动说则认为水中光速小于空气中的光速。由于光速无法测定,不能判断这两种学说的优劣。 19 世纪初,人们发现光有干涉、绕射和偏振现象,付科又用实验方法测定了水中的光速,证实了波动说的结论。麦克斯韦在光的波动说基础上,建立了光的电磁理论。波动说占了上峰,微粒说陷入了困境。

然而,19 世纪末发现的光电效应,又使波动说陷入了困境。爱因斯坦在普朗克量子假说的基础上,提出了光量子假说,确立了光的粒子性。通过一系列实验验证,光的波动性和粒子性相互并存的性质得以确定。

在光的波粒二象性基础上,德布罗意在 20 世纪 20 年代提出了微观实物粒子也具有二象性的学说。他说:“整个世纪以来,在光学上,比起波动的研究方法来,是过于忽视了粒子的研究方法,在物质理论上,是否发生了相反的错误呢;是不是我们把关于‘粒子’的图象想得太多,而过份地忽视了波的图象 ? ”由此,德布罗意认为微观粒子也具有波动性。很快,德布罗意的物质波就在实验上得到了验证。

微观粒子的波粒二象性给了我们一种什么启示 ?

当我们说到系统的三要素时,我们是否过于注意了三者之间的差异,并且仍然将它们当做独立物来看待呢 ?

我们是否仅把这三者当做系统的构成要素,而没有把它做为系统的普遍属性呢?

在一个复杂系统中,我们注意到了三要素的存在,但是,我们是否没有把这三要素推之于所有的系统状态 ( ) 之中,并把它们做为系统状态 ( ) 的普遍属性呢 ?

对于波粒二象性,只有在特定参照系 ( 实验装置 ) 中才能体现其某方面的性质;而同一系统状态 ( ) 上存在的物质、能量、信息,也只有在一定的参照系中才能显现,我们是否都在自己设定的参照系中讨论问题,而没有把各种参照系综合起来加以考虑呢 ?

如果我们将表现三者的参照系综合起来,并且从联系和统一的观点讨论问题,我们是否可以得到一幅物质属性的立体图象、得到一个类似于波、粒二象性的系统三象性的结论 ?

 

3. 系统的三象性

 

关于系统三象性的论证,可以从哲学的角度 , 通过分析矛盾的构成要素来讨论;也可以从爱因斯坦的质能关系式得到启发;还可以通过对信息本质的研究中推出;亦可以从系统的三要素共存的无数事实中归纳得出。有兴趣者请参见陈雨思的同态学讲座。但无论从什么角度讨论 , 系统三象性的结论都是成立的。

关于系统三象性的理论包含以下要点:

(1)  系统的物质特性、能量特性、信息特性总是与参照系相关联的。一个系统的物质特性、能量特性、信息特性,只有在该物体与一定的相异物的联系中才能体现。或者说,某种参照系使该物体的某方面特性得以体现。这与光子在光电效应装置中体现出粒子性质,而在绕射、折射等装置中体现出波的性质的情形是十分相似的。由于系统的物质特性、能量特性、信息特性的相对表现特性,故而将它们称为三象性。

(2) 在任何一个系统状态 ( ) 上,都存在着物质、能量、信息三象性,而且它们均可以在某种参照系中获得体现。换句话说,三象性是无处不在的,它遍及于任何系统的任何状态 ( ) :大至茫茫宇宙,小至基本粒子、夸克。因此,三象性不是个别物体的个别特性,而是所有系统的特性。

(3) 系统的三象性是不可分离的,它们总是存在着;并且当系统变化时,各自产生相应的变化。不可能想象某系统中仅存在三象性中的一个或两个;也不能想象,当系统发生变化时,它的三象特性不发生相应的变化。

任何系统状态 ( ) 上物质性、能量性、信息性不可分离地共存,并在一定的参照系中得以表现,这就是系统三象性的含义。

系统三象性是一个十分直接而形象的表达。稍加思索就会发现,原子、分子、生物,大脑,语言,艺术品,长城,秦俑,雪山,草地,无不具有明显的三象特性。杜牧的诗“折戟沉沙铁未销,自将磨洗认前朝,东风不与周郎便,铜雀春深锁二乔”就是对于系统三象性的绝妙描述。戟是一种实在物,它有内能,它的折断是一种能量作用,何以能“磨洗认前朝”呢 ? 因为它存在有前朝的信息。

不同系统的不同状态 ( ) 的三象性质是不相同的。例如:人脑表现出极强的信息特性,而质点主要表现出物质特性;光则由于静质量为零,其能量特性十分明显。

由于系统三象性具有普遍性,因此,人们常常从三象性的某一方面去研究它,其结果均具有某种普遍意义。而从系统三象性出发进行研究和思考,则会使获得的结论更为完整和普遍。

 

4. 系统三象性与信息恒量

 

对系统三象性的进一步研究,是要探讨系统三象性间的关系 , 这又涉及到复杂系统的一些重大问题。

(1) 等式与不等式的分裂

作者在 《试论系统科学的困惑与出路》 、《   克服不确定 , 发展系统科学 》等文章中 曾经指出了科学中存在牛顿、爱因斯坦与普里戈金、哈肯的分裂;克劳胥斯与达尔文的分裂;人与自然的分裂以及东方文化与西方科学的分裂。这些分裂从更深的科学意义上表现为什么呢 ? 这就是等式与不等式的分裂。

我们知道,在科学中有三个基本定律,即质量守恒定律,能量守恒定律和熵增定律。质量、能量守恒定律在微观领域又被推广为质、能相关定律。质量守恒定律,能量守恒定律和质能相关定律在数学上表示为等式。而熵增定律则是不等式 , 即在孤立系中 , 熵增总是大于或等于零 ( S 0) 。在这种等式与不等式的差别中,隐含着深刻的意义。

从系统三象性的基点来看,问题是这样的:任何系统状态 ( ) 上物质性、能量性、信息性不可分离地共存着,但物质 ( 质量 ) 和能量是守恒的,而信息却 ( 信息是负熵 ) 不守恒。

等式与不等式的分裂意味着什么呢?

由于在孤立系中熵总是增加的,而熵是混乱度。那么,系统在孤立情况下总是自动地趋向于混乱与无序,这就与生物的有序化发展产生矛盾,出现克劳胥斯与达尔文的分裂。

由于熵总是增加的,因而过程就出现单一的时间之矢,从而是不可逆的,这就与牛顿力学的可逆时间产生矛盾,出现牛顿、爱因斯坦与普里戈金、哈肯的分裂。

熵总是联系着大量子系统,而人类社会正是这样一个复杂的体系。在人类社会中不仅有熵增,而且有熵减,这就使关于人类的科学与整个自然科学产生分歧,出现自然科学与人文科学的矛盾。

如果深入考虑,东方文化的本质是在熵平衡的前提下来展开问题。因而,东方文化与西方科学存在着分歧。

质量守恒定律和能量守恒定律是自然界的普适定律,而熵增定律则适合于热力学孤立体系。任一质点或任一质点系都适合于质量守恒定律和能量守恒定律,但一个质点就谈不上熵增,非孤立体系的熵也不一定增加,

因而,等式与不等式的分裂,关键在于不等式,在于能否将不等式在更广泛的意义上转变为等式。

从系统三象性的基点来看,则是使系统三象性在等式的基础上达到统一。

(2 )  等熵过程

熵增定律仅适合于孤立体系,这是问题的关键。虽然从处理方法上讲,假定自然界存在孤立过程是可以的。但是从本质上讲,把某一事物从自然界中孤立出来,就使理论带上了一定的主观色彩。实际上,绝对的联系和相对的孤立的综合,才是事物运动的本来面目。那么,当系统不再人为地被孤立的时候,它就不再是只有熵增,而是既有熵增,又有熵减了。如果说熵增是混乱度增加,而熵减是有序度增加的话,那么,真正的过程必然是混乱与有序的综合过程。因而,系统就必然出现熵增和熵减诸种情况。

现在,一个中心问题出现了,在系统状态 ( ) 上的熵增和熵减过程中,是否存在一个不动点 , 使熵增和熵减达到平衡 ( S=0)

在孤立体系中,平衡状态也是熵增为零。当进行研究的时候,一旦熵增 ( ) 等于零,我们似乎就觉得比较满意了。熵增 ( ) 为零,熵为常数。常数还有什么研究的必要呢 ? 放在公式中就行了。然而,问题并不简单。信息熵等于常数,并不是其它量等于常数。物质、能量的出入使事物的质能变化不是一个常数。如果我们过去往往在物质、能量一定的前提下来讨论熵增加的话,那么,我们是否忽视了一个问题,即在熵恒定的情况下来讨论物质、能量的变化呢 ? 更进一步说,如果自然界存在这一类过程,即熵恒定的过程,再结合到质、能守恒,那么,我们就有了这样一组十分满意的公式:

                                             m  (t)=Cm

                                              u  (t)=Cu

                                              s  (t)=Cs

其中 t 是时间, m u 是物质量、能量、信息 ( 负熵 ) Cm Cu Cs 是常数。

由此,等式与不等式的分裂可以获得解决。

在系统状态 ( ) 的变化过程中,要在每时每刻都保持信息 ( 负熵 ) 为恒量,是一个太强的条件。而许多过程可以表现为在某些时间位点上信息 ( 负熵 ) 为恒量。这时,系统出现熵振荡过程,当熵振荡的时段极短时,它趋近于等熵过程。

在自然界和人类社会中,等熵过程是很多的,仅举几个例子做一简略讨论。

关于质点运动。因为在低速情况下,任何物体的质量是不变的。因此,它只有一种状态,故质点运动是一个质量等熵过程,这是何以能把任何一个物体视为一个质点的原因。在高速状态下,物体有多种质量状态,这时,质点运动就不一定是等熵过程。

关于信息变换与传递。信息变换与传递是一个典型的等熵 ( 不是指热熵 ) 过程。申农说,信息论研究的课题是如何“精确地或近似地在一点重现另一点新选择的符号”,这实际上就是试图在等熵条件下来研究信息传递。

另外 , 结构相似性、过程相似性、结构与功能、事物的同规律、集合的映射、实物与图形、记忆、语言与对象、生命常态、生物节律等,都包含着等熵过程。

 

5. 系统三象守恒关系

 

根据上面的讨论,我们可以进一步大胆地假设:信息 ( 负熵 ) 在过程的各个位点之间也许并不都是守恒的,但在一个完整的过程中是守恒的。这样,客观世界就存在三个基本的守恒关系式:即物质、能量、信息 ( 负熵 ) 的守恒关系。而这三个守恒关系之间还存在着关系。也就是说,系统三象之中还存在一个统一的关系,可称为系统三象守恒关系。

如果系统三象守恒关系成立,那么,科学的分裂将获得很好的解决。让我们描述一下这个前景吧!

根据系统三象守恒关系的结论,可以看到,只有等熵过程才是可逆的,而不等熵过程则不可逆,这就解决了牛顿的可逆时间与普里戈金的不可逆时间的矛盾,即:可逆过程是等熵过程,不可逆过程则是非等熵的。

根据系统三象守恒关系的结论,则克劳胥斯的结论适于熵振荡的熵增阶段;达尔文的进化论适于熵振荡的熵减阶段。从全局看,一个完整周期中熵的增减相抵,熵总体上守恒。同时,这也就解释了生命为什么既有熵增,也有熵减的问题。因为生命无非是一个熵振荡过程。

根据系统三象守恒关系的结论,也可以解释人与自然的分化。从系统三象性来看,人类在三象结构中处于强信息位置。生物次之,有机物更次之,无机物更次之。因此,人类社会由于三象性质不同,因而体现出特殊性。特别是生命过程和人类社会存在复杂的熵振荡,因而其运动规律与自然界有很大区别。但无论人还是自然,它们都统一于系统三象结构、系统三象守恒关系的基点之上。

根据系统三象守恒关系的结论,我们也可以理解东方文化与西方科学的分裂了。东方文化可以说是一种研究熵振荡的文化,这是从全过程和全局上来考虑问题。而西方科学则侧重于分析,即对局部和局部过程的研究,因而得出孤立系统熵增的结论。西方科学使人们对于局部的认识更为深刻,而东方文化则使人们对整体加深了理解。在系统三象结构、系统三象守恒关系的基础上,局部与整体将在更深刻的基础上统一起来,使东、西文化来一次大融合,使人们的思想来一次大飞跃。

有了系统三象,就可以来进行知识信息处理的讨论了。

 

信息三象原理

 

纯粹的信息系统是忽略了某些物质性质和能量性质的系统 , 但是 , 这样的信息系统仍然具有三象性;这样的信息系统中的每一种信息 , 也具有三象性 ( 每一种信息均可看作状态点 )

信息的物质性 , 是指信息的形式 ( 外壳 )

信息的信息性 , 是信息的内容 ( 含义 )

信息的能量性 , 是信息的功用 ( 功能 )

由于信息是有结构的,对信息进行三象性划分,意味着按三象性对信息结构进行划分,也就意味着把信息看做三象系统。即把信息看做形式、内容、功用系统,并由此来研究信息的结构、结构转换和结构自组织规律。

不过 , 信息的形式、内容、功用系统的运动通常不是自在的 , 而是受控的,如它受思维主体的控制。这种控制使信息的形式、内容、功用系统的运动带上目的性。这种目的性可称为目标。

由此,任何信息都可看做形式、内容、功用、目标系统。

形式、内容、功用、目标间的关系如何呢?

正如语言是实现思维、巩固和传达思维成果 ( 即思想 ) 的工具一样 , 信息的形式也是表现内容、巩固和传达内容的工具。内容 通常不是直接产生 功用 , 它要通过一定的信息形式。什么直接决定信息的形式呢?是信息的内容;什么直接决定信息的功用呢?是信息的形式。

内容—形式—功用相继形成近同态 , 由于近同态作用而形成形式、内容、功用间的对应转换 , 使之成为动态的。

内容得形式而行 , 形式因功用而显 , 形式、内容、功用随目标而动 , 形式、内容、功用和目标相互作用 ,形成一个动态 ( 平衡 ) 系统。

信息的形式、内容、功用、目标系统是一个自组织系统,只有通过对其自组织过程的研究,才能弄清其结构、结构转换和智能化问题。

 

. 形式、内容、功用、目标系统的自组织

 

形式、内容、功用、目标系统自组织的基本形式是 互适应多层次压缩自组织形式。

一般系统的互适应多层次压缩自组织过程是,系统的某些部分的相近同态之间产生相互联系和相互作用( 存在性干涉 ) ,出现存在振荡,达到动态平衡,形成稳定结构。稳定结构的形成使参与相互联系和相互作用 ( 存在性干涉 ) 的、系统某些部分的、相近同态的某些性质得以突现 成为新层次;而系统各部分的其它性质被压缩而成为新层次的混沌背景 ( 存在性分裂 ) 。新层次结构的不断发生(复制),使新层次由特例变成常例。

对信息的形式、内容、功用、目标系统而言,其各组成部分间的联系状况决定了它们相互间是否为近同态; 其近同态作用则体现为相近的逻辑步骤。 在该 系统中 , 由于新信息进入和原有信息间的新联系 , 使得该系统出现逻辑矛盾;这种逻辑矛盾导致局部新逻辑关系的出现;局部新逻辑关系继续与其它部份发生联系 , 从而进一步形成新逻辑关系;各种新旧逻辑关系进一步相联系,消除原来的和新产生的逻辑矛盾,成为逻辑自洽的稳定结构; 逻辑自洽的稳定结构使参与逻辑过程的、系统某些部分的、相近同态的某些性质得以突现 成为新的逻辑层次;而系统各部分的其它性质被压缩而成为新逻辑层次的混沌背景 ( 存在性分裂 ) 。新逻辑层次结构的不断发生(复制),使新逻辑层次由 特例变成常例。

信息目标系统对于信息的上述自组织过程具有重要导向作用。

在信息自组织过程中 ,信息量是变化的 , 这体现在非守恒信息上。不过,信息恒量也是存在的,这体现在整个过程中的守恒信息上。 守恒信息在逻辑自洽 稳定结构的形成中具有基础和核心的作用。

在信息自组织过程中 , 原来的守恒信息和非守恒信息都可能变化, 信息系统结构相应变化。例如, 从黑格尔到费尔巴哈, 守恒信息变化了; 从黑格尔到左派黑格尔,非守恒信息的变化了。

当然 , 在通常的形式、内容、功用、目标系统中 , 守恒信息并不是那么容易找到的。 例如,黑格尔的书,,它的守恒信息是什么呢?这是一个很复杂的问题。

怎样来寻找守恒信息呢?远就要应用同一性分析 ( 归纳和演绎都是同一性分析 )

现在举一个例子来说明信息的形式、内容、功用、目标系统的自组织过程。

我们对“牛顿死了”这句话进行分析。

“牛顿死了”这句话的内容信息、形式信息、功用信息分别是:

内容信息为:牛顿这个生命体死了。

形式信息则有多种:牛顿去世了;牛顿逝世了;牛顿离开了我们;牛顿到另一个世界去了;…。另外,表达“牛顿死了”可以用各种文字 , 还可用图象、声音、音乐、…

功用信息则更复杂:一个伟人停止了思考,伟人留下的真空谁来填充?科学将蒙受怎样的损失?世界将如何来悼念这位科学巨匠?他的学说将被怎样评价?牛顿以后的科学将如何发展?…

形式信息与功用信息的联系:不了解牛顿的人会说“牛顿死了”;一般性了解牛顿的人会说“牛顿逝世了”;亲近牛顿的人会说“牛顿离开了我们”;牛顿的亲人会说“他到另一个世界去了”。

虽然形式、内容、功用信息很复杂 , 但这些信息传递中却有一个不变的东西 , 即“牛顿死了”。“牛顿死了”即是这个动态平衡系统的不动点 ( 平衡点 ) 。即守恒信息。

上例是在我们知道“牛顿死了”这个守恒信息的情况下来讨论的。如果我们不知道“牛顿死了”这个守恒信息 ,则可从有关“牛顿死了”的形式、内容、功用动态( 平衡 )体系中寻找到。例如,看到一则“牛顿逝世纪念大会”的通知 , 则可推知“牛顿死了”。

“牛顿死了”这个守恒 信息并非永远守恒,因为形式、内容、功用系统是一个动态系统,这个系统的运动将导致守恒信息改变。而守恒信息的改变即是信息的自组织、是智能化。

在功用区,可以有这样一些逻辑过程:牛顿死了,但牛顿的英名、思想和事业不死。由此出现局部新逻辑关系:从英名、思想和事业上来讲,“牛顿没死”。

在功用区参照系不确定情况下,“牛顿死了”与“牛顿没死”就会产生逻辑冲突。这种逻辑冲突导致这样的问题:

牛顿是谁?

是生物牛顿 ,还是精神牛顿?

是科学家牛顿 ,还是宗教家牛顿?

什么叫“死”?

“死”是生物性的,还是精神性的?

若是生物性的,它指哪个层次的生物性?

这些问题的回答将导致“牛顿死了”这个守恒信息的改变,如改变成“生物牛顿死了,精神牛顿没死”,由此,形式信息将随之改变,功用信息亦将随之改变。此时,以“牛顿死了”这个守恒信息为前提的形式、内容、功用系统转变为以““生物牛顿死了,精神牛顿没死”这个守恒信息为前提的形式、内容、功用系统 。将两个系统相比,后者对“牛顿”、“死”和“牛顿死了”的认识显然深刻多了,即智能化程度提高了。

这个自组织过程可以应用同一性分析法来程序化 , 从而在电脑中得到实现

 

. 形式、内容、功用、目标系统自组织的形态

 

在信息的形式、内容、功用、目标系统的自组织过程中,如果趋向于形成“内容 / 形式 / 功用”的自组织,则该自组织过程侧重于认识   ;如果趋向于形成“形式 / 内容 / 功用”的自组织,则该自组织过程侧重于理解;如果趋向于形成“功用 / 内容 / 形式”的自组织,则该自组织过程侧重于决策。信息目标系统则对于信息形成何种自组织形态具有重要导向作用。

 

1. 形式、内容、功用、目标系统与认识

 

什么叫做认识?认识是构成内容自洽逻辑结构的自组织过程。

认识包括相互关联的两个过程,即信息压缩过程和信息展开过程。信息压缩与寻找守恒信息有关,信息展开与形成自洽逻辑结构有关。

从信息量角度分析,信息功用区所包含的信息量大于信息形式区,信息形式区所包含的信息量大于信息内容区。由于守恒信息在信息内容区表现较明显,故 寻找守恒信息的过程 , 即是通过将信息从信息功用区压缩至信息形式区,然后从信息形式区压缩至信息内容区,从而使信息量减少,守恒信息突现。这是信息压缩过程。

然后,以守恒信息为基点,将信息从信息内容区逻辑地推至信息形式区,再从信息形式区逻辑地推至信息功用区,即贯通全部形式区、内容区和功用区的逻辑路线。这是信息展开过程。

上述两个过程反复进行,从而使整个形式、内容、功用信息结构成为围绕守恒信息的自洽逻辑结构。

 

2. 形式、内容、功用、目标系统与理解

 

什么叫做理解?理解是构成形式自洽逻辑结构的自组织过程。

理解与认识虽然都是形成自洽逻辑结构的自组织过程,但是,理解并不一定是形成围绕守恒信息的自洽逻辑结构。它往往是以信息形式区的特定信息为基点,将信息从该基点逻辑地推至信息内容区、信息功用区以及信息形式区的其它部分。然后,又从信息内容区、信息功用区和信息形式区的有关部分 ( 守恒信息 )出发,逻辑地推出信息形式区的特定信息。上述两个过程反复进行,则形成贯通内容区、功用区以及形式区的其它部分的逻辑路线。从而使整个形式、内容、功用信息结构成为围绕信息形式区特定信息的自洽逻辑结构。

值得注意,理解往往是要沟通信息内容区和信息功用区,从而为决策提供依据。

 

3. 形式、内容、功用、目标系统与决策

 

什么叫做决策?决策是构成功用自洽逻辑结构的自组织过程。

决策与理解和认识虽然都是形成自洽逻辑结构的自组织过程,但是,决策并不是形成围绕守恒信息或形式区特定信息的自洽逻辑结构,而是要形成围绕信息功用区特定信息的自洽逻辑结构。其过程是以信息功用区的特定信息为基点,将信息从该基点逻辑地推至信息形式区、信息内容区和信息功用区的其它部分 。然后,又从信息形式区 、信息内容区和信息功用区的有关部分 ( 如有关的 形式信息)出发,逻辑地推出信息功用区的特定信息。上述两个过程反复进行,则形成贯通内容区、形式区以及功用区的其它部分的逻辑路线。从而使整个形式、内容、功用信息结构成为围绕信息功用区特定信息的自洽逻辑结构。

值得注意,决策往往是以信息功用区特定信息为基础,而对信息形式区的形式信息进行选择的过程。在决策中,守恒信息仅仅作为一个前提,信息自组织过程主要发生于信息功用区和信息形式区。

在信息的形式、内容、功用、目标系统的自组织过程中,认识、理解和决策是不能截然分开的 , 因为它们不过是信息自组织过程的对称破缺的体现 , 是信息三象对称破缺的体现, 在认识、理解和决策的每一个过程中,通常都包含有其他过程,只不过侧重不同而已。

另外,在一个较大的信息系统中,认识、理解和决策过程往往发生于信息系统的局部,在这个局部中,可以形成自洽逻辑结构,但此局部在与其他局部联系时,或将其放在更大的局部或整体中时,则不一定形成自洽逻辑结构。由于局部与局部的联系不是完全的,则在一个较大的信息系统中,局部与局部间通常总有潜在的逻辑矛盾,因而,一个较大的信息系统总存在某种不稳定性。信息系统自身的不稳定性与新信息的输入,使得信息系统的自组织不断进行,或者说使得认识、理解和决策过程不断进行,从而使得认识、理解和决策过程呈现出阶段和层次来。

 

. 知识信息处理研究的进展与前景

 

1.关于钟义信的全信息理论

知识信息处理问题,也就是智能系统问题。正如钟义信在《全信息理论与高等智能》一文中指出的,智能系统研究经历了“结构模拟—功能模拟—结构模拟”的曲折过程,明确地昭示人们:对于智能系统这样复杂的研究,单凭结构模拟或单凭功能模拟都不可能解决全部问题。出路只有走向两者相辅相成的综合。于是,20世纪90年,混合系统—专家网络问世了。

混合系统试图综合神经网络与专家系统两方面的优势来解决智能问题,钟义信认为这一思路无疑是合理的。至于在什么基础上来实现两者的综合 , 钟义信认为:解决智能问题的出路是在全信息理论这个基础上实现结构模拟方法与功能模拟方法的有机综合。

什么是全信息理论?全信息理论是一种同时考虑信息的形式因素(语法信息)、含义因素(语义信息)和效用因素(语用信息)的理论。

我们可以把前面从系统三象理论逻辑地获得的信息三象理论与全信息理论做一比较。

由全信息理论可获信息的形式因素(语法信息)、含义因素(语义信息)、效用因素(语用信息)系统。或简单地称做信息的语法、语义、语用系统。

由信息三象理论可获信息的形式、内容、功用、目标系统。

如果不考虑目标 , 则信息的语法、语义、语用系统与信息的形式、内容、功用系统在形式上完全一致。

两个系统的区别是:

(1) 来源不同

信息的语法、语义、语用系统是钟义信根据自己对信息的深入理解得出的信息分类体系。

信息的形式、内容、功用系统则是陈雨思根据自己对系统的物质、能量、信息关系的深入研究得出的信息结构体系。

(2) 思想基点不同

钟义信对信息的理解是继承申农的思想,以“信宿”为基点。申农把信息理解为信宿 ( 接受者 ) 的“惊奇程度”;钟义信把信息理解为信宿 ( 认识主体 ) 所感知的事物运动的状态和方式。由于信宿千差万别,不同信宿对同一语法信息的认识和理解大不一样,同一语法信息对不同信宿的效用也大不一样,例如:同一电信号 ( 语法信息 ) ,既可对某些信宿 ( 如人脑 ) 毫无影响,也可使某些信宿 ( 如电脑 ) 产生很大影响。因此,基于信宿的语义信息和语用信息的描述非常困难。

陈雨思在对申农、钟义信和其它学者的信息理论进行学习和研究的基础上,分析了系统的物质、能量、信息关系,得出信息三象理论。根据信息三象理论,对于信息,不仅要从信宿上来理解,而且要从信源和信道上来理解。从信源上讲,信息主要表达信源的结构和结构变化 ( 或信源的运动状态和方式及其变化 ) ;从信道上讲,信息主要表达 ( 信源和 )信道的结构和结构变化 ( 或信道的运动状态和方式及其变化 ) ,从信宿上讲,信息主要表达 ( 信源和 ) 信道信息对信宿产生的效用 ( 或信宿的运动状态和方式及其变化 )

信源、信道和信宿不可分割地成为信息系统。表达信源结构和结构变化的信息构成信息系统的内容区;表达 ( 信源和 ) 信道的结构和结构变化的信息构成信息系统的形式区;表达 ( 信源、信道和 ) 信宿的结构和结构变化的信息构成信息系统的功用区。这三个区既相互区别,又相互联系,共同构成一个信息自组织系统。

当然,由于信宿与信源、信道和信宿本身都有关,故信宿可以感知信息的内容、形式和功用,因而,信息系统的功用区又可划分为感知信息内容的语义区;感知信息形式的语法区;感知信息功用的语用区。在这种意义上,信息三象理论与申农、钟义信和其它学者的信息理论达到一致。

(3)对系统三部分的解释不同

钟义信认为,信息是事物运动的状态和(状态改变的)方式。有各种层次的信息。

从认识主体所感知的事物运动的状态和方式来区分,语法信息是其形式化关系;语义信息是其逻辑含义;语用信息是其相对于某种目的的效用。

陈雨思是根据信息三象理论来对信息的形式、内容、功用系统的三部分加以解释。

信息三象理论认为,任何信息都有结构。任何信息结构都有物质性、能量性和信息性 , 由于信息结构的对称破缺,其三象性质在信息结构的各部分是不一样的,因而,该信息结构可划分为形式区、内容区和功用区。

信息的物质性 , 是指信息的形式 ( 外壳 );主要体现在信息的形式区。

信息的信息性 , 是信息的内容 ( 含义 );主要体现在信息的内容区。

信息的能量性 , 是信息的功用 ( 功能 );主要体现在信息的功用区。

由于信息是有结构的,对信息进行三象性划分,意味着按三象性对信息结构进行划分,也就意味着把信息看做三象系统。

(4) 对系统三部分间关系的解释不同

钟义信认为,研究语义信息必须以语法信息为基础,因为“含义”是针对具体的状态和 ( 状态改变的 ) 方式来说的。同样,研究语用信息必须以语义信息和语法信息为基础,因为“效用”是针对具体的状态和 ( 状态改变的 ) 方式及其含义来说的。因此,语法信息、语义信息、语用信息这三个层次是依次包含的。语用信息层次包含了语义信息层次,而语义信息层次包含了语法信息层次。

信息三象理论认为,研究信息结构必须以信息的内容 ( 含义 ) 为基础,因为信息的内容 ( 含义 ) 是信源的结构和结构变化,是信息之本 , 信息系统中的守恒信息往往存在于信息的内容区。

信息的内容 ( 含义 ) 可以表现为各种形式 , 因为信道的结构和结构变化是多种多样的,内容惟一 , 而形式多样,但形式中包含有内容 , 信息系统的形式区信息包含了内容区信息。

信息的功用比较复杂,他既与 ( 内容信息和 ) 形式信息有关,又与信宿的结构和结构变化有关。因此 , ( 内容信息和 ) 形式信息作用下,信宿的结构和结构变化表现出的功用信息 , 就包含了 ( 信源、信道和 ) 信宿的结构和结构变化的信息。也就是信息系统的功用区信息包含了 ( 内容区和 ) 形式区信息。

可见 , 按照信息三象理论,功用区信息包含了 ( 内容区和 ) 形式区信息,而形式区信息包含了内容区信息。

(5)对系统的解释不同

钟义信认为,智能系统的关键在于对信息的理解。系统对于某种信息的理解,实际是根据系统直接感受到的该事物的语法信息和直接或间接感受到的相应语用信息来导出语义信息的过程。

信息三象理论认为,智能系统包括认识、理解和决策三个过程。

认识是构成内容自洽逻辑结构的自组织过程。

理解是构成形式自洽逻辑结构的自组织过程。

决策是构成功用自洽逻辑结构的自组织过程。

信息目标系统则对于信息形成何种自组织过程具有重要导向作用。

钟义信的理解过程类似于信息三象理论的认识过程。

(6) 对系统运行的解释不同

    钟义信对系统运行的解释基于信息认知原理。他认为,信息认知原理所关心的主要课题 , 是要探索各种可能的机制 , 把信息加工成智能;所谓智能 , 就是在一定的环境下针对特定的目的而有效地获得信息、处理信息和利用信息 , 从而成功地达到目的的能力;智能系统实际上就是一种高级的信息系统。

    钟义信关于智能系统是信息系统的论断 , 是从本质上对智能系统进行的简化 , 具有重要的价值。

    信息三象理论认为,智能系统不仅是信息系统 , 而且是信息自组织系统 , 智能系统的运行是一个互适应多层次压缩自组织过程;这个自组织过程包括认识、理解和决策三个可实现的逻辑过程;智能是信息自组织的结果。在开放的环境下 , 智能系统的自组织是不断进行的。

    综上所述 , 陈雨思认为 , 钟义信的全信息理论具有重大价值 , 如果能充分考虑信息自组织问题 , 则其技术前景是非常好的。

 

2.关于邹晓辉的融智学理论

    在知识信息处理方面,另一个值得重视的工作是邹晓辉的融智学新范式

    从理论创新的角度 , 邹晓辉提出人工智能、人类智能和协同智能关系的理论;义、文、物、意构成的知识分类体系;信息的基本定律(本真信息,唯一守恒;广义文本,对应转换;基因通式,序趣简美;特式特例,非非各平 [ 即:非对称、非同步、各自平衡 ] ) 和文化基因通式等,形成了融智学新范式。我以为,融智学新范式是创立者长期研究、深思熟虑、融汇贯通的结果,是应该加以足够重视的。

    基于融智学新范式而得的“一种知识信息数据处理方法及产品”是一项获得国家专利的技术,这里不准备对其技术细节做出评价 , 而仅从理论的角度加以讨论。

    为了了解融智学新范式有什么创新意义 , 我们不妨将其与钟义信的全信息理论做一比较。

     所谓融智概念体系,是指以义、文、物、意为基础而构成的协同智能主体的知识概念体系。 这与钟义信的全信息理论既是相通的 , 也是不一样的。

    邹晓辉说, 形式信息涉及文、物;语义信息涉及义、意(注:现有的意义理论及语义信息技术没有明确区分义与意)。这里的形式信息 对应于钟义信的语法信息; 这里的语义信息对应于钟义信的语义信息;协同智能 对应于钟义信的 语用信息 , 这是融智概念体系与钟义信的全信息理论相通之处。

    值得引起注意的是,融智概念体系把形式信息分为文、物;语义信息分为义、意;(语用信息归入协同智能?)。邹晓辉还特别强调:现有的意义理论及语义信息技术没有明确区分义与意。这种分法的创新意义何在呢?下面我们以信息三象理论为基点来做一分析。

    前面我们指出 , 全信息理论是以“信宿”为基点的 , 由于信宿千差万别 , 基于信宿的语义信息和语用信息的描述非常困难。另外我们还指出 , 信宿的结构和结构变化表现出的功用信息 , 包含了信源、信道和信宿的结构和结构变化的信息。

    因此,语义信息和语用信息的描述困难在于,1. 信宿千差万别; 2. 信源、信道和信宿的信息混杂在一起。而解决之法是 ,1. 对千差万别的信宿给以适当描述; 2. 把信源、信道和信宿的信息做分别描述。

    融智学分类体系恰好对这两个问题给出了自己的回答。

    首先是人机分离。即采用人工智能与人类智能既分工又协调的协同智能模式 , 把不确定程度较大部分交由人类智能去完成;把不确定程度较小部分交由人工智能去完成 , 然后两者协调形成协同智能。

    其次是信道和信源、信宿分离,文、物与义、意分离。融智学新范式对形式信息的理解与全信息理论是有差别的。邹晓辉指出,,指符号形象;,指载体载能 , 他还用 曲、棋、语言来做比喻 , 指出: 乐谱、棋谱、字或字母或动作等,是符号形象,即;琴、棋、传感器官(含使用过程)等,是载体载能,即;这从广义来讲, 是对应的信道信息。

   另外是信源和信宿分离,义与意分离。邹晓辉指出,,指本真信息曲、棋、语言的机理(含:法则),是本真信息,即义;,指意识意向演奏者、下棋的人、智能主体的选择(包括以虚拟或实体的形式体现的意),是意识意向,即意。所谓本真信息、机理 , 应当主要是表达信源的结构和结构变化 ( 或信源的运动状态和方式及其变化 )的信息;而所谓意识意向,应该是信息选择者的意识意向,应属于信源(亦可属目标系统,此处不讨论)。

    将义与意分离,或将信源和信宿分离,其重要之处在于守恒信息的突显。邹晓辉强调指出,本真信息,唯一守恒。也可以说,表达信源的结构和结构变化 ( 或信源的运动状态和方式及其变化 ) 的信息在信息过程中是守恒的。

    上述讨论是就单一信息传递过程而言的 , 单一信息传递过程的复杂叠加,就形成 信息的自组织过程,而人类文化是信息的自组织过程的结果。既然单一信息传递过程存在守恒信息,那么复杂信息传递过程也必然存在守恒信息, 信息的自组织过程也必然存在守恒信息 , 最后归结为人类文化必然存在守恒信息 , 这就导致了文化基因的结论。

    文化基因的结论意谓着人类文化均由文化基因组合而成 , 任何文化过程都表现为文化基因的提取、剪接或重组的过程,将这个过程在电脑中实现,就是文化基因工程。

由上可见 , 融智学新范式在理论上是有突破的,在知识信息处理问题上的价值是显然的,其市场价值也是很大的。但是 , 融智学新范式强调的是人类文化的结构性因素 , 即将文化分为守恒部分和不守恒部分,而对于人类文化的运动、发展和自组织,则涉及较少,因而还未能解决电脑智能化的一系列问题。如果能在融智学新范式的基础上 , 进一步考虑信息的自组织问题,则其价值将更大。

    如果按照信息三象理论来分析,则融智学新范式特别是文化基因研究的文化价值就显现出来了。

    正如人们常说的 , 当今正在出现一个世界性的信息化过程

    信息化过程本质上是信息的自组织过程。

    当今世界的信息自组织过程并不是孤立的 , 从近处看, 它是人类产生以来所有信息自组织过程的继续,从远处看 , 它是地球所有信息自组织过程的继续。

    我们所在的宇宙是一个物质的宇宙。这个物质的宇宙正在向信息化方向发展。

    宇宙的信息化集中体现在地球的信息化中。地球的信息化表现为地球的信息自组织过程。

    地球信息自组织的第一个过程是有机过程 , 其结果是形成有机物

    地球信息自组织的第二个过程是生物 ( 植物、动物 )过程,其结果是形成生物基因

    地球信息自组织的第三个过程是人的精神过程,其结果是形成精神(文化)基因

    今天,形成精神(文化)基因的过程并未完结,多元文化的冲突仍然剧烈,世界大同的出现还遥遥无期,而已形成的有机物、生物基因和精神(文化)基因的有序结构正在被人类打破,人类面临多种危机,在此情况下,研究现有的精神(文化)基因,寻找这些基因的稳定、变化和发展的机制,其对于人类文化的价值,自然是很大的。