我对复杂性的认识
--改造后的熵
张学文
(新疆气象科学研究所,乌鲁木齐,830002)
e-mail: zhangxw@mail.wl.xj.cn
摘要
本文引入广义集合概念以定量描述客观事物后,指出广义集合必然伴有一个分布函数、对分布函数的一种计算就是该事物的内部状态的复杂程度。复杂程度与信息熵和热力学熵是成正比例的。所以熵可以称为复杂程度、最大熵原理可以称为最复杂原理。这种见解使复杂性研究可以吸纳熵研究的成果。复杂程度是与质量、能量同等重要的概念。复杂程度概念的客观性意味着自然界必然存在一个关于复杂程度的客观规律。
1.引言
我的专业是气象,70年代用天气的出现概率(分布)计算了很多气象信息熵[1]。80年代发现降水在面积上的分布,以至各种气象要素在空间、时间和大气质量中的分布问题都可以类似地计算出对应的熵[2]。由于它们等价于信息熵又有客观物质性,就把最大熵原理用与其上,发现它可以解释气象要素的分布。这种成功为熵原理用于热力学领域以外的气象领域打开了出路。经多年努力我们把这些研究成果汇入“熵气象学”[2]名下。
这种成功也使我们把这个思路向其他科技领域去推广,1987年召集的熵与交叉科学研讨会就是其一种努力。80年代我提出了熵的本质就是事物内部状态的复杂(丰富)程度,最大熵原理就是最复杂原理的见解[3]。这种认识使熵概念和熵原理简明、通俗又科学,也使当今热门的复杂性研究驾轻就熟地继承了大量的科学成果。
反复的思考证实:对复杂程度(熵)的定量理解需要认识分布函数(概率分布是特例);要理解分布函数用这里提出的广义集合概念有很多方便。广义集合是描述很多客观事物的定量方法。分布函数是广义集合的必然伴生物。复杂程度(熵)是对分布函数的一种计算(泛函数)。熵原理是高概率事件容易出现的翻版也是解释很多分布函数的理论武器。现在按此顺序把我理解的复杂性结合气象等事例做介绍。
2.广义集合--定量描述客观事物的新语言 科学要研究各种客观事物。哲学家对它的描述偏于定性,科学家对它的描述又过分专业(你研究分子、他研究蚂蚁...)。集合概念可以描述彼此不同的客观事物,但是它不过问相同的事物的数量有多少。为了同时可以描述不同的事物有那些又描述相同的事物有多少,我们引入了广义集合概念(暂定名称)。后面会看到广义集合比集合概念更容易进入物质科学(自然和社会科学)。 明确血液有A,B,O,AB四种在医学上很重要。用集合语言就说这个集合内有四个元素A,B,O,AB 。如果问不同血型的人各有多少?这又深入一层。但集合语言不便直接描述它(用“映射”概念固然可以,但牺牲了物理内容),而广义集合恰好用来概括它:知道了不同血型的人各有多少,也就明确了一个广义集合。再如:
人有贫富,财富不同的中国人各有多少?
顾客购物,进百货大楼花了不同的钱的顾客各有多少?
天有晴雨,北京的不同天气的出现机会各有多少?
河有长短,新疆不同长度的河流各有多少?
国有大小,地球上不同人口的国家各有多少?
生物有很多种,地球上不同种类的生物各有多少?
书里有很多英文词汇,不同长度的英文词汇各有多少?
瓶子里有很多气体分子在运动,不同速度的分子各有多少?
...
上面这些问题可以抽象为一个模型。它们都是问“不同的某某某各有多少?”而对这个问题的每个具体的答案就是一个具体的广义集合。
我们给广义集合的定义是:由多个(地位相同的)个体组成的一个总体,而这些个体的某种特征(标志)可能不尽相同。其中每个个体的具体特征称为标志值。
血型、钱数、晴雨、河流长度、国家的人口数、各种生物名称等各个特征的具体值(数值变量或字符串变量)都是该广义集合的每个个体都具有的所谓“标志值”。每个人、每天、每条河、每个国家等等都是该广义集合的“个体”。
定义强调把总体(整体、客观事物、系统、体系)看成是由多个地位相同(从某个侧面看)的个体(广义的原子)组成的。还隐含了每个个体必须对论及的标志有确定的标志值的含义。
广义集合除了有并、交等运算外还有个重要的特性:它必然伴有一个分布函数。
3.分布函数--广义集合的伴生物 经过对10000人的调查A ,B,O,AB血型的人数分别是例如3000人,4000人,2500人和500人。这回答了不同血型的人各有多少。而血型(x)与人数(y)的关系是函数的关系。我们把“描述一个广义集合内标志值(x)与它对应的个体的数量(y)的关系称为该广义集合的分布函数”。由于每个明确的广义集合都明确了不同的标志值各有多少个个体,所以每个广义集合都必然伴有一个分布函数。
血型(x) | A |
B |
O |
AB |
人数(y) | 3000 |
4000 |
2500 |
500 |
占的比例 |
0.3 (30%) |
0.4 |
0.25 |
0.05 |
一付麻将牌、参加高考学生的语文成绩、各种化合物的分子都是一个有明确分布函数的广义集合。麦克斯威给出了分子运动速率的分布函数是物理学中的重要事例。
在气象领域我们发现了约20种分布函数,它们有简明又稳定的数学形式。例如: 一场降雨过程中不同雨量x与其占的面积y 之间不仅有稳定的函数关系,而且这个函数是负指数函数。在降水现象中符合负指数分布的广义集合还有很多种。大气中压力不同的空气占有的数量是相同的,它是均匀分布。大气的位温和能量则符合概率论中的Gamma分布等等。 在网页[9]上可以看到社会和自然学科领域中更多的事例。很多专业已经有大量观测数据,有了分布函数这个统一的概念便于从这些数据中归纳出具体的分布函数。在科学上从数据中找到一个分布函数相当于找到了一个经验公式,这本身这是研究成果。从理论上找出分布函数是包括熵原理在内的各种理论的任务。从实际数据计算出分布函数的方法在参考文献[2]和参考网页[9]中有介绍。
4.复杂程度(熵)--与质量、能量概念平身
对分布函数的一种计算可以得到一个数,它就是该广义集合的内部状态的复杂(丰富)程度。例如对一万人的血型的复杂程度C可以用下式计算:
C=-(3000log0.3+4000log0.4+2500log0.25+500log0.05)=5316
Log 就是对数,0.3、0.4、0.25和0.05是各个血型的出现的比例。以ni表示标志值为xi (血型)的个体数量(人数),以pi表示该种个体(人数)占的比例(= xi /N,N是广义集合内的个体总数),复杂程度C的公式是
C=∑- xi logpi
这是计算各种广义集合的复杂程度的基本公式。把这个公式与信息论中计算信息熵的公式对比不难发现信息论中的信息熵H与复杂程度C是正比例的关系(比例系数是N)
C=NH
确实,复杂程度的公式与信息熵的公式有很多类似处。所以信息熵的很多性质复杂程度都有。这样复杂程度就与信息熵联系了起来。
有实际数据,用计数器很容易计算每个客观事物(广义集合)的复杂程度。如果对数以2为底,计算的复杂程度的单位就是信息论中常用的比特(Bit)。
这样我们就从客观事物(广义集合)的角度直接引入了一个客观的物理量--复杂程度。与信息熵相比它免去了后者在定义时对随机变量、概率甚至讯号的通讯模型等概念的依赖。
很多部门统计过很多项目的平均值,每个被计算了平均值(如平均身高)的对象实际都是一个广义集合(如全体学生)。用计算平均值的原始资料也可以计算出该广义集合的复杂程度。平均值丰富了我们的知识库、复杂程度也丰富了知识库。我们就平均值写了很多论文,用相同资料计算复杂程度也可以写出很多论文。计算各种事物的复杂程度是一项有待完成的重大任务。
统计物理研究揭示物质的热力学熵S与热力学几率W的对数成正比例,即有(ln是以自然数2.718为底的对数log)
S=klnW
在对应的模型中可以证明lnW恰好是该物质系统的复杂程度C 。所以热力学熵也与复杂程度成正比例的。其比例系数就是Boltzmann常数k 。这样复杂程度概念又与物理学中的熵概念就融合到一起了。
复杂程度是从客观事物的内在状态的差异性(各个个体的标志值不尽相同)入手定义的。把它用于分子原子电子等微观尺度,就成了宏观的热力学熵。把它用与讯号的传输领域就成为信息论中的以概率为纽带的信息熵。
科学已经揭示物质是荷有质量和(或)能量的。当我们承认任何物质内部都存在状态的差异时也就承认了它的复杂程度大于零。质量、能量和复杂程度是物质的最基本的三个物理量。它们在科学上的身份是相同的。
我们已经知道了质量和能量的变化规律。复杂程度的客观性决定了关于它的客观规律必然存在。我们曾经把它称为复杂度定律。下面介绍的最复杂原理就是这个定律的重要组成部分。
5.最复杂原理和它的应用--求分布函数
现代科学认为没有随机性的客观事物几乎是不存在的。随机性使客观事物的复杂性在不同的时刻会有不同的值,而且不同的复杂程度有不同的出现概率。经常显现的状态是概率最高时的物质状态,而研究显示概率最高恰好对应复杂程度最高。即物质系统的熵(复杂程度)经常处于它力所能及的最大值。这就是最大熵原理(我们称为最复杂原理)。
消极的科学家根据它预言若干亿年后的世界末日(热寂),而积极的科学家用这个原理去理解很多客观现象。物理学中著名的黑体辐射能量与波长关系的普朗克公式、分子运动的麦克斯威公式、化学中的质量作用定律等等都是熵最大在不同约束条件下的推论。看似消极的熵(最复杂)原理成了生产新公式的积极武器。
值得指出的是利用数学中的拉格朗日方法、熵(复杂程度)最大和其他的合理的约束条件可以反求对应关系(例如分布函数)[4]。
在降水过程中假设一定量的水体以最混乱(复杂)的方式洒向地面,用最大熵原理和拉格朗日方法得出了雨量在面积上的分布应当是负指数分布。而这已被资料所证实[5]。我们还类似地解释了气压的均匀分布、位温Gamma分布等10多个气象上的重要分布函数[2]。
1991年攀枝花会议上我们曾介绍过目前在概率论中很多概率分布函数都可以从熵最大加上适当的约束条件而推出。这表明最复杂原理可以使概率分布的知识系统化。王彬曾经把这个关系表编入高等学校的教材[6]。王在该书中还说:求统计分布函数是统计物理的根本问题…熵原理为解决统计物理的中心问题提供了一种简单、自然而统一的途径。
力学原理已经成功地说明了大量的自然现象,最复杂原理也成功地说明了重要的自然现象。但是利用它说明更多的自然和社会客观现象还有大量的工作要做。
6.尾语
简言之,直接把熵理解为复杂程度简明通俗又科学。它使“熵”脱下了神秘的外衣也使复杂性研究驾轻就熟。利用高概率事件最容易出现这个浅显的道理还可以脱下熵原理的神秘的外衣。这有利于它的推广也为复杂性研究送来了新武器。
新定义的复杂程度基于把客观事物描述成广义集合。这使熵可以超出热力学的圈子又使它不必借助概率和通信的数学模型—信息论。新理解下的复杂程度不仅包含了热力学熵也使它有资格与质量、能量平等地进入物理学。
把熵称为复杂程度把熵原理称为最复杂原理是我们的主张。我们希望这种看似表面的工作有助于理清事理、有助于让中学生也理解它、让大学生利用它、让科学家掌握它。本文副标题称为“改造后的熵”也就是这个用意。
化学家通过化学变化中不同形态的物质的转化时质量的合计值不变证明了质量守恒、物理学家通过不同形态的能量的转化时能量的合计值不变证明了能量守恒。客观事物内的不同形态的复杂程度是客观存在的。我们曾经举过在自发过程中它们可以互相转化的例子[7],客观事物的总的复杂程度也守恒吗?鲁晨光对此好象很相信[8]。把自发进行的过程中某些形态的复杂程度的自动的最大化(即最复杂原理)与不同形态的复杂程度的互相转化科学地统一起来,一个关于复杂程度的客观规律也就呼之欲出了。
集合概念早已经符号化了,皮亚诺(G.Peano)说:在数学中一切进步都是引入符号(表意符号)后的反映。广义集合如果能立于科学之林也应当可以符号化。在熵信息复杂性网站[10]就有初步成绩。
最后再重复一遍:广义集合是我们把客观事物抽象化并且数量化而临时取的名称。
参考文献和网页
[1]张学文.气象预告问题的信息分析. 北京:科学出版社,1981.28-56 [2]张学文,马力.熵气象学. 北京:气象出版社,1992 .4-66 [3]张学文.熵究竟是什么.熵与交叉科学.北京:气象出版社,1988.23-29 [4]吴乃龙,袁素云.最大熵方法. 长沙:湖南科技出版社,1991.286-344 [5]张学文,杨秀松.从熵原理得出的暴雨面积和雨量的关系.高原气象,1991,10(3):225-232 [6]王彬.熵与信息.西安:西北工业大学出版社,1994.147-149,140 [7]张学文.物理场的熵及其自发减少现象.自然杂志.1986,9(10):847-850 [8]鲁晨光.广义信息论.合肥:中国科学技术大学出版社,1993.110-111 [9]因特网页:http://kahn.xj.cninfo.net/zhangxw/index.htm[10]
熵信息复杂性网站: http://entropy.yes8.com