组成论介绍(中):复杂程度和复杂度定律(b)


张学文

zhangxw@mail.xj.cninfo.net

(新疆气象科学研究所,830002

2002年12月公布于潜科学网站

 

4. 最复杂原理

4.1广义集合的随机性

掷一个骰子,它出现几点就有随机性,从一副麻将牌中随便取一张牌,它究竟是什么牌也有随机性.玩麻将者要拿13张牌,这13张牌就构成了一个广义集合(群体).显然这个广义集合究竟是什么牌也有随机性.100位顾客买了东西,他们的花费各是多少?有随机性.看来,某些广义集合及其什么分布函数究竟是什么可以存在随机性.这也就引出了不同的广义集合(如抓13张麻将牌)有不同的出现概率问题.现在我们设法把它量化和深化.

4.2红绿灯模型

某人上班要经过10个红绿灯路口.针对每次上班可以问:你遇上了几次红绿灯.本问题的答案显然有随机性.从广义集合语言的角度看,“经过10个有红绿灯的路口”等价一个广义集合有10个个体,“红灯”、“绿灯”对应两种标志值.而回答了红灯的出现次数也就等价于知道了分布函数(不同颜色的灯各有多少).如果遇到的红灯次数被概率计算出来了也就知道了不同的广义集合(分布函数)的出现概率(机会).

本问题是概率论中的二项分布问题.设红绿灯的出现概率都是0.5(相等),经过10次路口遇到m次红灯的概率p(m)

p(m)={10!/[m!(10-m)!]}(0.5)10              13

6第二行给出了不同的红绿灯次数m对应的不同的出现概率p(m),第三行是利用复杂程度公式(5)计算出来的对应的复杂程度值.

 

 

6不同红绿灯的出现概率
(不同的广义集合、分布函数、复杂程度的出现概率不同)

红灯次数m

m=0

m=1

m=2

m=3

m=4

m=5

m=6

m=7

m=8

m=9

m=10

该事件出现的概率×1024

1

10

45

120

210

252

210

120

45

10

1

复杂程度(比特)

0

4.6

7.2

8.8

9.7

10

9.7

8.8

7.2

4.6

0

6说明:出现概率最高的广义集合(事件)也是复杂程度最大的广义集合(事件).在概率的对数与复杂程度的坐标图(略)上它们是直线关系.

4.3最复杂原理

如果标志值不仅只是两个(红绿灯)而是k个可能值x1, x2,…,xi,…, xk、出现的概率p1, p2,…,pi,…, pk(也称为先验概率)可以彼此不相同、个体的总个数相当多(可以利用Stirling公式 lnN!=NlnN-N ),利用概率论中的多项式分布公式,可以得到下面的关系            14

ni是概率为pi的标志值占有的个体数量.这个公式体现了广义集合的出现概率P与其复杂程度C的关系.它表示该广义集合的出现概率的对数等于该广义集合的复杂程度再加上“另外一项”.显然当概率达到最大值时,复杂程度与“另外一项”的合计值也达到最大值.根据概率公理,“概率最大”也就是在一次实验中最容易出现的广义集合,所以最容易出现的广义集合是复杂程度与“另外一项”的合计值最大的广义集合.

“另外一项”在本例中包括了各个结局的出现概率,它对应着一种限制、约束条件.在另外的场合它的外型可能不同.但是它都包括着一些约束条件.考虑到有的广义集合的出现还会附有其他的约束条件,我们把“另外一项”更含糊化为“在限制条件下”.于是综合公式(14)、红绿灯的例子、概率公理和以后的例子,我们把:

有随机性的客观事物(广义集合)都自动使自己内部状态的复杂程度在限制条件下达到最大值”称为最复杂原理.

最复杂原理的正确性体现于多次实践中它经常是对的,而不是每次必然正确,它与“正方形的面积等于边长的平方”之类的确定性规律在品格上是不同的.

4.4定性的例子

你在街遇到很多人,买东西的、上学的、做生意的、出差的、看病的等等.把遇到的人看成是一个广义集合,根据最复杂原理这个广义集合内的人(个体)的活动目标(标志值)会自动最复杂化.从商店出来的人都买了相同商品的事件的出现概率就非常小的,最容易出现的情况是买什么东西的人都有.所以最容易出现的也正是复杂程度最大的.你把一个玻璃杯摔碎了,碎玻璃的大小都相同?根据最复杂原理,它们是尽量地不相同,碎玻璃的大小尽量复杂化.仔细想想,符合最复杂原理的事物几乎是司空见惯.

4.5定量的例子斩乱麻问题

最复杂原理不仅在生活的事例早已司空见惯,而且也可以推导出很多定量规律.公式(5)说明利用分布函数可以计算该广义集合的复杂程度.对此也可以反过来思考:对于有随机性的广义集合,根据最复杂原理(复杂程度最大),能否反算出分布函数?

 这个问题非常有吸引力.但是,在离散变量的情况要利用求函数的极值的技巧反求自变量(分布函数).在连续变量的情况下就要利用变分技术反算未知函数(连续型的分布函数).“拉哥朗日乘子方法”经常帮助我们达到目标.现以“斩乱麻问题”为例说明之.

把长为L的绳子随机地切割成充分多的N段,问不同长度的线段各有多少.这就是斩乱麻问题[6].把切碎的绳子看作是广义集合,这就是利用随机性从理论推测其分布函数.

切割的随机性造成了线段长短不齐,它体现了事物的复杂性.f(x)这个分布函数表示不同长度的线段占的百分比(权重),那么它对应的复杂程度为

C=-Nf(x)lnf(x)dx   11

切割当然不是烧掉,切割后的线头总长度应当等于L,即

L=Nxf(x)dx   15

根据最复杂原理,C应当在一定的约束条件下达到最大值.而上式是一个约束,另外百分比的合计值应当等于1,即

1=f(x)dx        16

也是一个约束条件.

现在的问题是:在(15)、(16)的约束条件下使C最大的分布函数f(x) 应当是什么.根据求泛函数极值的拉哥朗日方法,构造一个新的函数F

F=-f(x)lnf(x)dx +C1[xf(x)dx- L/N] +C2[f(x)dx- 1]             17

这里的C2C2是待定常数.很显然,复杂程度C达到最大值,F也达到了最大值.F达到最大值(体现最复杂原理,也考虑了本问题的特殊约束条件)时它对未知函数f(x)的变分应当等于0.利用Ff的变分为0,我们得到f(x)=exp-1+C1x+ C2.

利用(15)和(16)消去未知数C2C2解得f(x)=N/Lexp(-Nx/L),注意到L/N的含义是线头的平均长度,以a表示它(也是常数),有

f(x)=(1/a)exp[-(x/a)] 18

它是一个负指数函数.即一堆斩乱麻中,不同长度的线头占的百分比(分布函数),应当是负指数函数(相对密度分布函数).它显示长度x短的线头多而长线头很少.

根据相对密度分布函数的定义,线头长度在xx+Δx 范围的有Nf(x)Δx .L=200米,切成N=20000段(平均值a=1cm),可以计算出长度在34 cm范围的线头有604段,占总量的3% .

我们可以做一个数值模拟实验以得到一个斩乱麻的样本.对比显示最复杂原理得到的理论分布与模拟实验结果的一致的.这说明最复杂原理与实际相符合.例子中虽然利用了复杂程度最大,但是没有计算复杂程度的最大值究竟是多少.原因是我们主要兴趣是利用复杂程度最大去推算理论的分布函数.

一般地说,只要某广义集合具有随机性,就可以利用最复杂原理配合不同的约束条件得到不同的理论分布函数.客观存在的有随机性的广义集合很多,所以利用最复杂原理求分布函数的一般方法有广泛的应用和价值.

5. 复杂度定律

复杂程度是物质自身天然具有的属性,它和质量、能量一样地真实.关于物质的质量、物质的能量已经有了质量守恒、能量守恒定律,与之对应也应当存在一个关于物质的复杂程度的变化规律,现在暂称为“复杂度定律”.限于篇幅这里仅指出某些观点:

l         广义集合概念有层次性,复杂程度也具有层次性.不同层次(形态)的复杂程度都客观存在.这类似物质的能量有化学能和核能.不同形态的能量可以互相转化,不同层次(形态)的复杂程度也可以互相转化.

l         有限的物质仅具有有限的质量和能量,它也仅具有有限的复杂程度.“物质可以无限分隔、具有无限复杂性”的观点等价于有限物质的复杂程度为无穷大,这个观点使复杂程度概念失去物质性,所以它是错误的.

l         建议把目前流行的世界的三元观(物质+能量+信息)修改为物质属性的三元观(质量+能量+复杂程度).

l         存在着质量变换机构(如木器厂)、能量变换机构(如水利发电厂)和信息变换机构(如电视机),但是使输出的质量、能量、信息大于出入的变换机构是不存在的.

l         爱因斯坦的质量能量公式可能要扩大为质量、能量、复杂程度之间的定量互相转化关系,而其总量具有保守性.写为公式就是,对于孤立系统,有

Δm+ΔE/v2+kΔC=0

 这里的v是光速、C是复杂程度、mE分别是质量和能量.k是待定常数.

l         我们暂且把上面的认识连同最复杂原理合称为复杂度定律.

6. 小结

根据广义集合(客观事物)的分布函数,利用公式(5)可以计算该广义集合的内部状态的复杂程度.具有随机性的广义集合,它的复杂程度常常是在一定约束条件下的最大值.利用这个最复杂原理可以推导很多事物(广义集合)的理论分布函数.

复杂程度是客观物质具有的基本物理量,它与质量、能量一样的真实,在一定的意义下它与信息熵成正比例.关于客观事物的复杂程度的一般规律与最复杂原理一并称为“复杂度定律”.

组成论介绍(下)