组成论介绍中a

组成论介绍（中）：复杂程度和复杂度定律(a)

张学文

zhangxw@mail.xj.cninfo.net

（新疆气象科学研究所，830002）

2002年12月公布于潜科学网站

上文指出每个广义集合都有对应的分布函数（规律）.本文指出，利用广义集合的分布函数可以计算出一个体现客观事物的内部状态的丰富程度的物理量：复杂程度.如果广义集合具有随机性，这个广义集合就符合最复杂原理，在一些情况下可以利用这个原理反求得广义集合的分布函数（公式）.

1. 复杂程度概念

“复杂”这个词应用范围很广，科学地计量事物的“复杂程度”很重要.我们利用广义集合定义复杂程度.

N个个体组成的广义集合中如果标志值有k 个不同的值x₁, x₂,…,x_i,…, x_k而与之对应的个体的数量分别为n₁, n₂,… , n_i,…,n_k,那么该广义集合的复杂程度C为

（5）

这就是广义集合的复杂程度的定义公式.

骰子有六面，每面的点数都不同，n_i=1, (i=1,2,…,6), N=6 ,复杂程度 C=-log(1/6) -log(1/6) -log(1/6) -log(1/6) -log(1/6) -log(1/6)=6log6 .一付扑克牌有54张，张张不同，其复杂程度为54log54.而两付扑克的复杂程度为108log54.它是前者的复杂程度乘2.

每个明确的广义集合都可以利用这个公式计算出它的复杂程度.

2. 复杂程度分析

l 复杂程度的最大值：如果广义集合内的每个标志值都仅占有一个个体，即各个个体的标志值都不相同（全班学生的成绩都不相同），此时 n_i=1 (i=1,2,…N), k=N,依照公式，复杂程度为

C=NlogN （6）

它也就是由N个个体组成的广义集合的复杂程度的最大值.

l 复杂程度的最小值：如果各个个体的标志值都相同（全班学生的成绩都相同），它意味着“清一色”，此时k=1,n=N，依照公式，其复杂程度为0 .零是复杂程度的最小值.

l 每个广义集合都具有自己的复杂程度：每个广义集合都有自己的分布函数，知道了分布函数值就可以计算复杂程度值.所以每个广义集合必然具有自己的复杂程度.

l 复杂程度是体现物质本体性的物理量：复杂程度公式依赖客观事物内部的不同的标志值各有多少，是物质状态的丰富程度的度量.它体现客观事物的本体属性.

l 复杂程度也有层次性：天文、地理、社会、生物、物理、化学在不同层次上研究客观事物，广义集合中的个体可以是上述学科中的不同对象.基于个体的状态的差异性的复杂程度也有层次性.

l 复杂程度与信息熵是正比例关系：如果从广义集合中随机地抽取一个个体，根据古典概率定义，抽得的个体的标志值为x_i的概率 p_i=n_i/N .所以复杂程度公式也可以写为

（7）

注意到在信息论中信息熵H的计算公式^[3]是

（8）

H的含义是当k个事件x₁, x₂,…,x_i,…, x_k的出现概率分别为p₁, p₂,…,p_i,…, p_k 时，随机地抽取一个事件，其抽样结局的不确定性.对比公式（7），（8），得到

C=NH （9）

根据信息熵的含义，H是从广义集合中任意抽取一个（不是多个！）个体时，其结局（指标志值）的不确定性.公式（9）说明客观物质的复杂程度与信息论中信息熵是正比例关系，而比例系数就是广义集合具有的个体数量N.

信息论揭示了信息熵的很多重要性质.由于复杂程度与信息熵成正比例，所以复杂程度也具有信息熵的类似性质.所以关于信息熵的很多知识也自然地归入复杂程度概念.

l 复杂程度与信息的计量单位是相同的：公式（9）中的N没有量刚，所以复杂程度与信息熵（电脑语言中的信息容量）的单位是相同的.对数如果以2，10，或者自然数e（2.71828）为底，就把利用公式（8），（9）计算出来的信息熵或者复杂程度分别称为若干Bit比特，Hartley哈特利，nat纳特^[4].

l 复杂程度概念与信息熵概念的差异性：信息熵概念联系着抽样实验、概率论，它被引导到通讯、讯号、结局的不确定性这个非物质的方向去了，维纳说“信息不是物质”.所有这些都使信息概念力图超脱于物质.唯物论不便否认信息的存在又不便把承认它是“物质”.物理学也难处理信息在物理学中的地位.复杂程度是物质天然具有的物理量，它的客观性不依赖通信、讯号、概率、不确定性这些概念.所以复杂程度为信息找到了物质依托.

l “0+0>0”:广义集合A有100个白球， B有100个黄球.根据公式（5），两个广义集合的复杂程度都分别为零.把两个广义集合合并，新广义集合有200个球，白、黄各100.根据公式（5），新广义集合的复杂程度C=-100log(100/200)- 100log(100/200)=200比特.所以两个广义集合合并后，复杂程度就实现了“0+0>0”.“1+1>2”是系统科学（经济家、政治家）的直觉与愿望.本例说明：复杂程度确实可以“总体大于分量和”.写成公式就是C_A+B+…≥C_A+C_B+C… 这个结论体现了系统论、经济家、政治家的苦求，有着深刻的物理学意义.把广义集合A理解为宇宙大爆炸前的物质A（粒子个数很多但是都相同，复杂程度=0）当它与另外一个物质B（复杂程度=0）充分接近时（合并）也就发生了天文学讲的大爆炸.A、B两个广义集合就是现在宇宙的父母了.

l 连续变量的复杂程度公式：如果广义集合的标志变量是连续型的变量，变量在x-0.5到x+0.5区间占有的个体个数如果用g(x)表示, 那么g(x)就具有该广义集合的分布函数的含义.其复杂程度C用下式计算

（10）

这里的a，b是变量的上下限.它就是连续变量的复杂程度是计算公式.也是公式（5）的变态.这种变态中出现的特殊问题请参考文献^[5].如果用相对分布函数f(x)来表示，即f(x)=g(x)/N，复杂程度公式写为

（11）

注意到连续变量的信息熵公式，不难看到公式（9）对连续变量也正确.

3. 概率定义和公理

3.1概率定义

目前“概率”有几种定义.用广义集合定义概率更简单、清楚：从一个广义集合中任取一个个体，该个体的标志值为x_i的事件的出现概率p(x_i) 定义为n_i/N.即

p(x_i)= n_i/N （12）

这个定义类似古典概率定义.

3.2概率公理

人们经常对某些道理熟视无睹，但欧氏几何学把熟视无睹的某些道理尊为公理从而构成了一个知识框架.笔者主张把“高概率的事件在一次抽样实验中是容易出现的”这个熟视无睹的道理尊为“概率公理”.笔者认为很多统计学的结论都依赖它.后面要利用它证明最复杂原理.

组成论介绍（中）：复杂程度和复杂度定律(b)