第十六章b

§16.4偏见、愚见与卓见？

前面强调了理解、掌握、利用广义集合和分布函数概念以后，比较容易从各种现象中找出某些定量的规律。确实，谁在这个方面取得成绩，都有理由为之高兴。但也会有理论家说：你找到的仅是经验公式，它只不过是对现象做了一些统计而已。这真是泼来的冷水！这种观点既包括对统计学的蔑视，也包括了对你的成绩的蔑视。

我们认为这是一种偏见，甚至是一种愚见。

说这种观点是偏见首先是因为自然科学中的重要规律都是经过了多次的实际实验而被科学社会公认的。搞过观测的科技工作者都知道，观测就存在误差，对具有误差的观测数据的使用都包括了统计学的处理。所以一切经过实验检验的理论都逃不脱统计。贬低统计学也使提问题的人超脱不了“统计处理”。所以说贬低统计学的观点是“偏见”并不为过。

有的理论家还认为得到了一个分布函数也就是一个频率分布的直方图，即便为它配了一个数学公式它也距离理论王国非常遥远，它几乎无法达到力学公式那种理论水平！

这种观点也是笔者过去的观点，现在看来这不只是偏见，几乎是愚见。

我发现具有这种观点的一个根本原因就是把牛顿力学为代表的所谓科学理论标准看得过重了。这个观点认为：一切客观事物都应当而且必然会用牛顿力学来解释。而你得到的什么频率图直方图与牛顿力学的方程式是不相干的。

纠正我这种错误观点的第一个理由是自然界的客观事物不可能用牛顿力学都得到解释。牛顿力学是决定论的代表，但是世界并不都是决定论式的。随机性的广泛存在就说明牛顿力学的局限性。把一切不便于利用牛顿力学模型解释的现象都视而不见、都予以排斥反而说明这种认识阻碍了我们从新的视角归纳现象，这阻碍了对新理论的寻求，也失去了自己发现新原理的机会。说这是愚见并不为过。

纠正这种观点的另外一个理由是确实有人在这个方面做了非常出色的工作，它没有借助牛顿力学却解决了一般人无法啃的难题。19世纪中期麦克斯威（J.C.Maxwell）在分子概念还仅是一种假说时就从理论上推导出温度为T时由N个分子组成的气体中不同气体分子的运动速率（V→V+ΔV）占的数量ΔN应当服从下面的公式：

一本美国的化学教科书说“Maxwell 所得到的有关分子速度分布的数学方程是自然科学中最难的方程之一”。20世纪这个理论得到了实验的证实。这个公式如果用图形表示，它就是我们一再使用的表示分布函数的直方图。我们在第三章曾经给出过关于氧气分子的运动速率分布图。它是这个方程式的一个特例。

1999年英国一个新闻机构评选对人类有1000年尺度影响科学家思想家，J.C.Maxwell被选入其中。很显然J.C.Maxwell解决的最难的科学问题都用统计学的直方图表示，把直方图蔑视为一文不值，几乎是看不见J.C.Maxwell的卓越工作。这显然不是高见，说它是愚见不为过。确实，正是前人的这些卓越工作使我克服了偏见，看到了一些新的宝贵思想。

确实，“理论”有解释一切“事实”的义务，而没有藐视事实的特权。对新发现的事实无力做出说明，也就预示这个理论衰老了。

直方图表示了很多分布函数，它是联系最复杂原理等理论思维的桥梁，自然它也是引入卓越之见的桥梁。

16.5分布函数是连接现象与理论的桥梁

科学工作既要强调揭露客观事实也要强调有对应的理论来说明这些客观事实。把理论与实际连接起来的途径有很多。分布函数（有时是它的变种）就是其中的一个。所以分布函数是理论联系实际的一种桥梁。

第十二章有快刀斩乱麻的例子。在那里，现象就是一根麻线被任意地切割为很多长短不一的线头。理论是最复杂原理。它们可以联起来吗？它们如何联起来？分析显示正是分布函数概念对现象做了有力的、科学的归纳，而最复杂原理也在麻线总长度不变的约束下体现为一个理论分布函数。如果理论的分布函数确实与从现象中归纳出来的分布函数（经验公式、唯象方程）之间找不出明显的差别。我们就在分布函数这个交点上把现象与理论连接起来，认为该现象的出现原因就是最复杂原理与约束条件共同体现。

前面举的J.C.Maxwell的分子运动速率公式是另外一个例子，他把一些合理的假设做了逻辑和数学分析，最后得到一个理论公式，这个公式用现在的眼光看就是一个具体的分布函数。一旦证实这个分布函数与观测得到的分布函数一致，也就把理论与实际联系了起来。分布函数还是实际与理论的桥梁。

爱因斯坦说“提出一个问题往往比解决一个问题更重要”。把很多观测数据概括为一个分布函数在一些场合就是科学地提出问题。

后面一些章节介绍的最复杂原理的应用几乎都是通过分布函数这个桥梁把理论与实际联系起来的。

§16.6复杂程度概念的应用

16.6.1.在信息论和热力学中已经应用

科学界关于复杂性有不同的定义。既然如此，也就应当容忍我们也下一个定义。我们认为复杂一词用的面非常广，复杂程度是复杂性的定量计量，它的应用半径也应当与“复杂”一词同样地普遍。那种把复杂程度定义在一个狭小范围的做法我们认为是不妥当的。

第一篇我们定义的复杂程度与信息论中的信息熵是成正比例的。信息熵可以用到的地方，自然复杂程度也可以用到。复杂程度面向一个客观存在的广义集合（客观事物），信息熵面向一个随机抽样结局（被抽样的总体就是该广义集合）。信息熵依赖于随机实验而复杂程度依赖客观事物本身的复杂性，复杂程度度量的就是客观事物内部状态的丰富程度。使用复杂程度这个词利于科学普及。

玻尔兹曼等人的工作说明了热力学的熵S与所谓热力学几率W有如下关系（k是所谓玻尔兹曼常数）

S=klogW

这里的logW就是第八章介绍的热力学几率的对数。说明了热力学几率的对数与复杂程度相等也就是说明了复杂程度与热力学熵是成正比例的，而且其比例系数是玻尔兹曼常数。点到这个问题也就说明了复杂程度与物理学中的熵的应用领域一样宽。

当你把一个物理量称为熵的时候，你要费很多口舌解释什么是熵。但是当你直接把这个量称为复杂程度时。其物理意义几乎是不言自明。

16.6.2.在其他领域也大有用场

把熵改称为复杂程度不仅对信息论和物理学有好处。由于一切广义集合都可以计算它的复杂程度，这就把复杂程度概念用到了远离信息论和物理学的各个领域去了。是的，很难找到一个领域不使用“复杂”这个词，而“复杂”的定量化就是复杂程度。

平均值已经被各个领域广为应用。从概率知识看，求平均值是对该广义集合的概率分布（百分比分布、组成分布）的一种计算，或者说是对分布函数的一种运算。要知道复杂程度也是对分布函数的一种运算，而且用的原始资料还更少（不用自变量、标志值的值仅用其函数值）。它与平均值的差别仅是计算公式不同和物理意义不同。

平均值和复杂程度都是描述一个集体、系统、广义集合的统计特征量、参数。复杂程度的应用范围比平均值更宽。

可以说一切计算过平均值的场合都余下一个复杂程度还没有人分析计算。在介绍复杂程度时我们指出：计算与分析复杂程度是个大任务。确实，一个任务摆到了一切计算过平均值的科技工作者的面前：把你计算过平均值的哪个问题再拿来，也计算一下它的复杂程度！你不是用平均值问题写过好文章吗？现在你又有个新机会：用原来的资料写新文章。

中国的人平均年产值是800美圆。这个数字可以说明生产水平但是说明不了中国人的生产（贫富）水平不均匀的情况。确实，把相同的统计资料代入复杂程度公式，可以计算它的复杂程度。而这个数字从一个侧面反映了生产（贫富）水平的不均情况。对中国各个省（区）的平均生产力的分析是一篇文章，对各个省的生产力的复杂程度的分析当然也是重要事项。

政府的统计部门就可以利用已经有的统计资料在复杂程度方面作很多文章！也可以在国民经济的统计报表中加上这一项（希望各国政府的统计官员注意我的这个劝告）。

不少电子计数器上有求出平均值的功能，有的还可以计算所谓“标准差”(标准差也是一个描述多样性的指标。其功能与复杂程度有类似性，后面会看到在特定场合标准差的对数与复杂程度成正比)。遗憾的是计算器上没有直接计算复杂程度的专用键。实际上一切可以计算平均值、标准差的场合都可以顺便计算出复杂程度。认识到复杂程度的物理意义，认识到过去很多求平均值或者标准差计算中缺了复杂程度这一项，就会感到我们应当补上这个计算。而这一类问题在各个领域都有很多。欢迎计算器厂家制造出可以计算复杂程度的计算器，有新功能的计算器也是厂家发财的新机会！它也为推进科学进步做了贡献！

一批从没有量过血压的人都想去量量自己的血压。科技工作者没有用过复杂程度这个指标，今天明白了它的物理意义，当然也要拿来试试。

16.6.3.理论思维中的一个环节

现代人与动物都会思维，而所有的思维都要借助“概念”进行。现代人类由于继承了人类文明创造的很多重要“概念”，人类的思维就比动物的思维有效的多。现代科学更是提出了很多含义清楚而且定量化的概念，这更提高了人类思维活动的能力。每个重要概念的确立都是促进了科学的进步，都推进了理论的发展。复杂程度是一个应用领域很广的概念。它也是理论思维要用到的一个环节。缺了这个环节你就不能利用最复杂原理，如果不能利用这个原理，一些现象就无法解释。所以在理论思维中复杂程度是个不可或缺的环节。拒绝使用这个概念（含熵概念），有时也就堵住了进入正确理论殿堂的大门。

本书强调了客观事物本身的复杂程度的客观性，并且提出了它与物质的质量、能量有对应的地位和性质。所以正确阐明复杂程度的含义在科学上就有重要意义。复杂程度应当与质量、能量一起也成为哲学家讨论理论问题的思维工具。

§16.7小结

为了表示气象学、统计物理学、统计学等学科中普遍存在的分布问题，我们提炼了一个一般化的概念：“分布函数”。为了说明分布函数的主体是什么，我们引入了“广义集合”概念。广义集合和分布函数既然来自上述具体学科中的概念的泛化，它们自然可以应用到这些学科中。对于这些学科我们强调一个观点：利用广义集合和分布函数这些一般概念会使很多具体的专业化的分布函数概念更容易理解和掌握。这对教学和研究工作者都是有好处。

提出广义集合和分布函数概念更重要的目的是让这些泛化了的概念便于推广到其他各个自然科学和社会科学中去。科技工作者树立了广义集合和分布函数就比较容易结合自己的专业知识归纳客观规律（例如得出经验公式）。得到一个广义集合的分布函数就是发现了一个客观规律。广义集合概念和分布函数概念是我们发现规律好助手。

分布函数概念既是归纳客观事实得出规律的表现手段，也是联系例如最复杂原理等一些重要原理的工具。利用它比较容易使总结出来的经验规律与理论公式联系起来。

“复杂”一词广为应用，复杂程度是“复杂”一词的量化。所以“复杂程度”的应用范围应当与“复杂”一词一样的广。信息熵和热力学熵是广为应用的概念，但是它们都是复杂程度概念的特例。所以复杂程度概念早已在另外的名义下广为应用。很多电子计数器都可以计算平均值，利用相同的资料（实际是更少）就可以求出该对象（广义集合）的复杂程度。我们围绕平均值已经做了很多文章，利用同样资料计算出复杂程度也有大量的工作要做。

复杂程度与质量、能量是对应的概念。这三个概念有类似的客观规律。认识到这一点有着重要的科学和哲学意义。在人类正确地认识了质量概念、能量概念之后，正确认识复杂程度概念（联系着信息概念、熵概念）就成为21世纪的重要使命。