§11.4 对模型的推广

本节要把前面的个例再做一些推广。我们要指出对于更一般的情况,有随机性的各种广义集合的具体出现概率的对数也是与该广义集合的复杂程度成线性关系。即出现复杂程度高的广义集合其出现概率也高。

11.4.1 符合二项分布的等概率模型都可以用前面的结论

弹子球模型把我们引上了概率论的二项分布。但是概率分布符合二项分布公式的事物还有很多,该广义集合的出现概率的对数与其复杂程度之间当然都符合我们找到的线性关系(出现概率高的广义集合其复杂程度也大)。所以符合这个模型的事物并不少。

如果我每天上班要经过10个有红绿灯的十字路口。而每个路口的红绿灯的出现概率都是0.5 ,问上班“一路绿灯”的情况出现的概率是多少,或者最容易出现的情况是什么。那么这个问题就与弹子球的例子完全一致。利用前面的表我们知道“一路绿灯”的情况仅有1/1024,即千分之一的水平。而复杂程度9.7-10的情况(对应于出现4-6次绿灯)占60%以上。

所以弹子球游戏仅是我们理解一类随机性的广义集合的例子。我们得到的公式可以用到其他的符合等概率条件的一切二项分布的问题中。而下面要把问题再扩大到更一般的场合中去。

11.4.2 等概率的多项分布情况

前面仅讨论了标志值只有两种不同值的情况,现在讨论标志值有更多的取值但是各个标志值的出现概率都相等的情况。

设想一个广义集合由N 个个体组成,它有k 种彼此不同的标志值(如班里有50个学生,其身高有3个档次)在承认每个个体究竟取那个标志值具有随机性的情况下,如果找不出什么理由说每个个体属于每个标志值的可能性更大或者更小,就假定每个个体具有每个标志值的可能性都是相同的。这时我们还可以用类似前面的方法计算各种分布函数的出现概率和它们对应的复杂程度。

本模型类比于给我们N 个弹子球,每个球归入k 个可能的标志值(状态)的概率是相同的。而要计算的是:当

标志值为A1的个体有n1 个;
标志值为
A2的个体有n2 个;
标志值为
A3的个体有n3 个;
...

标志值为Ak的个体有nk
个时,

现在要计算这种广义集合对应的出现概率P (大写)。

由于上面的情况决定了不同的标志值各占有多少个体,所以它对应一个明确的分布函数。根据概率论中的多项式分布的概率公式(二项分布的推广),这个概率是

    P=[(N!)/(n1!n2!...nk!)]/(kN) 11.3

对于一个确定的问题,其N k 都是确定值,所以其出现概率P 仅是k 个变量,即n1 n2 ...nk 的函数,或者说概率值P 是分布函数的函数(称为泛函数)。为了清楚应当把P 写成Pn1 n2 ...nk),但是为了简练后面仅写成P 。所以P 代表的是各种分布函数的出现概率。现在,我们就又找到了一种更普遍的模型下的分布函数与出现概率的定量关系。

前面公式也可写成

    P (kN)=N!/n1!n2!...nk!

利用这个公式我们也可以计算每种广义集合(分布函数)的出现概率。也可以得到与11.1类似的表。不过现在的标志值的可能取值多了,不同的广义集合的类型也增加很多,这个表就非常大。这就使列出(计算出)这个表变成了一件很繁的事。

现在不去追究这个表,而是寻找出现概率与复杂程度的关系,面对本问题,我们不妨取这样一个一般情况,那就是认为个体的个数充分地多,即N 充分地大。

如果N 以及各个n1 n2 ...nk 都很大,利用数学中关于阶乘的斯特林(Stirling)公式

    lnN!=NlnN-N 11.4

N!/n1!n2!...nk! 自然对数,就应当有

    ln(N!/n1!n2!...nk!)=NlnN-N-n1lnn1 +n1 -n2 lnn2 +n2 -...-nklnnk+nk

注意到各个标志值的个体的个数的合计值应当等于总个数,即

    N=n1+n2+...+nk ,所以

    ln(N!/n1!n2!...nk!)= -n1 ln(n1 /N)-n2 ln(n2 /N)-...-nk ln(nk /N)
    ln(N!/n1!n2!...nk!)= -
ni ln(ni /N)
11.5

回顾第七章公式(7.5),复杂程度C 的定义是

        C=-ni ln(ni /N) 11.6

显然上面的值恰好是该分布函数对应的复杂程度。

注意到前面的概率公式,得到

复杂程度 C =ln[P(kN)] (11.7a)

或者

        lnP=C-ln(kN) (11.7b)

这说明有随机性的广义集合可能出现不同的分布函数,而且它也伴有不同的复杂程度。而不同的广义集合(分布函数)的出现概率的对数lnP与复杂程度C是线性关系(对于这个提法后面还有进一步的分析)。由于对数函数是单调上升函数(变量值加大,其对数值也加大),所以概率加大,概率的对数也加大。即出现概率高的广义集合其复杂程度也大。

本节与上一节的两个模型说明不同的广义集合的出现概率在一定的假设下是可以计算的,而计算表明不同的广义集合的出现概率可以不同,有时这些不同的广义集合的出现概率的差别非常大。

对前面给的两个有随机性的广义集合模型的讨论表明,出现概率高的广义集合,其复杂程度也大。“概率的对数与该广义集合的复杂程度是线性关系”就是我们的重要又定量的结论。

§11.5 更一般的模型

回11章首