第十一附录:

概率的二项分布和多项分布
(2001年2月下旬)

本章用到了概率论中的二项分布和多项分布公式,这里做简要说明。

一个事件必然出现,就说它100%要出现。100%=1,所以100%出现的含义就是出现的概率P=1。

即必然事件的出现概率为1。

二项分布

如果掷一枚硬币,正面向上的结局的概率为0.5 。反面向上的结局的概率也是0.5 。那么出现正面向上事件或者反面向上事件的概率就是0.5+0.5=1 ,即二者必居其一。

    如果掷两次硬币,根据独立事件的概率乘法定理那么两次都是正面(反面)向上的概率是0.5×0.5=0.25。另外第一个是正第二个是反的出现概率也是0.5×0.5=0.25。同理第一个反第二个正的出现概率也是0.5×0.5=0.25。于是一正一反的概率是前面两个情况的和,即0.25+0.25=2×0.25=0.5 。它们的合计值仍然是1。列成表就是:

    两个正面的概率

    一正一反的概率

    两个反面的概率

    0.25

    2×0.25=0.5

    0.25

     

    注意到代数学中

    (a+b)2=a2+2ab+b2,

    而在a=0.5,b=0.5时,有

    12=(0.5+0.5)2=0.25+2×0.5×0.5+0.25=1

    这说明掷两次硬币的各个结局的出现概率可以通过对二项式的平方展开而得到。顺此,对于掷n次硬币的各种结局的出现概率也可以通过对二项式的n次方的展开而得到。

    例如N=3时,有(注意0.5×0.5×0.5=0.125)

    13=(0.5+0.5)3=0.125+3×0.125+3×0.125+0.125=

    0.125+0.375+0.375+0.125=1

    上式4项中的4个概率值0.1250.3750.3750.125分别对于3正、21反、12反和3反这四种结局。

注意到对二项式的展开的牛顿公式:

(a+b)n=an+nan-1b++[n!/m!(n-m)!](an-mbm)+bn

ab分别等于0.5代入上式我们就得到n+1项,以其通项而论,它就代表了有n-m个正面m个反面的事件的出现概率。即这种类型的问题(如掷多次硬币)的概率分布恰好可以用二项式展开的牛顿公式表示。而这也就是为什么把这种概率分布类型称为二项分布的原因。

如果ab并不等于0.5,那么只要把A事件出现的概率以p代入,把B事件的出现概率以(1-p)代入,以上公式仍然正确,(a+b仍然=1)。

所以对于仅有AB两个结局的随机事件,如果A事件出现概率为pB事件的出现概率为1-p,那么在N次随机实验中A事件出现n-m B事件出现m次的情况(对应一种复合事件)的出现概率P应当是(这里的P是大写的)

P=[n!/m!(n-m)!][pn-m(1-p)m]

注意到上面公式的对称性,它也可以写为

P=[n!/m!(n-m)!][pm(1-p)n-m]

它就是所谓二项分布概型的随机事件的出现概率公式,也是牛顿二项式展开在变量是对应概率情况下的通项。它就是本章公式(11.3)的由来。

另外,当p=0.5时,显然[pm(1-p)n-m]总是等于1/(2)n,注意到[p+(1-p)]n=1,所以二项式公式展开的n+1项的各个系数的合计值应当等于2n

上式中并没有p,所以这个系数和公式与p的具体数值无关。一般概率图书中对二项分布多有介绍。

多项分布

把二项分布公式再推广,就得到了多项分布(在一般概率书中很少介绍它,但是热力学中涉及到它)。

某随机实验如果有k个可能结局A1A2Ak,它们的概率分布分别是p1p2pk,那么在N次采样的总结果中,A1出现n1次,A2出现n2次,Ak出现nk次的这种事件的出现概率P有下面公式:

这就是多项分布的概率公式。把它称为多项式分布显然是因为它是一种特殊的多项式展开式的通项。

我们知道,在代数学里当k变量的和的N次方的展开式 (p1+ p2+…+ pk )N是一个多项式,其一般项就是前面的公式给出的值。如果这g 变量恰好是可能有的各种结局的出现概率,那么,由于这些概率的合计值对应一个必然事件的概率。而必然事件的概率等于1,于是上面的多项式就变成了

(p1+ p2+…+ pk )N =1N=1

即此时多项式的值等于1

因为(p1+ p2+…+ pk )N的值等于1。我们也就认为它代表了一个必然事件进行了N 次抽样的概率(=1,必然事件)。而当把这个多项式可以展开成很多项时,这些项的合计值等于1提示我们这些项是一些互不相容的事件(N次抽样得到的)的对应概率。即多项式展开式的每一项都是一个特殊的事件的出现概率。于是我们把展开式的通项作为A1出现n1次,A2出现n2次,Ak出现nk次的这种事件的出现概率。这样就得到了前面的公式。

如果各个单独事件的出现概率p1p2pk都相等,即p1=p2=…=pk=p(注意这里是小写的p),

注意到p1+p2+…+pk =1,就得到p1= p2 =…=pk =p=1/k

把这个值代入多项式的展开式,就使展开式的各个项的合计值满足下式:

[ N!/(n1!n2!…nk!)](1/k)N=1

即∑[ N!/(n1!n2!…nk!)]=kN

以上求和中遍及各个ni的一切可能取的正整数值,但是要求各个ni的合计值等于N 。   即

n1+n2+…nk=N

在热力学讨论物质微观状态的可能个数时,经常用另外的思路引出N!/(n1!n2!…nk!)式。并且称它为热力学几率。它是一个比天文数字还大很多的数,把它称为几率(概率)并不妥当。但是热力学里由于各个微观状态的出现概率相等,这对应我们在前面讨论的p1= p2 =…=pk =p=1/k于是

[N!/(n1!n2!…nk!)]1/kN

就真正具有数学上的概率的含义。换句话说,物理学里的热力学几率[N!/(n1!n2!…nk!)]乘上(1/kN)以后就是数学中定义的(具有归一性)的概率了。

----12章结束,回本章首,去12章----