我们把“一次随机抽样中尽管多种事件都可能出现,但最容易出现(遇到)的事件(结局)是概率最高的事件”称为概率公理。这个公理也可以反过来表述:“一次随机抽样中概率最高的事件是最容易出现(遇到)的事件”。
概率公理的表述中用了“一次随机抽样”、“最容易出现”和“概率”这三个词。
“一次随机抽样”是统计学中用的词,它是让你不带主观偏见地从众多个对象中任意地取出一个(有的场合是把一批抽样统一做为一次实验)做为研究的样品。这里的抽样是仅进行一次,也不允许第一次不满意,再把另外的一次做样品。
“最容易出现”这个词含义简单,它带有“实践”的品位。
“概率”这个词含义抽象,带有“理性”的品位。在数学中概率有几种定义,如古典概率、用频率定义的概率、用集合定义的概率以至本书中把百分比定义为概率。概率的定义固然不只一个,但是概率定义中不使用“容易”这一些词。所以“概率最高的事件是最容易出现的事件”并不是概率的定义,而是高概率的事件的一个客观性质、也可以说是一个客观规律性。
由于概率的这个性质、规律太浅显,不仅没有人怀疑它,可也没有特别注意它,以至到今天没有人为它取个名称。我们现在就把这个非常浅显的规律(不是定义)抬举一下,称它为“概率公理”。我们尊它为公理的目的也很明确:利用这个非常浅显的公理推导出最复杂原理。
苹果熟了要落地,因为人们对此熟视所以也就无睹。可牛顿却从中引出“万有引力”的规律来。现在的科学家另有眼光,他们热心从别人得不到的数据中找规律;但是这并不说明在熟视无睹的事物中不再有尚未发现的规律。 这里介绍的概率公理可能就是因为人们“熟视”所以长期被“无睹”(忽视)。统计学的基础是概率论,概率论用什么支撑了统计学?在我看来统计学中很多统计的结论都是基于一个道理:在一次随机抽样中,高概率的事件容易出现。可以说人们已经无意中利用了这个概率公理。
“概率公理”仅是我们临时为它取的名称,是否应当改个更合适的名称?这也是值得考虑的问题。但是现在大家接受上述论断是个不要证明的真理,并且准备应用它也就可以了。
§10.3概率公理的定性应用
本节利用一些生活中的事例说明我们早已经在很多场合无形中利用了概率公理。
从一袋瓜子里任意(别挑,或者闭上眼睛)拿了一粒,可它是坏的。这就是一个事件,根据这个偶然事件如何估计这袋瓜子中坏瓜子占多少(百分比)?
随便拿一个瓜子就是个坏的,说明坏瓜子容易被选中。根据概率公理坏瓜子被选中的概率不是低概率事件而是高概率事件。根据我们对概率的定义,它说明袋子里的瓜子(广义集合)中“坏瓜子占的比例最高”。
记住上面的分析思路,在挑选商品时就不要专挑好的尝,而是任意拿一个,如果它是竟然坏的,你就可以决定不买它了。
根据最近的天气资料,气象预告人员认为明天出现晴天和雨天的概率分别是0.3和0.7,明天那一种天气最容易出现?显然是雨天最容易出现。于是天气预告人就预告明天下雨。预告员作预告的过程就是努力弄清高概率事件是什么。由于概率最高的事件最容易出现,以概率最高的事件做为自己的决策(预告)也就最容易“正确”。 运动员选择什么位置投蓝最容易成功?由于离蓝球框最近时,投蓝成功的概率(命中率)最高,当然是选择概率(命中率)最高的投蓝方式(离蓝框最近)去投蓝。运动员尽量向蓝下钻就是为了要到那里去投篮。到命中概率最高的地方去投篮最容易出现投篮命中的情况。钻到“概率最高”的地方去就是为了使得2分的事件“最容易”实现----这体现了概率公理。可以说运动员都非常熟练地利用了概率公理,当然,你也可以说概率公理非常浅显,人们都会使用它甚至使用了它还不知道它的存在!这与人们都知道苹果要落地而不知道万有引力定律是类似的。 大夫看病时根据症状认为患者可能患了A、B、C几种病。大夫知道出现B 种病的概率最高,大夫按那个病开药方?他当然以可能性最大(概率最高)的那种病处理。因为患者固然可能得了A病或者C病,但是患者最容易的事件是得了B种的病。所以大夫开处方时已经不自觉地利用了概率公理(把“高概率”与“容易出现”划等号)。发生了案件,警察先是怀疑每个人都可能犯罪,但不能随便抓人。要找出犯罪可能性比较大的嫌疑犯再进一步找出可能性最大(概率最高)的嫌疑犯。最后再决定逮捕他。把犯罪概率最高的人抓起来的,对吗?它最容易“对”(“对”是最容易出现的结局),而把其他的犯罪概率不高的人抓了就不容易对(容易“错”)。
介绍这几个事例是想说明新引入的概率公理实际大家早已熟练地应用于各种场合。人们可能要反问:如果早已经不自觉地定性地利用了概率公理,我们再给它命名,说它是公理,如何重要等等似乎都是画蛇添足的概念游戏。下一节讨论的概率公理在更高的水平上的应用会回答这个问题。