张学文
(新疆气象科学研究所,830002)
1859年,麦克斯威给出了一个理论公式
(1)
它描述分子质量为m的N个气体分子在温度为T的情况下,分子运动的速率界于v到v+Δv之间的分子的个数ΔN的计算公式.把分子看作是个体,把速率看作是标志,这个公式也就是一个理论分布函数.下面是自然界和社会中的一些广义集合和分布函数的例子.
表5a.自然现象中的一些广义集合与分布函数
广义集合
|
个体名称 |
标志名称 |
分布函数要说明的问题 |
太阳系小行星 |
每个小行星 |
行星的质量
|
不同质量的行星各有多少 |
中国的煤矿 |
每个煤矿 |
煤矿的储煤数量 |
不同储量的煤矿各有多少 |
某年的地震 |
每次地震 |
地震释放的能量 |
不同能量的地震各有多少 |
一次暴雨过程 |
每平方公里暴雨 |
雨量 |
不同雨量的面积各有多少 |
全国的湖泊 |
每个湖泊 |
湖泊的面积
|
不同面积的湖泊各有多少 |
全国的土地 |
每平方公里土地 |
海拔高度
|
不同海拔的国土各有多少 |
一片西瓜地 |
每个西瓜 |
西瓜的重量 |
不同重量的西瓜各有多少 |
一片松树林 |
每棵松树 |
树龄
|
不同树龄的松树各有多少 |
人体 |
体内每段血管 |
血管的直径 |
不同直径的血管各有多少 |
一瓶氧气
|
每个氧分子
|
分子运动速率 |
不同速率的分子各有多少 |
广义集合 |
个体名称 |
标志名称 |
分布函数要说明的问题 |
中国所有家庭 |
每个家庭 |
家庭的人口数 |
不同的人口数的家庭各有多少 |
地球上的国家 |
每个国家 |
国家领土面积 |
不同面积的国家各有多少 |
中国的农田
|
每亩农田
|
一年的产值
|
不同产值的农田各有多少 |
中国的机动车 |
每辆机动车
|
车的马力 |
不同马力的机动车各有多少 |
中国人 |
每个中国人
|
年龄 |
不同年龄的中国人各有多少 |
中国在奥运会上获奖 |
每个奖牌 |
奖牌等级
|
不同等级的奖牌各有多少 |
耀华股票 |
持有股票的人 |
持有股票数量 |
不同数量的股票的股民各有多少 |
进商场的所有顾客 |
每位顾客
|
顾客购物金额 |
不同购物金额的顾客各有多少 |
某城市打电话的数量 |
每次通话 |
通话时间长度 |
不同通话时间的电话各有多少 |
中国的国营工厂 |
每个国营工厂 |
职工人数 |
不同职工人数的工厂各有多少 |
l 分布函数中的函数值表示个体的个数,所以分布函数的值都是单值的正数而没有负数.
l 用个体的总数去除每个函数值,它具有百分比(权重)的含义,我们把这一串新的数称为相对分布函数或者权函数.各个变量的相对分布函数的合计值应当等于1.相对分布函数等价于概率论中的概率分布,所以分布函数概念包括了概率分布.
l 如果标志值可以连续变化,分布函数也可以是连续函数.此时用标志值的单位增加值对应的个体数量代表函数值.它对应与概率论中的概论密度.
广义集合固然是分析物质组成的一个数学模型.但它也可以应用到“运动”、“物理场”、“抽样实验”等场合.
一个质点在T 时段内等速度地移动了距离L.如果问:质点在不同的位置各有多少时间?这个问题的结构符合分布函数的模型.它的答案也就是要找的分布函数.一个人造卫星围绕地球做椭圆运动,问“在一个周期内卫星在不同距离上滞留了多少时间”,这个问题符合分布函数模型,认可了这个运动可以用分布函数描述,也就说明“运动”也可以用广义集合、分布函数描述.
用地图上的等值线可以描述各地的海拔高度、温度、气压、雨量,这些高度场、温度场、气压场、雨量分布场都是物理场[2].如果问“不同的高度、温度(气压)占了多少面积”.这些问题的答案都对应着确定的分布函数.所以物理场也是一种广义集合.显然引力场、磁场、电场都可以看作是广义集合(用引力、磁力、电力的平方反比公式可以换算出对应的分布函数).
对北京的温度进行了10000次观测,就得到10000个数据.每个数据是个体,10000个数据是总体(群体),这也组成了一个广义集合.在统计学中这些都归入随机抽样实验得到的数据.人们经常分析不同结局出现的概率或者概率分布.而所有这些都符合广义集合的含义.所以抽样实验的结果也是一种广义集合.而概率论中的概率分布也就是广义集合语言中的相对分布函数.
广义集合概念可以描述物质组成,也可以描述物质运动、物理场和抽样实验的结局.广义集合概念还可以描述空间、时间、和抽象事物.
认识到这么多类型的事物都可以进入广义集合模型,又认识到每个广义集合都具有自己的分布函数以及每个函数都是一个客观规律,我们几乎感到:只要利用了广义集合模型,就有很多客观规律等待我们撩开它们的面纱.
用“符号”表示概念和规律是数学模型的优势.广义集合也可以用符号表示?
关于分子运动速率的理论公式(1)和统计学中的正态分布公式等等都是分布函数的特例.它们都是用于连续变量中的符号化的函数关系.所以标志值是连续变量的广义集合的分布函数的符号表示问题已经解决了.余下的问题离散变量的分布函数如何用符号表示?为此,笔者发明了“广义集合多项式”的表示方法.
果盘里有3个苹果和两个梨.把它们看作是广义集合A,我们用A={3苹果+2梨}表示这个广义集合.一般地把
A={ n1 (x1)+ n2(x2)+…} (2)
称为广义集合A的多项式.这里n1,n2,…分别表示标志值为x1,x2,…的个体的数量.广义集合的代表符号一般用粗斜体字母(与向量的习惯一致).{}括号表示这是广义集合不是一般的数,x1,x2,…这些符号表示标志值,在一般意义下它们都是字符串变量(如苹果、梨等).按照数学的做法,上面的广义集合多项式也可以写为
A={∑ni(xi)}
(3)
一个水分子的广义集合B可以写为 B={2(H)+1(0)}.这里的H,O是两个字符串变量的值,分别表示该个体是氢原子和氧原子.仿照数学惯例,规定数量为1时,1可以省略,就有B={2(H)+ (0)},在含义清楚的情况下()括号也可以省略.多项式中的加号具有“还有”、“以及”、“并且”等含义.
如果H,O的含义改为平面坐标系中的单位矢量(i,j)那么广义集合多项式就是一个矢量的一种写法了.所以离散变量的分布函数的多项式表示法与矢量的写法是相通的.
两个小学校合并后每个年级各有多少学生?这是两个广义集合的加法问题.它也就是两个广义集合多项式做代数加法.这说明广义集合可以进行运算(规定从略).
如果标志值是两维的(如学生的体重、血型),广义集合多项式写为
(4)
n i,j对应于一个矩阵.标志值是三维变量,n值就得表示为n i,j,k(对应一个张量).
广义集合多项式可以进行运算.对加法运算满足交换律和结合律,广义集合多项式本身已经构成了一个代数系统.
组成论是个知识框架,它为研究客观事物的内部组成提供一般模型、概念和一般规律.目前主要利用广义集合、分布函数、复杂程度三个概念和复杂度定律研究客观事物.广义集合是量化的客观事物(含运动、物理场、抽样实验、空间、时间)的一种数学模型,也是分子原子学说的泛化.每个广义集合都具有一个分布函数(客观规律),它描述不同特征(标志值)的个体各有多少.离散变量的分布函数可以用“广义集合多项式”表示.广义集合可以进行加法等运算.