2004,7公布于潜科学网站
(网站说明:姜殿玉教授投稿本网站介绍其提出的“数理谋略论”,我们已经放到潜科学文库中。这里是介绍其创立过程的文章。读者也可以与姜教授直接联系。2004.8.1--网站编辑)
我的高中时代是在“文化大革命”中邓小平副总理搞“整顿”中度过的,所以还摊上了一段好时光。现在回想起来还很有意思。当时我对各门功课都非常感兴趣。我的作文每次都被语文老师在作文讲评课上被作为范文讲评。临毕业时我的一篇小故事被全校语文老师传看并在其所任班级里朗读,轰动了全校。但是我最喜欢的功课还是数学。当时学校里流传各种各样蒙人的数学游戏。结果被我很快“一一告破”了。有一次,数学老师给我们出了这样一道题:你想一个不超过105的正整数,然后分别用3,5和7去除它,并把余数告诉我,我就知道你想的正整数是什么。做了几次实验都很灵。因为老师没有告诉“迷底”,所以同学们都感到很神秘。在午休时,我利用从课外书上看到不完全归纳法揭开了这个迷。下午我宣布我也会了。一实验都灵。全校流传说我发现了一个定理(后来上了大学我才知道这就是初等数论中著名的中国孙子定理。不过高中时代确实不知道)。同学们对我更加崇拜。在学校恢复“文革”前的科代表制度的选举会上,全班同学异口同声地选了我。
高中毕业后,我被抽到大地测量队搞小三角控制测量。说实在的,我确实很喜欢这种工作,因为它处处要用到数学知识。我参加这支队伍虽然较晚,但是很快就成了队里的技术尖子。在工作时间以外,其他队员都打牌,吹笛子,闲逛,我却研究手摇计算机的有理数计算并研究了很多减少外业工作量的加密点的测量计算法,提高了工作效率。被局里评上先进工作者。在测量队这段时间里,“博士”成了我的“名字”。记得有一次我们在乡下驻扎,一位农村大嫂找到我,问:“格士,你有止痛药吗?给我两片!”引得在场的队员们哈哈大笑。
1977年“文革”结束后恢复高考制度,我考入了沈阳师范学院数学系(现已合并更名为沈阳师范大学数学与系统科学学院)。1978年春季入学。刚到大学时连英语字母都不认识(中学时我学的是俄语),于是我逼着自己适合英语环境。别人看发的教材《数学分析》,我却买了影印英文版的《Calculus》来读。开始自然吃力,后来生词越来越少,语法越来越熟。一举两得:英语学的都是专业上实用的,越常用的越熟练;同时也没有耽误数学分析的学习。其他专业课我也是这样学的。高年级时我曾经研究过数论,半群等。在系里举办的学术报告会上,系主任破例安排我——唯一一个学生上讲台做了学术报告。现在回想起来我当时还真是初生牛犊不怕虎,不知天高地厚。好歹听众都是我的老师和同学。即使内容可能有错误,然而他们不但不笑话我,还使劲为我鼓掌,喝彩。
生物系有一个我的最要好的朋友,名字叫张继光。我们虽然专业不同,但是我们的志趣都一样,所以非常谈得来。晚饭后我们经常一起散步,探讨着学术问题,彼此都受益匪浅。我们立下过志向:一起搞生物数学。他从一位教授那里得知:国际上生物数学最看好的方向是ESS理论(进化稳定策略)。但这需要对策论这门数学工具。但当时我们所开设的课程中根本就没有对策论(至今这门功课还是一些专业的研究生课程),我对它一窍不通。所以我开始自学对策论。直到毕业。
毕业时,张继光分到了沈阳医学院。而我的命运就惨了。被分配到丹东五龙金矿,这里地处深山,交通不便,信息闭塞。这里的人都把这个地方称为“五龙国”(因为它是对外封闭的)。根本不是搞学术研究的地方。况且从事的工作与学术毫不相干:干过门卫,收发,图书管理员,信访和打击经济犯罪等多种工作。好在我毕业前买了不少拔高专业水平的书籍带到这里来了,八小时以外可以钻研提高,否则就更糟了。
1987年我们夫妇应聘调入连云港化工高等专科学校。此时我的大学同学们都已经升上了讲师,我的好友张继光也已被学院公派去了英国留学;而我这个33岁的中年人才开始当助教。没有生物学合作者,我也只能放弃ESS理论的研究了,但是毕竟有了较好的对策论基础。一天我在南京一家新华书店闲逛,发现书店里卖的关于谋略的书很多。我就浏览了一下。这方面的书虽然很多,但是形式上都是千人一面:归类起名,文字说明,案例说明。甚至同一案例出现在不同的好几本书上。没有一本用数学工具来定量地研究谋略。于是我便产生了一个灵感:谋略中所涉及的问题不也是对策吗?能不能用对策论为工具来研究谋略问题呢?从此我便开始了所谓“数理谋略论”的研究。
在一所专科学校里,科研经费,资料等都很困难,对科研的重视程度更不敢跟本科学校相比。没有经费——自费;没有资料——自订。没有时间——挤。通过坚持不懈的努力,于1999年在《经济数学》第2期上发表了这一方向的第一篇论文。这篇论文的发表,使我非常荣幸地结识了我国对策论学术界的著名科学家(“文革”前我国第一代对策论研究生),世界交通运筹信息统一组织副主席,大连轻工业学院运筹管理研究所所长,博士生导师张盛开教授。他给我寄来了他的著作《现代对策论方法》,他的名片和一封非常感人的信(我至今还保留着)。按照他给我的名片,拨通了他的电话。他接到我的电话非常非常高兴,在电话里足足唠了一个小时。结识了这样一位老前辈,真是值得庆幸的。他对我的赏识也是我终生难忘的。我们师生彼此的感受可以用一句成语来形容——相见恨晚。从此以后,我们经常联系,经常合作。
2000年1月,我调入本市省属本科学校——淮海工学院数理科学系,担任副教授。2003年1月,受聘兼任以张盛开教授为所长的运筹管理研究所教授。2004年,由江苏省高校教师高级职务任职资格评审委员会和江苏省教委任职资格审批部门正式批准晋升教授。近期东北财经大学出版社正在洽谈将他的著作《对策论与决策方法》2000年第一版于2004年再版,再版时将把我的研究成果收入进去。
数理谋略论简介
一.经典对策论和数理谋略论
20世纪20年代,Zermelo探讨过国际象棋的数学问题,可说是对策论的第一篇论文。1928年和1937年von Neumann先后发表了两篇论文被认为是对策论的开端。1944年von Neumann和Morgenstern合著出版了《对策论与经济行为》,1947年出版了该书的第二版。此时被认为是对策论的真正形成。
(经典)对策论是运筹学的一个分支。是用数学方法研究带有竞争和斗争性质的现象的一门学科。对策的三要素是局中人(参加对策的决策主体),策略(局中人所使用的招法)和赢得。
经典对策的分类:
1.按照局中人多少,可分为二人对策,三人对策,……,n人对策和可列人对策对策等。
2.按局中人赢得之和可分为零和对策和非零和对策。
3.按照局中人的策略数目可分为有限对策和无限对策。
4.按照赢得函数的分析性质可分为连续对策,离散对策等。
5.按照局中人是否合作可分为合作对策和非合作对策。合作对策又可以分为传递效用的和非传递效用的。
6.按照局中人所占有的信息情况可分为完全信息对策和不完全信息对策等等。
7.按照对策进行的局数可分为一步对策和多步对策。
还有其他分法,不再赘述。
数理谋略论是以数学为工具研究传统谋略学的公理化结构、算法和性质等的一门交叉(边缘)学科。
二.二人零和对策的公平性和刺激性
经典二人零和对策理论假定两个局中人都是自私的和贪婪的。在此假定下,von Neumann给出了局中人在悲观意义下的最优策略。当两个局中人各自使用自己的最优策略时,从期望角度上讲,他们都可以在最坏的情况下得到最好的赢得。
我们则做了两个极端的假定:第一个假定是两个局中人都希望对策结果尽量公平,谁都不希望让自己或对方吃亏(例如当两个要好的朋友不得不作一次涉及他们每个人切身利益的零和对策时,他们都希望对策结果尽量公平)。在此假定下,我们证明了这种意义下的最优策略的存在性和可用性。并给出了对策公平性的度量方法,证明了它的有趣性质。另外一个假定是两个局中人都希望对策最具有刺激性(风险大,侥幸取胜的赢得也大,比如赌徒往往通过加大赌注来增加刺激性)。我们也得到与第一个假定相对应的结果。
三.对策上的判断
经典二人零和对策假定局中人都没有条件判断对手在对策中将使用什么策略,因此不得不在最坏的情况下争取最好的赢得。这与西方的对策传统有直接关系。例如,“兰德公司政治学研究部主任乔·波拉克说过:‘当美国军事计划人员认为可能有必要用兵时,他们更多的是注意敌方的能力,而很少考虑敌方的战略和意图。’这‘早已引起西方军事家的注意’。”(见李炳彦,中国传统谋略和西方对策论,中国国防报,2002-1-8(6))。但是在中国的谋略思想中,局中人必须要判断对手将以什么概率选用什么策略。例如孙子说:“不知敌情者,不仁之至也,非主之佐也”。因此要研究数理谋略,我们必须把判断引入经典对策结构中。正如《科技日报》1999年10月2日第五版《对中国数学未来发展的一些思索》一文中刘建忠先生所说(此文本网站收录了):“为了超越,我们的眼睛就不能总是盯着西方,中国有中国的文化,西方有西方的文化,中国人有中国人的思维方式,西方人有西方人的思维方式,它们是两种不同形态的文化和思维方式。中国传统思想在与西方数学思想碰撞、融汇中必然会产生一些新数学思想,这些新数学思想应当发扬光大,并且自然而然应该属于中国数学学派范畴”,“吸收世界上一切先进的东西,并将它们与中国实际情况相结合‘本土化’,形成中国自己的数学学派,是中国数学发展的光明之路。”因此,我们比较系统地研究了矩阵对策和连续对策上的判断理论,得到了很多研究成果,发表在国内重要的专业期刊上。当然还有很多东西值得进一步探讨。
在带判断对策系统中,(1)局中人不一定使用经典最优策略,(2)每个局中人都不认为对手不使用经典最优策略没有理性或有诈。
四.一种新对策系统
借助于二人零和对策的公平性的研究,两个局中人的对策结果达到最公平时,我们定义对策是平局的,若一个局中人的赢得大于他在平局时的赢得,则说他赢(或胜),对手输(或败),其相对差越大,则胜或败的程度越大。我们引进公理:追求尽可能大的胜利度是每个局中人的对策目标。孙子说:“兵者,诡道也”,“兵以诈立”。我们把“示敌以假”的策略称为佯策略,而真用的策略称为隐蔽策略。把这些成分都加入到带判断成分的对策系统中,便得到我们的新的对策系统。研究了识破计策,中计及其概率,将计就计等问题。我们有如下结论:
1.新旧对策系统是相容的,新系统是旧系统的一般化:当判断集,佯策略集都是空集时,就是经典对策系统。
2.在经典对策系统中难以解答的问题,在我们的对策系统中可以得到解答。例如当某些对策系统中局中人没有纯的最优策略时,经典对策建议局中人采用随机试验的方法进行对策,但实际上没有聪明的局中人这样做。这是因为这些对策原本属于我们的新系统,如果硬把它放在经典对策系统中,必然产生矛盾。这正象毕达格拉斯学派认为一切数都是两个整数之比而导致第一次数学危机一样。此外,经典对策论无法回答在齐王赛马中为什么田忌的马明显不如齐王的马的情况下田忌却获胜。我们的对策系统却很容易解释。还有《三十六计》中的许多计策模型都可以用我们的系统加以描述,经典对策系统对此则是望尘莫及的。
3.经典对策系统不满足最大胜利度公理;我们的对策系统则满足。
五.非零和对策上的计策
在《三国演义》中,谋略家的化身孔明识天文(气象),懂地理,善于使用大自然这个“不可见之兵”,因此才能波望坡火烧夏侯惇,草船借箭,借东风等。我们在上述对策结构基础上又引进“局外人”的概念,用以代表气象,地理环境,市场状况等等。另外,孔明不但善于算(判断对手使用何策略)人,而且还善于算人之所算。例如,周公瑾设的苦肉计,只能使将干,曹操中计,但逃不过孔明的神算。由此我们引进0级判断,1级判断,2级判断等等。在《三国演义》中的群雄逐鹿时代,曹操,刘表,袁术,袁绍,吕布,刘备,孙权等等时而联合,时而敌对。刘备联合孙权所打的赤壁之战,就是例子。因此,在我们的新的对策系统中讨论了最优结盟方案的最优化算法。
目前,我们正在研究动态对策上的计策问题,已经获得了一些成果(待发表)。
一门学科的完善,不可能有几个人就能完成的,它往往需要几代人的努力才有可能实现。因此,这门学科目前还有很多很多问题没有解决。其结构目前还是残缺的。因此笔者希望有这个志向的学者与我们一道努力,使其越来越完善。
数理谋略论文献目录
[1]姜殿玉,有最优解的n人合作对策是θ对策的θ上界[J],淮海工学院学报(自然科学版),1997,6(3):7-10.
[2]
Jiang Dianyu, Ma Yuhua, About Problems of the Zero Sum
Two Person Finite Tricks[J], Mathematics in Economics,1999,16(2):65-72.
[3]
姜殿玉,李日华,关于矩阵博弈计策解的一个注记[J],海军航空工程学院学报,2000,15(1):31-32.
[4] 姜殿玉,矩阵博弈的胜利度和“僵局”[J],运筹与管理,2000,9(3):34-36.
[5] Jiang
Dianyu, Zhang Shengkai, Tricks on an Extended Game in Normal Form[J], Journal of
Science and Technology (Canada), 20012(3):1-17.
[6]
Jiang Dianyu, A n- Person Game in Normal Form with
Outside Players and k-Order Judgments[J], Journal of Science and Technology
(Canada), 20012(3):1-8.
[7]
姜殿玉,实质矩阵对策的一个充要条件[J],江苏理工大学学报(自然科学版),2001,22(3):93-94.
[8] 姜殿玉,“无中生有”计的一个博弈模型[J],运筹与管理,2001,10(1):142-144.
[9]
Jiang Dianyu, The Supporting Solution Systems for
Matrix Tricks[J], Mathematics in Economics, 2001,18(1):33-37.
[10]
姜殿玉,张盛开,刘广智,矩阵对策上的判断理论[J],大连轻工学院学报(自然科学版),2001,20(3):229-234.
[11]
姜殿玉,张盛开,一种扩张n人正规对策上的计策理论[J],经济数学,2001,18(3):62-69.
[12]
姜殿玉,关于矩阵对策的两个注记[J],运筹与管理,2001,10(4):49-54.
[13]
姜殿玉,李日华,单调核心对策的核心单调分配法[J],海军航空工程学院学报(自然科学版),2001,16(4):485-486.
[14]
姜殿玉,张盛开,矩阵对策上的计策问题及其实例[J],系统工程理论与实践,2002,22(12):26-32.
[15]
姜殿玉,连续对策上的计策问题[J],运筹与管理,2002,10(2):41-46.
[16]
姜殿玉,连续对策之判断下的最优策略集[J],运筹与管理,2002,11(3):5-10.
[17]
Dianyu Jiang, Tricks on a finite game[C],In: Gao H, Leon A. Petrosjan,etc.(ed),
2002GTA(2002年度国际数学家大会论文集),Qingdao Publishing House, 2002,263-270.
[18]
姜殿玉,连续对策上的计策理论[J],系统工程,2003,21(1):1-7.
[19]
姜殿玉,矩阵对策上的计策理论[J],系统工程学报,2003,18(3):224-230.
[20]
Jiang Dianyu,Liu Guangzhi, A Study on Equitablity of a
Matrix Game[J],OR
Transactions(运筹学学报),2003,
7(4):12-21.
[21]
姜殿玉,连续对策上的判断块[J],淮海工学院学报(自然科学版),2003,12(1):1-4.
[22]
姜殿玉,连续对策的相对最优紧凸策略子集[J](特约),苏州科技学院学报(自然科学版),2003,20(3):34—40.
[23]
姜殿玉,动态矩阵对策上的无中生有计及其实例[J],系统工程,2004,22(1):91-94.
[24]
JIANG Dianyu, LIU Guangzhi,Relation between Judgement and Optimal Strategies on
a Continuous Game[J], OR Transaction(运筹学学报),2004,8(2).
[25]姜殿玉,数理谋略论——对策上的计策理论[M], 高校学人丛书,北京:中国文联出版社,2003,第1版.
原创性专著《数理谋略论——对策上的计策理论》内容简介和购买渠道
内容简介:本书是标志数理谋略论(用数学工具研究谋略理论)诞生的第一部学术专著。内容包括对策论基础知识及由此建立起来的一步对策上的计策理论。
本书共分三部:
第一部是矩阵对策的计策理论;
第二部是连续对策上的计策理论;
第三部是人有限正规对策上的计策理论。
只要具备线性代数及抽象代数,概率论,凸分析,实分析,非线性泛函分析,一般拓扑学和测度论等的基本知识就可以阅读此书。
读者对象为应用数学,运筹学,系统工程学,军事学,经济学和管理学等领域的专家学者,科研人员,大学教师,博士和硕士研究生和同等学力者等。
购买渠道:
1.纸质印刷版:定价:17.80元。
渠道(1)九章数学书店:地址:北京海淀西大街31号(图书城二层)北京九章图书有限公司,邮编:100080,图书编号:Y1084。
渠道(2)万海书店:1、联系人:刘万海;联系电话:010-62591500; 传真:010-62599659
2、e-mail联系:wanhaisa@163bj.com
3、联系地址:北京9399信箱北京市海岸文化服务中心销售部
邮政编码:100093
渠道(3):姜殿玉,地址:江苏省连云港市新浦区苍梧路59号,淮海工学院数理科学系。邮编:222005。电话:0518-5591561。图书分类:应用数学; 序号:92
渠道(4)臺灣高等教育出版社大陸圖書資料代理中心:
網址:http://www.thep.com.tw/index.htm/EXCELand
TEX/理工/數學.Page No4.編號87554,定價:371台幣
2.数字版:定价:6.00元
超星数字图书馆:网址:
http://www.ssreader.com/数学/运筹学/《高校学人丛书,数理谋略论:对策上的计策理论》。