悼念徐老(通锵)先生

 

邹晓辉(中国珠海)

20061128日星期二

qhkjy@yahoo.com.cn 0756-5505041

 

序言

    告慰徐老师:字本位与中文信息处理的基础研究,已取得实质性进展。

20061127, 12:05:23打开信箱收到王洪君教授Sun, 26 Nov 2006 15:18:09发来的电邮“徐老师讣告见附件”,禁不住黯然神伤,心中也隐隐作痛。

2006927日晚与徐老师最后的通话过程仍历历在目:

20069月我应邀到北京参加“第五届中国科学家论坛”(人民大会堂28-30日)27日晚在北京东郊下榻的华润饭店,我与徐老师通过一个电话(没想到竟是我们之间最后的通话),徐老问:“晓辉,你在哪?”听上去与我上次来京并无异样,我说:“已到北京了。”当徐老听说国庆节我应邀将去西班牙出席第七界国际本体学术会议(VII International Ontology Congress 2006102 -6日)时,徐老高兴地说:“你走到国际学术前沿,我很高兴,祝贺 你!”当我说:“明天(928日)下午我应邀将到北大(三院)与信息科学交叉研究学术研讨会的学术委员会主任、副主任和其他几位学术委员作学术交流——介绍我的‘信息学基础研究’(其中,涉及:《(理论、工程、应用)融智学》专著(三部曲)的三个典型分析之一‘字本位与中文信息处理的基础’课题)最新研究进展,您老是否有时间到会参加?或会后我来看您” 时,徐老师说:“这是个好事!不过我这次去不了了。”我迟疑了一下,于是问:“您老身体近来如何?”,这时,徐老师才语气略微有些紧张地说:“很不好,最近我的体重几乎是每天轻一斤,不知什么原因。”我问:“医生如何说?”徐老师说:“还没有去看。明天准备去医院检查。今天我要早点休息。”于是我们相互道了一声晚安,就结束了这次短暂的对话。 

第二天,中午(928日)在去北大途中,我特意与铁道部总医院原院长李根秀教授见面交换了对徐老所述这种身体近况的初步判断意见。出国前后由于再没与徐老通上电话(家里没人接电话),我便通过电话与王洪君教授谈及徐老的身体近况和日常护理等事宜。后来,听说徐老已确诊并住院治疗。于是,我只有在心里默默祝福“徐老师早日康复出院!同时加紧“字本位与中文信息处理”研究课题的进一步完善,好以此慰籍徐老疲惫的身心。

眼看即将完成最后的冲刺,现在,却突然收到“徐老师讣告见附件”。

发件人:

"Whj" <fthjww@pku.edu.cn> 

收件人:

qhkjy@yahoo.com.cn

主题:

徐老师讣告见附件

日期:

Sun, 26 Nov 2006 15:18:09 +0800

 
如题。

 

讣告

著名语言学家、北京大学中 文系 教授 徐通锵 先生因病于200611251950分辞世,享年75岁。

遵照家属意愿,丧事从简,不举行遗体告别仪式。

北京大学中文系将于 20061129日至122日在中文系(五院)开设 徐通锵 先生的悼念室,并将于近日在网上开辟 徐通锵 先生纪念专栏。

联系电话:010-62757991

真: 010-62759366

E-mailell@pku.edu.cn

 

北京大学中文系

20061126

 

看后,真是不知所措,悲痛万分!

不过,好在终于可以明确地告慰徐老师:无论是“字本位与中文信息处理”(论文),还是“《字本位与中文信息处理的基础》(专著)”,都取得了实质性进展。

同时,这两个层面的研究也都证明:

试图借鉴国外计算语言学和人工智能所采用的“基于‘英文信息处理’的直接形式化”方法的词本位与中文信息处理和知识工程(如:机器翻译)遭遇了这样一个悖论,即:

一方面,中文信息处理及其知识表达如果要采用国外英文信息处理和知识工程的直接形式化方法,就势必先要把中文翻译成英文或基于英语的计算机编程语言以及相应的谓词逻辑符号;另一方面,(因为翻译工作量源源不断靠人是难以胜任的)自动翻译必须在中文信息处理及其知识表达和英文信息处理及其知识表达同时过关之后才能实现。事实上两者本身目前均未过关。何况“基于‘英文信息处理’的直接形式化”方法,对中文信息处理而言,实质上是“间接而又间接的形式化”。

相比之下,基于“字本位与中文信息处理”的工程融智学“间接形式化”方法(等价于“基于‘英文信息处理’的直接形式化”方法),可构造相当便捷的“双语知识仓库”和“多科专家系统”,因而,可开辟了一条广阔的通途,尤其是再加上应用融智学“生产式教学”和“(产学研教用)一体化管理”的配套服务。

 字本位与中文信息处理一文是《汉语字本位理论及其应用》一书的一个部分。这是徐通锵主编的一套“字本位”理论及其应用丛书(共8本)之中的一本(从2004青岛“汉语‘字本位’理论及其应用研讨会”几十篇论文中精选修订而成的论文集)专著,即:《汉语“字本位”理论及其应用》(杨自检主编,孟华等副主编)其中,占据三个部分之一的“中文信息处理”部分的作者,只有鲁川和邹晓辉两人)

字本位与中文信息处理一文是在20043-11月期间提交给青岛“字本位”会议(12月)三篇论文“字的形式化定义——试论字本位理论的根基”、“字组划分的方法——试论字本位理论的功用”和“字与字组的关系——试论字本位理论的发展”三篇论文基础之上于200412-20056月提炼完成的,其中关于“基础语言学”和“汉语字本位理论及其应用”部分得到徐老师的多次直接指点。

 

1

 

日期:

Sun, 23 Jan 2005 10:23:36 +0800

发件人:

"徐通锵" <xutq@pku.edu.cn>  

主题:

回函

收件人:

"邹晓辉" <qhkjy@yahoo.com.cn>

晓辉:
    
大作今天粗粗地看了一遍,比会前看到的原稿提高了一大步,至少能把握住你
的思路脉络。你从层面型结构与线串型结构的迭交着眼去定义字,这一思路很好,
分析也比较仔细,表格的制作也比较清楚。我的想法是,最好把表与文糅合为一个
整体,在文章的适当部分插入某一个表,使文与表互相印证,读起来方便一些。这
一意见仅供参考。你的第二篇文章还没有看,一是事情多,二是精力有限,只能抽
暇阅读,请谅解。
    
如何论证字作为汉语基本结构单位的思路,不同的作者似乎都朝着一个共同的
方向在探索,共同点是迭交:你是层面型结构线串型结构的迭交,
我在向字本位学术讨论会提交的论文中说的是空间的终点(形)和时间的起点
(序)的交集, 王洪君在向新加坡召开的一次学术会议提交的论文中说的是语音和
语法的交汇点,我们各自观察的角度尽管不同,但基本精神一致,而我们两人的思
路似乎更接近些。希望以后能在这个方向上再前进一步。
    
你的迭交论(自然也包括我的交集论),反对者也可以一言以反对,
这就是你们没有把语言与文字分开,因为层面型结构说的是文字,不属于语言
研究的范畴。我希望你从计算机对语言文字的处理的角度再进行一些推敲,说理更
充分一些。我们共同努力吧。顺祈
新年好
                                              徐通锵              123

 

2

 

日期:

Thu, 27 Jan 2005 16:46:50 +0800

发件人:

"徐通锵" <xutq@pku.edu.cn>  

主题:

函件

收件人:

"邹晓辉" <qhkjy@yahoo.com.cn>

晓辉:
    
你的三篇稿子先后粗略地翻了一遍,觉得思路可取,有些论述也很好,但文章
的毛病似乎也不少,现提出几点意见,供你修改时参考:
    1、空话太多,枝蔓太多,内容不集中,三篇文章颇多相互的重复。文章的可
取之处是对语言研究提出了一种形式化的思路,你应根据这一思路展开研究,不要
老是讲你的思路的优越性;优越不优越,决定于你的分析是否能解决实际问题,不
在于你自己说什么。
    2、三篇文章以第三篇为基础,整合成一篇文章,文与表穿插互证,不要分
离。思路要用实例来论证,请斟酌如何用一些典型的事例来说明字的定义的形式
化、字组数字化和义项字组化。这三个都很好,但人们希望的是能从中发现
如何的方法或途径。第二、第三这两个是复杂的系统工程,如果你能
以一个字或几个字的分析为基础,展示你的思路和方法,可能会给人们以有益的启
示。文章不要太长,最好能控制在15000字左右。希望你从形式化的思路展开分
析,一以贯之,删去一切与思路无关的文字,更不要涉及其他的理论体系。
   
 3、参考文献以作者姓氏的音序排列。
    
意见不一定对,仅供参考。在青岛举行的字本位研讨会的相关论文将以专著的
形式(因论文集影响发行)由山东教育出版社出版,书名暂定为字本位理论及其
应用研究,其中有一章是字本位和语言文字的信息化处理,希望能将你的文
章置于这一章,名字署于文后。你的几篇文章思路很好,符合要求,但需要在行文
上进行比较大的加工。请你斟酌考虑。敬礼!
                                             徐通锵             127

 

3

 

日期:

Fri, 25 Feb 2005 17:28:32 +0800

发件人:

"徐通锵" <xutq@pku.edu.cn>  

主题:

函件

收件人:

"邹晓辉" <qhkjy@yahoo.com.cn>

晓辉:
    实在抱歉,拖到今天才拜读来稿。由于小孙子的降生,整个假期弄得手忙脚
乱,延误了不少事情,其中包括阁下大作的阅读。今天匆匆看了一遍,尽管一些技
术问题我不大清楚,但觉得整篇文章的思路很好,而且也是你的多次来文中最具学
术论文的一篇,深为高兴。看来你对此确有相当深入的考虑,是一篇有相当深度的
技术性学术论文。你就按照这一思路写、修改,讲你自己的意见,将道理讲透。文
章现在在具体事例的分析上还有待展开,请补充修改后寄给我和孟华。原来说文章
最好控制在15000字以内,展开事例的分析后,恐怕有困难,但也不要扩充得太
多,大致控制在20000字左右,总的原则是将问题讲清楚。有什么意见我们再联
系。敬礼!
                                               徐通锵             225

 

 

作为《(理论、工程、应用)融智学》(三部曲)的三个典型分析之一的“字本位与中文信息处理的基础”课题,“字本位与中文信息处理”(论文)和《字本位与中文信息处理的基础》(专著),得到徐老师明确的肯定意见和认可。

4

这是一个前沿性的课题。现在语言信息处理的思路大多受国外语言理论的影响,而如何根据汉语的特点,运用信息科学的技术,进行中文信息处理,赶超国际水平,是我们急需探索和解决的一个重大课题。当前流行的研究以词为汉语的基本结构单位进行中文信息处理,违背了汉语的特点,因为“汉语中没有词”(赵元任)。这种跟着西方人思路转的研究是无法实现赶超国际水平的目标的。《字本位与中文信息处理的基础》摆脱了流行思路的束缚,以字本位理论为基础研究中文信息处理的问题,探索形式化的新路。这抓住了汉语特点的关键,因为“字是中国人心目中的中心主题”(赵元任)。本书方向正确,思路清楚,立论有据,是有原创性的新著,其形式化的研究成果也具有广泛的使用价值。希望此书能早日出版。

徐通锵                55

原件,见:专家推荐意见(表2

Potential Science Web  潜科学网站(2002-2006)

前沿科学学术期刊(2005-2006)

47

108 中国人工智能学会CAAI-11程序委员会收稿方式给《潜科学》编辑的几点启示

109 字本位与中文信息处理的基础 (前言)                      作者  邹晓辉

本期会读文章:

中文信息处理的现状和发展方向                               作者 许嘉璐

 

    与徐老师早期的一次通信对话或交流(摘要):

(融智学作者邹晓辉关于‘义、文、物、意’概念的提出,我觉得是有价值的,但如何阐述?抓住什么样的核心?需要深入推敲。这四个概念的关系,据我的理解,‘义’应是客观存在的事物的结构机理,或者说是客观规律,其运转规律不以人的主观意志为转移;‘意’是主观对“义”的认识或理解,‘文’与‘物’只是这种认识外化的表现形式。区分‘义’与‘意’是很必要的,现代语言学也已意识到这种区分的必要,其具体的表现形式就是注重功能的研究。如何将这种区分进行理论上的阐述,还需学界的努力。徐通锵2001,  911

……

您曾跟我说过,您看到有关字的文章后,原来思想上一些不清楚的问题,相接通电路一样,一下子就清楚了。我很看重您的这种感觉。如果字在计算机运算中能发挥它的潜能,在融智体系中能解决现行的语法理论不能解决或解决不好的问题,那对科学的发展就很有意义。

……

以上意见仅供参考。

徐通锵2001,  911

 

 

原件:

 

晓辉先生:

几次来函和大著都已先后收到,谢谢。先生提出了一些重大的问题,鄙意是目标过大,恐怕难以实现预期的目的。因为我们研究的领域不同,很多东西我不懂,只能供先生参考。

义、文、物、意概念的提出,我觉得是有价值的,但如何阐述?抓住什么样的核心?需要深入推敲。这四个概念的关系,据我的理解,“义”应是客观存在的事物的结构机理,或者说是客观规律,其运转规律不以人的主观意志为转移;“意”是主观对“义”的认识或理解,“文”与“物”只是这种认识外化的表现形式。区分“义”与“意”是很必要的,现代语言学也已意识到这种区分的必要,其具体的表现形式就是注重功能的研究。如何将这种区分进行理论上的阐述,还需学界的努力。

先生采纳字本位理论,我自然很高兴。从几次来文看,觉得字在解决融智体系中相关问题的地位和作用,说得不清楚。您曾跟我说过,您看到有关字的文章后,原来思想上一些不清楚的问题,相接通电路一样,一下子就清楚了。我很看重您的这种感觉。如果字在计算机运算中能发挥它的潜能,在融智体系中能解决现行的语法理论不能解决或解决不好的问题,那对科学的发展就很有意义。看了先生的几次来函和稿件,只看到字的重要性,主张放弃词,以字为本位,但我好象始终没有看到它在解决融智体系的问题的作用。可能这方面涉及很多具体的问题,不是先生的信函所能解决的,这里只是提出来供参考。评判一种理论的优劣,主要是根据简明、解释力、可操作性三个标准,希望先生能在这方面作出新的努力,结合科学的发展和融智体系的目标,实事求是地进行一些评述和阐释。

另外,有一个小问题附带说一下,就是在95日来函的附件中说,由于词的引入,汉语中产生和增加了大量的字组。这一说法不确切。字组的产生和发展是汉语自身自我调整的结果,与词的引入无关。

先生为了照顾我阅读我在您的网上看不到的资料,特地发来的一个很大的附件,很遗憾,据瑞星防毒软件提示,有病毒,我只能删除。我的自然科学水平低,即使打开了附件,也很可能看不懂。这就算了吧。我们以后可以多讨论一些基础理论问题。

    以上意见仅供参考。

                                                     徐通锵

                                                        2001,  911

 

徐先生:

您这次来函明确指出:

我的文章“提出了一些重大的问题”,同时,又认为:我(或我们?)的“目标过大,恐怕难以实现预期的目的。”并且,谦虚地说:“因为我们研究的领域不同,很多东西我不懂,只能供先生参考。”

对此,我的意见是这样:

既然“提出了一些重大的问题”,就不要怕“目标过大”,更加不要怕“难以实现预期的目的”,因为,对探求真理的人们来说,各个人的力量(包括时间、精力或生命)都是非常有限的,但是,绝不能因此而畏惧困难,反而应该有愚公移山的精神。正如您在《语言论》中所说的那样——即使失败也可给后人提供警示。因此,我认为:这里有两个问题(涉及目标与方法两方面)值得进一步探讨,即:

1、您认为我“提出了(哪)一些重大的问题”?为什么您认为它们是“重大的问题”?

2、您说:我的“目标过大”,是否主要针对个人的力量(包括时间、精力或生命)非常有限而言?或者说:您有使目标更加具体化,或您有能够使该目标分解得更加容易实现的具体办法?

接着,您说:

“义、文、物、意概念的提出,我觉得是有价值的,但如何阐述?抓住什么样的核心?需要深入推敲。这四个概念的关系,据我的理解,义应是客观存在的事物的结构机理,或者说是客观规律,其运转规律不以人的主观意志为转移;意是主观对义的认识或理解,文与物只是这种认识外化的表现形式。区分义与意是很必要的,现代语言学也已意识到这种区分的必要,其具体的表现形式就是注重功能的研究。如何将这种区分进行理论上的阐述,还需学界的努力。”

对此,我的意见是这样:

既然“有价值”,就应该尽快向其他有关专家(包括您的学生及助手)和领导说明,以便新思想、新观点、新理论和新方法的推广普及。至于“如何阐述?抓住什么样的核心?需要深入推敲”是指我的理论文章(是《融智学(新范式)》还是该理论的应用文章如:《语言及语义信息的统一参照系—— 给一本中国计算语言学文集的修订稿》)还是您的考虑?

对义、文、物、意这四个概念的关系,您的理解——“义”应是客观存在的事物的结构机理,或者说是客观规律,其运转规律不以人的主观意志为转移;“意”是主观对“义”的认识或理解——是对的,但是,“文”与“物”不只是这种认识外化的表现形式,因为,即使它们不被人们所认识也存在。

区分“义”与“意”是很必要的,但是,这种区分的必要性绝不限于某一个学科领域(包括语言学)。现代语言学可能意识到了这种区分的必要,但是,如果说“其具体的表现形式就是注重功能的研究”,那么,我认为其认识的深度和广度还远远不够。更不用说“将这种区分进行理论上的阐述”了,的确“还需学界的努力”。

值得强调的是,您说:

“先生采纳字本位理论,我自然很高兴。从几次来文看,觉得字在解决融智体系中相关问题的地位和作用,说得不清楚。您曾跟我说过,您看到有关字的文章后,原来思想上一些不清楚的问题,像接通电路一样,一下子就清楚了。我很看重您的这种感觉。如果字在计算机运算中能发挥它的潜能,在融智体系中能解决现行的语法理论不能解决或解决不好的问题,那对科学的发展就很有意义。看了先生的几次来函和稿件,只看到字的重要性,主张放弃词,以字为本位,但我好象始终没有看到它在解决融智体系的问题的作用。可能这方面涉及很多具体的问题,不是先生的信函所能解决的,这里只是提出来供参考。评判一种理论的优劣,主要是根据简明、解释力、可操作性三个标准,希望先生能在这方面作出新的努力,结合科学的发展和融智体系的目标,实事求是地进行一些评述和阐释。”

对此,我的意见是这样:

“字在解决融智体系中相关问题的地位和作用”,主要体现在:

1、汉语的字,位于非线性结构与线性结构之间的基本语言单位,可以使融智学新范式的四个基本概念表达的非常简单、明了;

2、例如,对意与义的区分,特别是对它们与意义或meaning的区分,比采用由字的各种组合而派生的字组和句子更加精练;

3、汉语的字,作为一种表意与表义的自然语言,必然在解决语义信息的问题或“语义泥潭”方面作出特殊的开创性贡献。

我曾跟您说的那种感觉,就像您的名字那样铿锵有力——因为您“有关字的文章”把汉语的精华表达得淋漓尽致。我认为:不仅是汉语理论的“一些不清楚的问题”“一下子就清楚了”,而且还对寻找汉民族在未来发展的目标方向或国际定位方面有所贡献,这正是《融智学(新范式)》及其文化基因工程或协同智能主体的概念体系寻求的语言表达或先期推广的独特优势。

既然您已经看到了我“几次来函和稿件,只看到字的重要性,”那么,为什么不谈一谈字的定义问题呢?别忘了陆俭明教授对此的公开质疑是有一定依据的。何况字的定义的确是您的理论能否立得住的一个重要基础。

有必要指出:现行的语法、语义和语用等旧的学科理论范式,存在根本性和深层次的问题,这在形式化程度较高的语言(如英语)中的隐蔽性比在形式化程度较低的语言(如汉语)中更加明显。现代计算机采用的基因文本元素由ASCⅡ体现得非常充分,因此,后续派生的词、词组或短语、句子、段落、篇章等基因文本组合,都容易为算法及程序加以表达或转述。但是,对汉语而言,在形式化、结构化和程序化方面,不仅没有这种优势,而且,还存在中文信息计算机处理的瓶颈(不采用新范式是不可能从根本上得以突破)。由此可见,对中文信息的计算机处理必须同时找到汉语的自然语言学和计算语言学的理论及实践的突破口。我认为:您的《语言论》主要在自然语言学方面作了大胆而有益的探索,而我的融智学新范式则由于注重人机协同而与现行的自然语言学和计算语言学产生了交叉或部分重叠。

根据您说的“评判一种理论的优劣,主要是根据简明、解释力、可操作性三个标准,”同时,根据易绵竹教授指出的“按照20世纪的学术思想,任何一门科学都是一个知识体系,它需要有基本概念、推理法则和层次结构,凡是不能纳入这个知识系统的知识,就不能称之为科学知识。”我认为:《融智学(新范式)》和《一种知识信息数据处理方法及产品》等在系统科学之窗论文专区www.systemscience.org/lwzq

或融智网http://cn.geocities.com/wisdombankofchina/index.html www.zxhrznet.com  上面发表的一系列文章,基本上公开了符合上述要求的内容,只是在具体的表达形式方面与旧范式的各个学科之间的关系有待进一步详细说明。

最后,您说:“另外,有一个小问题附带说一下,就是在95日来函的附件中说,由于词的引入,汉语中产生和增加了大量的字组。这一说法不确切。字组的产生和发展是汉语自身自我调整的结果,与词的引入无关。”

对此,我的意见是这样:

您的这个观点,我基本上表示同意。应该说:现代汉语中产生和增加了大量的灵活的字组——采用字组的方式不限于古代汉语中的成语、谚语、俗语,如:大量的短语、术语、习语等等。“字组的产生和发展,”的确主要“是汉语自身自我调整的结果”,同时,也“与词的引入”有关,如:与大量的外来词对应的字组的形成或采用。

以上讨论一些基础理论问题,希望多听您的意见!

以上意见仅供参考。

 

                                                   邹晓辉 2001-9-12