字本位与汉语形式化(本章全文超级连接)

(作者:广东珠海 邹晓辉)《字本位理论与应用研究(全书总目录超级连接)》第252-284页

 

《字本位理论与应用研究》

 8.3 字本位与汉语形式化(本章全文超级连接)
    在“字、辞、块、读、句”与“字、二字组、三字组、…、多字组”的结构划分过程中,汉语“字本位”理论,强调:“字”是汉语的“基本结构单位”。其“核心字、两点论、语义句法”给笔者印象极深。 出于“探寻汉语思维特点”的“好奇心”和“寻找改进汉语理论和中文信息处理以及计算机辅助汉语教学的新方法”的“强烈愿望”,笔者采用“字本位”的上述两种“结构划分”细化了“一种知识信息数据处理方法及产品(珠海邹晓辉的发明2000)”的汉语部分。
    本文主要论证“字本位与中文信息处理”方面的探索成果与研究心得,即:在完善“两表”的基础上,用“两表”为“参照系”进一步解析“字与字组的关系” 。
  (本章目录)
8.3.1 “字本位”与“两表”
8.3.1.1“两表”
[1] 字组粗分模型
   图1是文本总量控制模型(GTCM)示意图。
(1) 简述13个分表
(2) “字、辞、块”
(3) 单音节与混音节的区别和联系
   图2是音节总量控制模型(GSCM)示意图。
(4) 字、辞、块与词、词组、短语
[2] 字组细分模型
(1) 字组“细分”形式或模型概述
(2) 仅就汉语语汇而言,GSCM与GTCM的总量相等
(3) 图2的焦点——“(汉)字”与“(英)词”比较
(4) GSCM揭开“微妙关系的神秘面纱”
(5) 区分“字”与“词”的工具
(6) GSCM奠定理论分析和实践处理的基础
8.3.1.2 字与字组的关系——兼谈“字”与“词”的区分
[1] “三化”(由8.3.2,8.3.3,8.3.4三节分别逐一介绍)
[2] “三注”( 由8.3.4节后半部分介绍)
[3] 奠定“语言文字系统工程”的基础
[4] 发现与记录
[5] 区分“字”与“词”的必要性
(1) 汉语的字与字组的关系(涉及字之间“接续”的问题)
(2) 汉语与英语之间的结合(涉及与国际“接轨”的问题)
8.3.1.3 “五个限制”
8.3.2 字的定义形式化
8.3.2.1 借助GTCM凸显:形字
8.3.2.2 借助GSCM凸显:音字
8.3.2.3 “形字”与“音字”的关系

图3是“两表”中“字”的局部的示意图
8.3.2.4 (形式上的)“迭交”原理
图4是“两表”中“字”全局(同时涉及GTCM和GSCM)的示意图。
图5是字的形式化定义及其典型实施例的示意图。
8.3.2.5 语言基本结构单位“字”具有语音及其形态(与文字重叠)的形式特征
8.3.2.6 字与(各级)字组的(形式与内容)关系

8.3.3 字组划分数字化
8.3.3.1 展示汉语语汇的理想化认知模型是由理想模型转化而来的应用模型
图6是字组划分数字化模型的示意图。
[1] 认知科学原理
[2] 逻辑学原理
[3] 数学原理
[4] 计算机科学原理
8.3.4 义项呈现字组化
8.3.4.1 字的义项
[1] 义项的直接呈现
图7是“直接呈现”原理及实例的示意图。
[2] 义项的间接呈现
图8是“间接呈现(标注)”原理及实施例的示意图。
8.3.4.2 组字公式与字组方阵
8.3.5 实例解析
8.3.5.1 实例1:解析一个“字”——对汉语自身的结构分析
[1] 解析“字内信息”
图9是GTCM五个表的一览总表摘要介绍示意图。
图10是形字与音字“迭交”原理及实例的示意图。
[2] 解析“字间信息”
[3] 如何解析“文本义”这个“音字”串?
图11是一语双文示意图。
8.3.5.2 实例2:典型分析
[1] 典型分析1
[2] 典型分析2
[3] 典型分析3
图12是“形、音、实、虚、用”关系的示意图。
[4] 典型分析4
图13是“义项”与“释义字组”的(直接呈现)关系的示意图。
[5] 典型分析5
图14是“字的义项”与“释义字组”及“标注字组”(直接和间接呈现)关系的示意图。
8.3.6 结语
例证1
例证2
例证3

(作者:广东珠海 邹晓辉)《字本位理论与应用研究》(全书总目录)第252-284页