LOGO

      《语文与信息》双月刊  Language and Information

              第2期  1995年11月

          Internet Ver. --- 1 November 95


                 目  录
●专论● #1 论语文现代化及其当前的任务…………………………………………胡瑞昌 ●拼音化研究● #2 关于汉语拼音正词法的几个问题………………………日本 伊井 健一郎 #3 在幼儿园里可否进行汉语拼音教学?…………………………………张 雁 #4 应大力推广词汇化的汉语拼音…………………………………………李步其 ●评论● #5 汉字输入比英文快?……………………………………………………尹斌庸 ●资料● #6 南极星拼音连词输入法的又一新改进…………………………………陆丙甫 #7 面向计算机的语言研究(二)…………………………………………冯志伟 ●书评● #8 评冯志伟教授的两本书…………………………………………美国 梅维恒 ●拼写实验● #9 Daazi Gei Canji Ertong Dailai Xingfu ……………… Maoge #10 谈谈同音单位的定型分化--评 Maoge 的拼写实验………………陆丙甫 ●来往信件● #11 给会员和会友的信 ……………………………………………………吴文超 #12 【语文与信息】存入万维网(WWW)…………………………………倪鸿波 ●消息与动态● #13 ▲“英汉扑克”简介    ▲美国大学图书馆面临挑战    ▲1994年日本销售个人电脑320万台   ▲ 评选:“五笔字型”榜上无名
  ●>> 读者注意: 如要按目录的文章编号(例如 #00 号)找寻该文,      请找寻(search for) #00# 字符即可 (NJSTAR 用 F5 键).
#1# 下一篇 返回目录 ●专论●             论语文现代化及其当前的任务           中国人民大学语言文字研究所 胡瑞昌   什么是中国语文的现代化?语文现代化的研究对象和工作内容有哪些?怎样 实现中国语文的现代化?这些问题,前些年还认识不太清楚和深刻。近年来,经 过各界人士的讨论和研究,已经有了比较清楚的认识,但是并不是所有人的认识 都一致了。   语文运动的老前辈、语文学界的专家周有光教授,对中国语文现代化问题多 次进行过详细、全面而精辟的论述。① 尤其1993年10月在“中国语文现 代化学会成立大会暨第一届学术讨论会”上的主旨发言《信息化时代的中国语文 现代化》最为详细、全面、精辟。②在这里就不赘述了。   什么是语文的现代化?那就是语言和文字为适应现代社会的语言和文字的应 用而实现自身的现代化。这是不言而喻的道理。因为语言是随着社会的产生而产 生的,是随人类社会交际的需要而产生的交际工具;而文字则是为了突破语言交 际时间、空间的限制而产生的记录语言的符号系统。因此语言和文字必然地要依 存于社会,也随着社会的发展而发展。所以语言文字必然地要为社会语言文字的 应用而服务。如果一旦语言文字不能适应社会生活的需要,不能很好地适应它和 为它服务,则必然会被社会生活所淘汰、扬弃。这是不依人们主观意志的客观规 律。诚然语言和文字有其本身的自然属性,即语言和文字本身并不是社会,但语 言和文字是社会现象——有人类社会才有人类的语言和文字,社会以外无所谓语 言和文字。所以语言和文字有其社会属性的一面,而且是本质的一面。语言和文 字有它自身的内部发展规律,但社会对语言文字的发展起着十分重大而深刻的影 响和制约作用。毕竟语言和文字是人类社会交际的工具,所以人类社会的发展对 语言和文字的发展必然产生制约作用的。   那么,什么是现代化社会?我们认为现代化是个历史范畴的概念。不同的社 会发展阶段有不同的现代化内涵。比方说,原始人类社会的渔猎经济社会同转入 畜牧和农业经济的社会显然畜牧业、农业经济的社会比起渔猎经济的社会来说那 是更为先进的社会,也就是相对于渔猎经济的社会来说是现代化的社会了。而初 级阶段的畜牧业和农业经济的社会转入高度发达的农业、畜牧业经济的社会时, 则高度发达的农业、畜牧业经济的社会比起初级阶段的畜牧业、农业经济的社会 来说,高度发达的农业、畜牧业经济的社会是现代化社会了。到了十六七世纪产 业革命的工业社会比起即使是最发达的农业、畜牧业经济的社会来说,工业社会 当然是现代化社会了。而到了即将进入21世纪以高新技术为特点的高度发达的 工业化社会来说,产业革命的工业社会当然是落后了。以高新技术为特点、以第 二次信息革命的信息化为特征的工业化社会、信息化社会当然是现代化的社会了 。每一历史阶段的社会,对语言和文字现代化的要求当然不会相同。   当原始渔猎经济转入畜牧业、农业经济社会时,社会生产力极大的提高,社 会的物质生产有了极大的发展,使社会劳动有了分工。社会财富的积累产生了富 人和穷人,加上战争的掠夺和奴役,产生了阶级和奴隶,使得有可能出现脑力劳 动和体力劳动的分工,加上国家的产生,政治、经济、军事、社会事务的日益繁 忙,创制文字以适应社会的需要就成为十分必要了。于是产生了文字。文字的产 生极大地推动了社会的发展,使人类社会从野蛮社会进入到文明的社会! 这是语言文字发展的一次飞跃。   当产业革命促进工业生产的发展时,社会商品生产高度的发达,要求有全民 的统一市场,于是社会对语言文字的应用,要求有统一的全民共同语。而诸侯割 据的高度发达的封建农业国,为巩固统一的国家,要求有全国统一的文字,如秦 始皇的“书同文”。   而当电力代替蒸汽动力,核能代替电能工业高度发展的工业化社会,对语言 文字应用的要求,就是要求语言和文字要有高度的统一规范和统一标准,以适应 快节奏、高效率、高集约、高智能的机械化、自动化、信息化的语言和文字的处 理。   而今天,面对第二次信息革命的信息化现代社会,对语言和文字的现代化要 求就更高了。它要求语言和文字要有高度精密的规范和标准,以便实现计算机人 工智能化:文字和语音的自动识别。做到自动机器翻译(多语种的对译)和人机 对话(及多语种的对译);资料库、数据库的自动检索等等。   由上述简述中可知,现代化社会的涵义是历史范畴的概念。不同的历史阶段 ,社会的现代化内容是不同的、相对的。而不同的历史阶段,对语言和文字应用 实现自身现代化的要求也是不同的。   那么,中国的现代化社会指的是怎样的一种社会呢?中国的现代化社会指的 是1957年1月13日周恩来总理在第四届全国人民代表大会第一次全体会议上作 的《政府工作报告》中所指出的:在本世纪内实现农业、工业、国防和科学技术 的现代化。也就是今天所说的:具有中国特色的社会主义的四个现代化的社会。   为实现社会主义的四化建设,语言文字如何适应四化建设的需要而实现自身 的现代化呢?我们认为:必须以汉语、汉字的规范化、标准化为中心;以汉语、 汉字的基础研究和应用研究为基础;以扫盲、普及文化教育、汉语汉字信息处理 技术和理论研究与开发为重点。这就是中国语文现代化的当前任务。   为什么要以汉语、汉字的规范化、标准化为中心呢?很明显,社会主义市场 经济的高速发展,使得全国性的政治、经济、文化教育及科学技术、交通运输 ……所有生活领域、生产领域人员的来往和交流空前的活跃和频繁。很难想象, 如果没有全国统一的、规范的、标准化的通用语,怎样协调人们的交际和交流 呢? 社会主义的商品经济要求要有全国统一的商品市场和商品流通,如果没有 全国通行的、规范的、标准的全面共同语,那是不行的。然而时至今日,普通 话还没有在全国范围内普及。无疑会对社会主义统一市场的形成和发展,商品 市场的发展等等产生消极的影响。这对于四化建设当然是十分不利的。如果再 考虑到对文化教育、国防建设等方面的影响,普通话的普及是何等紧迫的任务!   中华人民共和国成立以后,党和政府对于汉字的规范化、标准化工作十分重 视,先后公布了常用字表、通用字表、异体字整理表、简化字总表、信息交换用 汉字编码字符集·基本集等等,使得汉字的规范化、标准化工作取得了很大的成 绩,对四化建设作出了很大的贡献。可是近年来,社会用字十分混乱:滥用繁体 字、乱造简化字、写错别字的情况比较严重。如果任其泛滥,必然会损害文字应 用的交际效能。   汉语、汉字的规范化、标准化对于语言和文字的计算机处理的重要性更是十 分明显。如果没有规范的、标准的全民共同语,人机对话就谈不上。虽然方言和 普通话的对译从方法和技术上来说是能办到的,但这种对译不能全国通行,只局 限于方言区,从社会效益和人力物力的浪费来说是得不偿失的。由于目前计算机 汉字输入编码几百种上千种,已经浪费了无法计算的人力物力!这也是严重阻碍 计算机普及的一个重要原因! 如果全国只一种通行的文字输入计算机的输入系 统,人们就可以不必耗费无数的人力物力去设计五花八门的编码,而把人力物力 投入到软件的研制中,使计算机具有更多的功能,价格更低廉些。何愁计算机不 普及! 对智力的开发和人才的培养将作出何等巨大的贡献!   由此可知,没有汉语、汉字的规范化、标准化,政治的、经济的、国防的、 文化教育的、科学技术的、计算机信息处理……等等,等等,将受到何等严重的 影响!   为什么中国语文的现代化要以汉语、汉字的基础研究和应用研究为基础呢? 任何事物都有其内在的客观规律,不进行汉语、汉字的基础研究和应用研究, 我们的工作和实践就会是盲目的,就会失败,或者事倍功半。比如诸多的形码方 案,有哪一种方案对汉字的历史发展、汉字的字形结构作过深入、全面、系统的 研究过?可以肯定地说:没有!没有进行过文字的基础研究就想设计出完善的字 形编码方案,这岂不是枉费心机?所以无论哪一种字形编码方案都漏洞百出,修 修补补的结果,有许多的“规则”不但不符合汉字本身的结构规律,甚至违反了 汉字自身的结构系统!音码方案也同样存在问题。同音词的问题没有解决之前, 就无法避免同音重码的问题。原因就是没有对汉语的言语动态情况作深入、全 面、系统的研究,因此陷入困境。实际上音码比形码更有前途,但目前形码似乎 比音码占上风。由此可见一斑。任何中国语文的现代化,必须建立在对汉语、汉 字的基础研究和应用研究的基础之上,否则就会是盲目的,不可能科学地解决问 题。   为什么要以扫盲、普及文化教育、汉语汉字信息处理技术和理论研究与开发 为重点呢?据最新统计中国有一亿多人口为文盲半文盲。这比第一次人口普查两 亿多人口为文盲半文盲减少了许多。语言文字要为实现四化服务,要适应四化建 设的需要,那么首先的任务就是要为扫除文盲服务。否则侈谈语文现代化,岂不 是背离了语言文字工作的最起码的宗旨?语言文字想要发展,想要实现现代化, 首先必须为广大的人民群众服务,否则脱离广大人民群众的语言文字应用需要的 现代化,还有什么意义可言?其次要为普及文化教育服务。要实现四个现代化, 没有有文化素养的劳动者和技术人员那是不可能实现的。如果使全国的人口10 0%具有中等文化水平以上,加以其中人口的70%以上具有中等专业技术的劳 动者和技术人员,人口的30%-50%以上具有大专以上文化水平,30%或 更多的人口具有高级文化水平(包括专家、科学家等),那么中国的四个现代化 是指日可待的了!而目前普及文化教育是工作的重点。语文现代化的当前重点之 一,就是要为扫盲、普及文化教育服务。   其次,目前西方发达国家提出建设“信息高速公路”和“实现全球信息网络 的联网”。这对于我们来说是一种挑战。由此,在语文界、语言文字信息处理界 产生一种错觉,以为语文现代化就是实现“语文信息化”,而且是压倒一切的头 等任务。这是不正确的。也是不切实际和不现实的。   首先应当肯定,中国的语文现代化要适应信息革命的挑战,要把汉语、汉字 适应计算机信息处理技术的理论研究和应用开发列为重点。这是不容置疑的。但 这只是实现中国语文自身现代化重点任务之一,而不是全部,更不是压倒一切的 头等任务。就目前中国经济的发展水平而言,计算机还无法普及到每个家庭,I BM486个人电脑,在美国本土的售价为一千美元,中关村康柏(COMPAQ) 386个人电脑售价七千元左右。如果还加上其他附件和软件、电源等等,使用 一台个人电脑(不是打印机),大约一万至一万多元人民币。一般的工薪阶层年 均收入,按国家统计局公布的数字为四千多元,农村约为两千多元。根本无法支 付这笔巨额的开支。其次,电脑的应用毕竟是高层次的文化用品,连九年义务教 育都尚未普及的情况下,侈谈普及家庭电脑,岂不是离现实生活太远?即使普及 了九年义务教育,但并不等于普及了电脑应用的知识!最后,目前中文电脑,即 使最出名的几种个人电脑,其编码系统也不是通用的!如果一种电脑兼收并蓄把 几种编码方案都兼容进去了,那么使用时也只能选一种方案,如不然,则要多学 几种。那时候,靠死记的编码必然容易遗忘,用来用去也只记得一种而已。电脑 不能普及除了经济原因之外,编码方案与日常使用的文字分离造成操作上的困难 是很重要的原因。可见,即使建设了“信息高速公路”,能“上路”的人又有多 少呢?(何况几百种、上千种的编码方案是“高速公路”上的绊脚石和暗礁,不 把绊脚石和暗礁搬掉,公路无法开通!)   不过,研究和开发汉语、汉字的信息处理技术和进行有关的理论研究仍然是 中国语文为适应信息化时代所必须作为重点来进行的工作。汉语汉字的信息处理 比西方发达国家起步要晚,加上方块字比西方拼音文字存在先天的缺点——效率 和成本都比拼音文字要差。(这点计算机技术界是有共识的。)所以更要未雨绸 缪,迎头赶上。我们呼吁:由国家有关部门进行协调,集中人力物力,进行研制 一种规范的、标准的“电脑拼音文字”以代替目前所有的形码、音码方案,作为 国家的统一标准。这一时机已经成熟。 注释: ①周有光《谈语文现代化》,《语文建设》1993年10月;《中国的语文      现代化》,《语文建设通讯》(香港)1994年9月,45期。     ②周有光《信息时代的中国语文现代化》,《普通话》(香港)1994年2月。
#2# 下一篇 返回目录 ●拼音化研究●                    关于汉语拼音正词法的几个问题              日本 伊井健一郎   1988年 7月,中国国家教委和国家语委联合公布了《汉语拼音正词法基本规 则》。这个“基本规则”是在84年发表的“试用稿”研究和修订的基础上公布的 正式文件。因此,我认为它应是我们书写汉语拼音时应当遵守的基本准则。然 而,近年来我见到的一些中国语课本、中国杂志以及中国社会上一些商品包装说 明上的汉语拼音却存在着极其混乱不规范的现象。   另外,我在拼写中国语中级讲读课本《别了,濑户内海!》和80年将《新华 字典》改编为汉语拼音版时也遇到了不少问题和难点。在这里把我遇到和想到的 几个问题提出来,就教于大家。同时在最后一部分对“基本规则”中的某些部分 作一简单介绍,以便各位作为参考资料。   1.书写不规范,错误百出。   (a) WENHWA YWE KAN (文化月刊)     RE DIAN TO SHI (热点透视)     TAIGANGAOSHENG (台港澳声)     FUJIAN ANXI ZHENPIN TIEGUANGYIN (福建安溪铁观音)   这些是曾经刊登在《文化月刊》杂志上的汉语拼音和商品名。这个杂志是由 《群众文化》改名而来的。首先它把《文化月刊》杂志名拼写成“WENHWA YWE KAN”,就十分令人费解。无论在拼写上,还是在词分写上都很不规范。《文化 月刊》应写成“WENHUA YUEKAN”。其中专栏题目“热点透视”应连写成“ REDIAN TOUSHI”。“台港澳声”的汉语拼音,中间应加短横,写成“TAI-GAN G-AO SHENG”。   “文化月刊、热点透视”的拼音,现在拼写对了。可是“简讯”,为什么是 “JIE XIUN”呢?主办单位是文化部社会文化司,绝不应该有这样基础知识的错 误。(《文化月刊》总第25期,1995.1 P.64)   “铁观音”应写成“TIEGUANYIN”。   (b) RENSHENFENGWANGJIANG (人参蜂王浆)     HONGQIZHIYAOCHANG(红旗制药厂)   将这些词拼写时,都要分写,如:Renshen Fengwangjiang, Hongqi Zhiyaochang。   (c) JI NAI YUAN (挤奶员)     SHI ZI WU (狮子舞)   1993年8月内蒙古少年友好艺术团到日本演出,在其节目单上,将“挤奶 员”“狮子舞”写成如上所示。这些都是一个词,所以应该连写为“Jinaiyuan” “Shiziwu”。   (d) KWEICHOW MOUTAI (贵州茅台)   “基本规则”规定“非汉语人名、地名本着‘名从主人’的原则,按照该文 字的罗马字母转写法拼写。不过,“贵州”“茅台”不是非汉语的地名,这也是 很不规范的。中国的人名、地名应该用汉语拼音书写,所以“贵州茅台”应写成 “Guizhou Maotai”。   GUANGMING DAILY (光明日报)   《光明日报》刊头的汉语拼音,最近由“GUANGMING RIBAO”改变成了 “GUANGMING DAILY”。不知为什么“日报”部分变成了英语?   我查《中文书刊名称汉语拼音拼写法》,“中国青年”是“Zhongguo Qing nian”“人民日报”是“Renmin Ribao”。这是一个很好的范例。   (e)凯丽(kelly)、乔伊(Joy)     蒙勃朗(MontBlanc)、赫尔梅斯(Hermes)、维顿(Vuitton )   这些词是在《国际商报》INTERNATIONAL BUSINESS(1993.3.7)上 的“名牌逸闻”栏里登载的专名。   非汉语人名、地名本着“名从主人”的原则,按照罗马字母“拉丁字母” 原文书写。可以在原文后面注上汉字或汉字的拼音。(“基本规则”1.5 )落 实“名从主人”的原则是日中两国专家要共同研究的题目。东京→Tokyo、 神户→Kobe、芥川→Akutagawa。相反,日本方面也按照汉语拼音的发音来拼 写中国的人名、地名。   北京 Pekin→Beijing、厦门 Amoi→Xiamen、蔡元培 SaiGenbai→Cai Yuanpei。   2.“基本规则”和“试用稿”的比较(省略)   3.汉语拼音和英语读法的问题(省略)   4.实际问题令人棘手   我们在日本教授汉语和编写教材时,常常要考虑词的分写、连写问题。也有 名词和方位词、动词和补语的写法,成语、少数民族和外国的专名的写法等。 “声调一律标原调,不标变调”这条规则合不合于实际运用?还有不少未解决的、 不能令人满意的问题。   我最近看到NHK出版的“广播中国语讲座”“电视中国语会话”、北京广播电 台编的“大家的中国语会话”以及北京大学、北京语言学院等出版的汉语课本, 拼写很不统一。   《语文建设》(1992年12期)的一篇文章说,一定要消灭拼写不规范的现象。 任何部门或单位没有权限决定在应该使用汉语拼音的场合使用或推行其它的拼音方 案。《人民日报》(1992年12月19日)也在纠正语言文字应用时的混乱现象的文章 中号召继续推行汉语拼音方案,借以扩大拼音方案的使用范围。   为了响应这些号召,在中国出现了一个实践“文字质量万里行”的人物。这就 是李延良万里找错字,介绍他的事迹的文章刊登在《光明日报》(1993年6月4日) 上。他为了寻找出社会上的错别字而于93年 4月中旬从常州市出发骑车奔向北京。 他沿途发现路标、商店的招牌、广告和报刊上的错别字,并讲解宣传文字规范化的 意义。他在91年和92年就曾经作过这样事,人们称他为“现代的‘愚公’!”。   编者按:伊井健一郎,日本姬路独协大学学者,1994年3月31日至1995年3月 29日在北京大学中文系进修。这篇文章是根据1993年6月19日在日本大阪市召开 的“日本ビジネス中国语学会”年会上所作的报告之一部分。
#3# 下一篇 返回目录          在幼儿园里可否进行汉语拼音教学?             哈铁老战士协会 张雁   1989年9月11日,国家教委第四号令,发布《幼儿园管理条例》,共 有32条。其中第15条说:“幼儿园应当使用全国通用的普通话”。第16条 说:“幼儿园可以根据本园的实际,安排和选择教育内容与方法”。凭这两条, 我认为在幼儿园里就可以进行汉语拼音教学,因为:   1.汉语拼音是全国通用的教学普通话最有力的工具;   2.在幼儿园里安排初级的汉语拼音教学很简便,孩子们都能接受,可为将来 上小学奠定一个良好的基础,能与小学的语文教学相衔接。   当然,在幼儿园里进行汉语拼音教学应与小学有区别,首先是教材,不能用 小学的《语文》课本,应该根据幼儿园的特点,另编简易的教材。其次是教学方 法,不能只限于在课堂呆板的教与学,应该采取灵活多样的游戏方式,做到趣味 化,寓教于乐。为此,在幼儿园里要进行汉语拼音教学, 必须具备以下三个条 件:   1.要有能承担这个课程的优秀教师;   2.要有适用的教材和教具;   3.要有幼儿园的领导人(包括上级)和家长们的积极支持。   这些条件从哪里来?从天上是掉不下来的,就得由教育行政领导部门创设。 首先应该狠抓幼儿师范教育,把汉语拼音列入正式课程,成为幼儿师范的必修课 。其次,应该与出版部门合作,组织人力编写出版彩色的图文并茂的汉语拼音课 本。教具可由教师动手制作,比较好办。对幼儿园的领导人和家长们如何支持的 问题,就得大力做好宣传工作,要恳切地说明:在幼儿园里进行汉语拼音教学, 是为了提高中华民族的文化水平,以适应我国现代化建设的需要,必须从娃娃抓 起的一件具有战略意义的大事,不要等闲视之。   社会上有许多人对幼儿园进行汉语拼音教学这个问题很不理解,总认为这是 一种超前行为。他们盲目议论,口口声声说:幼儿园的孩子们年岁小,学不了汉 语拼音,要他们写拉丁字母,那太困难了!还有的人说:幼儿园的孩子们学了汉 语拼音,上小学还得学,他们就不感兴趣,不愿再学了等等。总而言之,他们不 赞成在幼儿园里进行汉语拼音教学。   我认为这些议论和说法,都是不对的,完全是一种主观臆断,不符合实际的 。那末应该怎样对待才对呢?请看下面的事例。   1985年7月10日,哈尔滨市南马路幼儿园,为了加强改革幼儿教育, 准备进行汉语拼音教学的实验,特聘我为顾问,经过三年,完成了实验的计划。 在结业典礼的大会上,被黑龙江省关心下一代协会送给的条幅称赞为:“实验汉 语拼音教学的典范”。大会还宣读了国家语委和黑龙江省语委热情洋溢的贺信。   两位优秀的教师李立春和黄新民,在上级领导和家长的大力支持下,认真负 责,各从一个小班教起,一直跟到大班,贯彻以游戏的方式,利用各种各样的教 具,按部就班地进行教学,掌握了一套最佳的教学方法,最后总结出三条完整的 好经验,情况如下:   小班,认读正楷大写的26个基本字母,唱会一个字母歌,从而掌握了基本 字母的顺序。   中班,认读正楷小写的26个基本字母,并从描红到临摹,写会了大写和小 写两种字母的字体。   大班,根据我编写的《初级汉语拼音课本》,用直呼法,进行88个基本音 节的教学(声母与单韵母拼成的音节和整体认读的音节),并按课文进行常用的 复音词儿和短语的教学。此外,还教会打旗语、作记录的技能。孩子们很感兴趣 ,认真学习,取得了非常好的成绩。   1987年,哈尔滨市南马路幼儿园教学汉语拼音的两个班结业之后,孩子 们都上小学了。他们在小学里情况怎样?据我调查了解,大家对再学汉语拼音的 事,依然很感兴趣,没有发生厌倦的情绪。不仅如此,他们对于深入学习新的字 母和音节觉得很方便,记得扎实,而且在作业中都能正确地写和使用,因此,进 步特快。其中原先在幼儿园是优秀的12名同学尤为显著,他们保持了优秀的成 绩。这对李立春和黄新民两位优秀的教师来说,那是莫大的安慰!
#4# 下一篇 返回目录      应大力推广词汇化的汉语拼音——有感于一小学生的几句话               南京大学 李步其   一天,到朋友家作客。朋友的一个上小学一年级的孩子做完语文作业之后, 拿着课本,翻到最后几页,有点自豪地对我说:“叔叔,后面的课文我们还没有 学,好多字不认识,可是我会朗读。你信不信?”我瞧着他那天真无邪的样子, 还未作出回答,他已大声读了起来,相当流利。我正在纳闷,这小家伙已把小嘴 巴靠近我的耳边,低低地说:“叔叔,告诉你个秘密,千万不要告诉别人,我学 会了拼音。刚才,我是看着拼音读的。我还用拼音给同学写过信呢!”   是的,看着拼音就能朗读,运用拼音还能写作,这是一个小学一年级学生就 能做到的。可见,学会拼音对说、写多么重要。它越来越引起人们的高度重视。   先追溯一下历史。只要略有一点知识的人就都知道,语言先于文字。自从有 了人类,就有了语言,它主要以语音的形式来传递信息,交流思想感情的。当然 ,人们还要借助手势、表情、姿态、图画、实物等辅助性的非语言的手段来完成 交际。而文字是在人类的文化发展到一定阶段的时候才出现的,是建立在语言基 础之上的一种最重要的辅助性交际工具。自从有了文字,人类社会也就有了用文 字记载的历史,知识、技术和经验得以系统地流传下来,传播开去,促进了社会 文明的发展。但是,汉字数量众多,如《中华大字典》(1915年)收入汉字 44908个,《汉字大字典》(1980年)收入汉字60000个,即使常 用汉字,也有3755个;笔划结构繁杂,如“ ”、“ ”等字,它们有二十 五画之多;字音和字形脱离,如“牍”字,准确的读音是“dú”而有些人却往 往容易按照形声字的特点将其读为“mài”,现实生活中的类似现象屡见不 鲜。正是由于以上这几方面的原因,导致了汉字在学习速度、应用效率、沟通中 西方文化、便于记录语言等方面不如只用为数有限的拉丁字母有规律地排列组合 而构成的拼音文字。   再说,自古至今,不识汉字的人,却因语音不同而不能很好地进行交际。很 显然,语音的同一性在交际过程中起着非常重要的作用。因而,为了我国社会主 义革命和社会主义建设的需要,为了国家统一和人民团结的需要,人人都应学好 拼音,力争说一口流利的普通话。   目前,随着社会的进步,语音处理和声控技术的发展,在原来使用文字的场 合,人们越来越多地使用语言来代替。吕叔湘先生曾经说过:“现代各种事业没 有一样不要讲效率,处处要快,要能机械化。在这种社会里,自然用拼音文字写 语体文最合适。”因为汉字不适合现代化的传声技术和文字处理技术,远远不能 满足世界信息现代化发展的要求。   既然拼音文字向信息现代化的生活中,有它的优越性,有它的独特的价值, 因此,我们应大力提倡在一切可行的环境里,特别是在小学教学、扫盲工作、计 算机输入汉字和文献检索等方面,使用词汇化的汉语拼音,更好地推广普通话, 普及提高社会文化教育,促进世界文化交流!
#5# 下一篇 返回目录 ●评论●              汉字输入比英文快?                 尹斌庸   汉字输入电脑的问题还没有很好解决的时候,有一些人就在那里吹嘘起来: “汉字不但能够输入电脑,而且速度比英文快。”消息不胫而走,一些报刊竞相 刊载,并以此作为“汉字优越”的论据。用一句六、七十年代常见的话来说“蒙 蔽一些不明真相的群众”来形容,真是再恰当不过了。   文字符号的输入可以分为两种类型。第一种叫做“全符输入”,即文字的字 符一个不漏的全部输入。英文以及其它拼音文字几乎都是采用这个方法。例如: climb(攀),输入时按c,l,i,m,b逐个字母输入就行了。只要懂得这种文字, 而且熟悉键盘指法,不必花钱花时间去“培训”,人人一说就会。   另一种叫做“略符输入”,即只输入文字字符的一部分,用部分来代表全体 。汉字编码的所有方案,都带有这种“略符输入”的性质。例如李金铠先生的“ 笔形编码法”,“磨”字只用了广(413)、木(734)、石(130),省去了一个“木”, 而代码4137341又在尾巴上省去了30两个数字。王永民先生的“五笔字型编码法”, “攀”字只用了木(S)、(Q)、(Q)、手(R),省去了木、大两个部件。如果汉 字也像英文那样采用“全符输入”,“磨”字应该是点、横、撇、横、竖、撇、 点、横、竖、撇、点、横、撇、竖、折、横,比英文的grind(磨)5个字母,哪 个快呢?   用自己的“略符输入”去和别人的“全符输入”比快慢,这有什么意义呢? 好比甲乙两个人比轻重,甲说:“我的一条腿比你整个身体要轻得多,我比赢了 。”这不是笑话吗?用这种近乎荒谬的比较,得出汉字比拼音文字“优越”,这 不是更大的笑话吗?   英文能不能搞“略符输入”呢?当然能,而且可能比汉字编码还要简单。比 如,grind(磨)略成grnd,climb(攀)略成clmb,等等。这样一来,英文输入 的速度可以大大加快,但是却要记住很多规则(比如区分重码的规则等)。据我 所知,直到今天,几乎没有一个使用英文的人去设计这种“英文编码”方案,而 都是老老实实地一个字母、一个字母地“全符输入”。难道他们不知道求快?难 道他们个个都是大傻瓜?(据说,英文也有速记方案,但除了极少数速记人员外, 一般人都不愿意学。)   我国的汉字编码即使是比英文输入快(这一点尚未有严格的证明材料,只凭 几次“比赛”是不能下结论的),也是我们付出了重大代价或重大牺牲换来的。 首先,全国有多少人,花多少时间、精力在搞这种编码方案呢?据前几年钱伟长 等先生颇为自豪地说,我国编码队伍有几十万人之多。第二,搞出几百上千种编 码方案来,各人要去宣传、推销、申请专利等等。遇到矛盾,产生利害冲突,又 要争论、吵架,甚至打官司上法庭。这又要花费多少时间、精力和金钱呢?第三 ,也是最要命的一点,全国上亿的人(特别是我们的中小学生)如果都来学习这 种死记硬背的编码方案,每个人花一个月,算一算要花掉多少时间?(比如“五 笔字型”,宣传者说几个小时即可学会,但实际上很多人学了一个月还不会用, 骗人而已。)再进一步,如果子孙后代都学下去,中国人永远要白白浪费这么多 时间、精力和金钱。真是可怕呀!   这样比较下来,到底谁是傻瓜呢?
#6# 下一篇 返回目录 ●资料●             南极星拼音连词输入法的又一新改进                           --同音词的连续替换--                        陆丙甫Lu Bingfu bingfu@usc.edu   谢天蔚在“南极星拼音连词输入法的一个大飞跃”介绍了南极星 3.0新版本 连拼输入法:输入时眼睛不需要看最下面的一行。键入汉语拼音时,字母就出现 在所写的那一行,一个词写完后,按一下 space bar字母就立即转换成汉字。当 有同音字出现的时候,就出现在最下面一行供选择。这一改进使南极星的输入速 度从每分钟32 个左右字提高到52 个字左右。   最近,南极星作者倪鸿波先生又对该软件的输入法作了一个很有意义的改 进,这就是“同音词的连续替换”。   原来的输入法中,如果有同义词,就会出现在底行供选择(可用空格键选下 一个同音词或用数字键选后面的同音词),一经选择后选择状态就自动消失。新 的改进是在用空格键换了词后继续保持选择状态,容许挨次不断替换下去。   例如输入 shiji,按空格键后屏幕上就出现“时机”,同时在底行出现 了供选择的一行同音词:           _实际 1 事迹 2 世纪 3 史记 4 试剂 如果“时机”不是你所需要的,你可以直接根据每个同义词前的数字按数字键 选择替换。也可以直接按一下空格键,“时机”就自动转换成下一个候选词 “实际”,此时“实际”从底行中消去,底行成为:           _事迹 1 世纪 2 史记 3 试剂 如果还不是,再按一下空格键,“实际”就自动换成“事迹”,底行缩短成:             _世纪 1 史记 2 试剂 如此下去,一直到所有同音词都选过消失为止。这就是说,“待选状态”并不因 为替换过一次就马上消失,而是继续保留在那里,直到你输入新的字母,待选状 态才自动消失。   这样的好处是,在同音词数量不多的情况下,不用看底行,只要“盲目地” 不断按空格键替换下去,很快就会出现你需要的同音词。在通常的情况下,特别 是选择同音词组时,由於同音词组数量不多,一般不需要用眼睛选择。根据本人 的经验,绝大多数需要重新选择的情况下,只要按一下空格键,替换上来的词都 是正确的。少数仍然不对的情况下,在敲一下空格键,命中率也是相当高的。例 如打 shijian, 屏幕上出现“时间”,底行出现“_实践 1 事件”,按一下空格 键“时间”替换成“实践”,你发觉不对,再按一下空格键,“实践”就替换成 “事件”。   汉语中 zhi, shi, ji, xi 的使用率非常高,因此由这些音节组成的同义词 就比较多,这种情况下,只要加上声调就可以大大缩小选择范围,如 shi2ji4, 就只会出现“实际”。如果还发生同音词,再按空格键的命中率也相当高。   这个方法也适用於同音字。当然同音字往往数量很多,有时要按许多次空格 键才能得到所需要的字,还不如直接根据顺序数字选。但如果是高频率的字,则 也很容易按空格键迅速地得到。如打 zai 后得到“在”,同音字有 “_再 1 载 2 栽 3 灾 4 仔 5 宰 6 哉 7 崽 8 甾”。 除“再”外,其他都不 是常用的,所以用“再”的情况下按一个空格键也就能得到。由於同义字是按频 率排列的,同义词也是按照第一个字的频率排列的,总的说来,按空格键“挨次 换下去”的效率是很高的。这个,只有通过实际的使用才能有体会。   我觉得使用了“连续替换”后的速度有了明显的提高,但还没有作具体的统 计比较。   新版本的南极星还有其他一些改进,如原来的输入法隔音符号的使用率很 高。按照汉语拼音惯例不需要隔音符号的地方,在原来的输入法中都需要用上隔 音符号,如:“公安gongan、才能caineng、多年duonian、不能buneng、海南岛 hainandao、头脑tounao”,必须打cai'neng、duo'nian、bu'neng、hai'nandao、 tou'nao 才行。而现在不用加进这些隔音符号也能正确得到那些词。        从纯中文输入转入输入英文时要按alt-F9、altF-6 两次,推出英文状态也要 按两次。现在按一下 alt-F6 就可以进入英文状态,再按一下 alt-F6, 又退出英 文输入状态而回到汉字输入状态。由於这个转换是经常要用的,这一改进也提高 了不少效率。   南极星发展到这个地步,已经是接近本人多年来理想中的中文软件输入法了 。这种输入法效率已经接近拼音文字的输入。如刚才讲的“南极星……拼音文字 的输入”这段话,我只要击“nanjixing fazhandao zhege dibu,yijing shi j iejin benren duonian lai lixiang zhong d zhongwen ruanjian l.zhezhong shurufa d xiaoluu yijing jiejin pinyin wenzi d shuru.”。完全不用声调, 利用适当的分词连写法就可以自动都正确转成汉字。事实上,“南极星”只要打 njx 也能正确出来汉字,因为词典中已经有这个词。凡是词典中收进去的三音节 词,绝大多数只要打出声母就可以了。极偶然出现同音三音节词,按一下空格键 就可以了。四音节的成语只要输入词典,击打出三个或四个声母也都可以正确出 字。   严重阻碍中文输入速度的问题,现在在南极星中都已经基本克服了。剩下的 问题是锦上添花的事情。读者可以通过改进、修改自己的词典(南极星增添新词 和去掉旧词均非常方便)和编写缩写词典等方法不断提高输入速度。例如,我一 度觉得同音词不是出现在底行,而是出现在光标的下一行,是非常重要的,因为 这样输入者的眼睛就不必上下大幅度移动。但其实这一点可以通过下移屏幕(光 标)把正在输入的地方移到靠近底行来解决。   如果说还有比较重要的有待改进的地方,我觉得就是增加一些文字处理的智 能,使软件能够自动识别一些“变形”的词。   拼音输入的好处,除了不用特地学习之外(因为掌握正确的标准发音,本来 就是现代社会的基础教育内容之一),就是对思维干扰最小。而要使这种干扰减 少到最小程度,就必须使输入的节奏方式和口语节奏方式尽量一致。例如口语中 “听得见、听不见,看得透、看不透”各自是一个节奏单位,写起来也应该按 tingdejian, tingbujian, kandetou, kanbutou 这样的自然节奏,而不是 tin g de jian, ting bu jian, kan de tou, kan bu tou 这样七零八碎的划分节奏 。这样的话,“听得见、听不见,看得透、看不透”和“听见,看透”一样,都 各自算一个词。但这些“变形词”也算作词的话,词典的收词量就太大了。如果 把这样的程序编进软件,使软件看到 tingbujian, tingdejian 就自动识别出其 “原形”tingjian, 并且知道插入的“变形成分”是“不、得”。这样的话,可 以大大提高输入效率而不必大幅度增加词典容量。这样的软件也可以说是具有了 较强的智能。希望这一点也能在不久的将来得到实现!
#7# 下一篇 返回目录             面向计算机的语言研究(二)                 国家语委 冯志伟   (2)复苏期(1970-1976年):   在这个复苏期,研究者们普遍认识到,原语和译语两种语言的差异,不仅只 表现在词汇的不同上,而且,还表现在句法结构的不同上,为了得到可读性强的 译文,必须在自动句法分析上多下功夫。   早在1957年,美国学者英格维(V.Yingve)在《句法翻译的框架》 (Framework for syntactic translation)一文中就指出,一个好的机器翻译系 统,应该分别地对原语和译语都作出恰如其分的描写,这样的描写应该互不影响, 相对独立。英格维主张,机器翻译可以分为三个阶段来进行。   第一阶段:用代码化的结构标志来表示原语文句的结构;   第二阶段:把原语的结构标志转换为译语的结构标志;   第三阶段:构成译语的输出文句。   第一阶段只涉及原语,不受译语的影响,第三阶段只涉及译语,不受原语的 影响,只是在第二阶段才涉及到原语和译语二者。在第一阶段,除了作原语的词 法分析之外,还要进行原语的句法分析,才能把原语文句的结构表示为代码化的 结构标志。在第二阶段,除了进行原语和译语的词汇转换之外,还要进行原语和 译语的结构转换,才能把原语的结构标志变成译语的结构标志。在第三阶段,除 了作译语的词法生成之外,还要作译语的句法生成,才能正确地输出译文的文句 。   英格维的这些主张,在这个时期广为传播,并被机器翻译系统的开发人员普 遍接受,因此,这个时期的机器翻译系统几乎都把句法分析放在第一位,并且在 句法分析方面取得了很大的成绩。   这个时期机器翻译的另一个特点是语法(grammar)与算法(algorithm)分 开。   早在1957年,英格维就提出了把语法与“机制”(mechanism)分开的思 想。英格维所说的“机制”,实质上就是算法。所谓语法与算法分开,就是要把 语言分析和程序设计分开,程序设计工作者提出规则描述的方法,而语言学工作 者使用这种方法来描述语言的规则。语法和算法分开,是机器翻译技术的一大进 步,它非常有利于程序设计工作者与语言工作者的分工合作。   这个复苏期的机器翻译系统的典型代表是法国格勒诺布理科医科大学自动翻 译中心的机器翻译系统。这个自动翻译中心的主任沃古瓦(B.Vouquois)教授明 确地提出,一个完整的机器翻译过程可以分为如下六个步骤:   (1)原语词法分析,(2)原语句法分析,(3)原语译语词汇转换,(4)原语译语 结构转换,(5)译语句法生成,(6)译语词法生成。   其中,第一、第二步只与原语有关,第五、第六步只与译语有关,只有第三 、第四步牵涉到原语和译语二者。这就是机器翻译中的“独立分析-独立生成- 相关转换”的方法。他们用这种研制的俄法机器翻译系统,已经接近实用水平。   他们还根据语法与算法分开的思想,设计了一套机器翻译软件ARIANE-78,这 个软件分为ATEF,ROBRA,TRANSF和SYGMOR 四个部分。语言工作者可以利用这个 软件来描述自然语言的各种规则。其中,ATEF是一个非确定性的有限状态转换器, 用于原语词法分析,它的程序接收原语文句作为输入,并提供出该文句中每个词 的形态解释作为输出;ROBRA是一个树型转换器,它的程序接收词法分析的结果 作为输入,借助语法规则对此进行运算,输出能表示文句结构的树形图;ROBRA 还可以按同样的方式实现结构转换和句法生成;TRANSF可借助与双语词典实现词 汇转换;SYGMOR是一个确定性的树-链转换器,它接收译语句法生成的结果作为 输入,并以字符链的形式提供出 译文。   通过大量的科学实验的实践,机器翻译的研究者们认识到,机器翻译中必须 保持原语和译语在语义上的一致,一个好的机器翻译系统应该把原语的语义准确 无误地在译语中表现出来。这样,语义分析在机器翻译中越来越受到重视。   美国斯坦福大学威尔克斯(Y.A. Wilks)提出了“优选语义学” (Preference Semantics),并在此基础上设计了英法机器翻译系统,这个系统 特别强调在原语和译语生成阶段,都要把语义问题放在第一位,英语的输入文句 首先被转换成某种一般化的通用的语义表示,然后再由这种语义表示生成法语译 文输出。由于这个系统的语义表示方法比较细致,能够解决仅用句法分析方法难 于解决的歧义、代词所指等困难问题,译文质量较高。   (3)繁荣期(1976-现在):   繁荣期的最重要的特点,是机器翻译研究走向了实用化,出现了一大批实用 化的机器翻译系统,机器翻译产品开始进入市场,变成了商品,由机器翻译系统 的实用化引起了机器翻译系统的商品化。   机器翻译的繁荣期是以1976年加拿大蒙特利尔大学与加拿大联邦政府翻 译局联合开发的实用性机器翻译系统TAUM-METEO正式提供天气预报服务为标志 的。这个机器翻译系统投入实用之后,每小时可以翻译6万-30万个词,每天 可以翻译1500-2000篇天气预报的资料,并能够通过电视、报纸立即公 布。TAUM-METEO系统是机器翻译发展史上一个里程碑,它标志着机器翻译由复 苏走向了繁荣。   日本富士通公司开发的ATLAS-I(Automatic Translation System-I)系统 是一个建立在大型计算机上的英日机器翻译系统,该系统以句法分析为中心,可 进行科学技术文章的翻译,在FACOM M380计算机上,每小时可翻译60000词。   日本富士通公司开发的ATLAS-II机器翻译系统也建立在大型计算 机上,但其翻译方式与ATLAS-I不同。ATLAS-I以句法分析为 中心,而ATLAS-II则以语义分析为中心。该系统目前用于日英机器翻 译。   此外,日本的实用化机器翻译系统还有:日立公司开发的HICATS(Hit achi Computer Aided Translation System)英日、日英机器翻译系统,日本电 气公司开发的PIVOT英日、日英机器翻译系统,三菱电机公司开发的MELTRAN日英 机器翻译系统,冲电气公司开发的PENSEE日英机器翻译系统,理光公司开发的RMT 英日机器翻译系统,三洋电气公司开发的SWP-7800日英机器翻译系统,东芝公司 开发的TAURAS英日机器翻译系统,日本布拉维斯公司(BRAVICE INTERNATIONAL) 研制的BRAVICE PAK 11/73日英机器翻译系统等。   欧美除TAUM-METEO机器翻译系统之外,还陆续推出了一批实用化的机器翻译 系统。   法国纺织研究所的TITUS-IV系统,可以进行英、德、法、西班牙等四种语言 的互译,每种语言都有一部14000个词的机器词典,每秒钟可译240个词,主要用 于翻译纺织技术方面的文献。   美国在乔治敦大学机器翻译系统的基础上,进一步开发了大型的机器翻译系 统SYSTRAN,已提供试用。例如,提供给美国空军的SYSTRAN系统,词典有16万 8千个词干形式和13万6千个词组,可进行俄英机器翻译,每小时可翻译15 万词;提供给美国拉特塞克(Latsec)公司的SYSTRAN系统,可进行俄英、英俄、 德英、汉法、汉英机器翻译,每小时可译30万-35万个词。SYSTRAN是目前 应用最为广泛、所开发的语种最为丰富的一个实用化机器翻译系统。   美国罗各斯(LOGOS)公司开发的LOGOS-III机器翻译系统,可进行英语- 越南语机器翻译和英俄机器翻译,词典有10万个词。   美国国家航空和航天的NASA系统,可进行俄英和英俄机器翻译。   美国魏德纳(WEIDNER)通讯公司WCC的WEIDNER机器翻译系统,可进行英语 与法语、英语与德语、英语与西班牙语、英语与葡萄牙语之间的双向机器翻译, 并可进行英语-阿拉伯语的单向机器翻译。   设在华盛顿的泛美卫生组织研制成的PAHO系统,可进行西班牙语-英语的机 器翻译。从1980年以来,已经翻译了100多万词的资料。近来,他们又推 出了ENGSPAN和SPANAM两个实用化系统。   德国西门子(SIMENS)公司与美国德克萨斯大学(TEXAS University)合作, 研制成METAL系统,可进行德英机器翻译,词典包含1万个词条。   德国萨尔大学(Universitat des Saarlandes)研制成SUSY(Saarbrucken Automatic Translation System)系统,以德语为中介,可以进行俄语、英语、 法语、世界语的机器翻译。比如,由英语译成法语,首先要由英语译成德语,再 由德语译成法语,每小时可译15000词。   此外,还有一些大规模的机器翻译系统正在研制之中,例如,EUROTRA计划、 Mu系统、ODA计划、DLT系统等。   1978年,欧洲共同体在继续使用和发展SYSTRAN系统的同时,提出了欧共 体内七种语言(后来变为九种)之间进行任何一方向翻译的多语机器翻译计划 EUROTRA,此计划于1982年正式实施,前后延续了十多年,至今尚未达到预 期的结果。   日本在提出第五代计算机计划的同时,于1982年至1986年由政府开 展了英日、日英机器翻译Mu系统的研制,接着,又由通产省出面,组织与亚洲四 个邻国(中国、印度尼西亚、马来西亚、泰国)合作研究日语、汉语、印度尼西 亚语、马来语、泰语五种语言互译的多语言机器翻译ODA计划,原定于1987 年至1992年完成,现在延长至1995年初完成。   欧洲共同体在1982年开始实施EUROTRA计划的同时,还支持了多语言机器 翻译系统DLT的可行性研究。从1984年开始,改由荷兰政府和荷兰的一家软件 公司BSO各出资一半对此系统的研制进行长期的支持,从1984年到1992年 每年投资均在100万美元左右。DLT系统原打算九十年代中期开始实用化,可是 至今尚未得到满意的结果。
#8# 下一篇 返回目录 ●书评●              评冯志伟教授的两本书         梅维恒(V.H.Mair 美国宾夕法尼亚大学教授)   最近读了冯志伟教授新出的两本关于中文信息处理的书,一本是《现代汉语 和计算机》(Modern Chinese Characters and Electronic Computer,北京大 学出版社1989年出版,2+9+210页),一本是《中文信息处理与汉语研究》 (Chinese Information Processing and Research on Sinitic,商务印书馆 1992年出版,2+217页),此书是《汉语知识丛书》(Sinitic Knowledge Series)之一。   1992年出版的第二本书实际上是在1989年出版的第一本书之前写的 ,只是因为交稿之后出版时间拖得太长,作者只好将其中的一部分内容改写,另 寻其他渠道先发表出来。《中文信息处理与汉语研究》(以下简称《中文信息》 )一书论述的内容涉及到现代标准汉语(Modern Standard Mandarin,以下简称 MSM)信息处理的各个方面,而《现代汉字和计算机》(以下简称《现代汉字》) 一书则把《中文信息》头两章的内容进一步加以充实和提炼,扩充改写为五章, 专门讨论汉字信息处理的问题。   《现代汉字》一书的重点在于讨论汉字的性质及其在计算机处理中的遇到的 各种障碍。   这两本书有许多丰富的材料值得我们加以评述。限于篇幅,这里,我只想对 我读了这两本书之后印象最深的几个问题作出简要的评论。   众所周知,词的概念对于有效地进行自然语言处理是十分重要的。可惜的 是,汉字连书对于明确地划清词的界限是极为不利的,因而汉字给信息处理专 家和计算机技术人员造成了巨大的障碍。   在阅读这本书的时候,我认识了现代标准汉语(MSM)中的一个新词—— “熵”。这个新词是用来翻译英文“entropy”或“ information content ”的 (后者也可译为“信息量”)。冯志伟计算出,一个汉字的熵为9.65比特, 而其他语言相比,法语一个字母的熵为3.98,意大利语一个字母的熵为 4.00比特,西班牙语一个字母的熵为4.01比特,英语一个字母的熵为 4.03比特,德语一个字母的熵为4.12比特,俄语一个字母的熵为4.35 比特,汉字的熵大得惊人。有些赞扬汉字的人宣称,汉字的熵这样大,似乎对 于信息处理大好好处。然而,冯志伟却提出了与此完全不同而又令人信服的观 点。他在书中直言不讳地解释道:   “汉字的熵如此之大,对于通信技术和汉字信息处理工作都极为不利。根据 申农(Shannon)信道编码定理,在一种非扩展的无记忆信源中,码字的平均长度 不能小于信源的熵。汉字的熵值大,其相应的码字的平均长度也就很大,即使是 一个最优的信道编码系统,其码字的平均长度至少也要与汉字的熵相等,这就必 然要影响到通信的效率。在汉字信息处理中,汉字的输入输出是一个关键问题, 汉字的熵值大,其输入输出的信息量也就很大,这就给汉字的输入输出带来很大 的困难。尽管现在已经研制出了一些汉字输入输出设备,但其工作效率比英文或 俄文输入输出的工作效率差得多。因此,我们一定要搞好现代汉字的规范化、标 准化,严格限制常用汉字的数量,使汉语的书面形式适应现代科学技术发展的要 求。”(《现代汉字》,P207)   汉字的熵大得使有效的信息处理难于接受,而汉字的书写系统的多余度(R edundancy)却小得令人沮丧。书中指出,书面汉语的多余度为56-74%, 而书面英语的多余度却为67-80%。这意味着,与拼音文字的信息处理相比 ,在汉字信息处理中,容易出现更多的差错、错误和歧义的麻烦。   本文作者的评论将严格地限制在现代标准汉语( MSM)的范围内,因为对于 汉语其他变体的信息处理问题 ,至今实际上还没有作过任何的评价。如果一个 人能够用科技术语和数学方程式来论述他的对于现代标准汉语(MSM)的观点, 那么,这样的论述当然应该是非常雄辩而有说服力的。不过,我却乐于通过直觉 和观察的方法来研究,经过我自己也有了一个比较科学的基础。根据我的经验, 我曾经断言,汉字的平均笔画数应该是12画,二十年来对于汉字的这种低效率 的质特性的直观感觉和细心观察,我的研究现在冯志伟在他的书中已经证实,简 化汉字标准集的平均笔画数与我在过去宣布的结论几乎完全相同,而如果考虑到 被简化的繁体字,这个平均笔画数只是比12画稍微高一些。这样的不谋而合真 使我高兴万分。   在现代生活的背景之下,这种繁杂而低效率汉字使中国在所有的科技和贸易 的竞争中处于十分不利的地位。(这大概就是为什么中国和日本的科学家只有当 他们到西方在拼音文字的环境下工作时才得到诺贝尔奖金的原因。日本在工业、 财政和商贸领域采取尽量使用英语或罗马化的日语的办法,巧妙地避开了这个问 题。)为了支持这个注定要瓦解的系统——正如两千年前埃及的象形文字、苏末 人和赫梯人的图画表意文字在遇到拼音文字时就崩溃一样——汉字的维护者们正 在要求世界其他地方的人为此付出代价。Unicode(通用编码)采用2字节/8 比特的代码,其主要目的就是为了迁就汉字。显而易见,这样做的结果,它的开 销是ASCII码的两倍而效率(速度)则是ASCII码的一半,而英语、法语、德语、 俄语等语言采用1字节/8比特的代码就绰绰有余了。请看下面Unicode代码空 间资源的分配情况,这种分配具有讽刺意味的比例清楚地说明问题的严重性:   1.全世界的一切拼音、音节、语音系统分配8,192个码点;   2.标点符号、数学运算符号、通用技术符号和装饰标志符号分配4,096 个码点;   3.中文注音字母、日文假名、朝鲜谚文、汉字标点符号分配4,096个码 点;   4.私人用户代码分配3,584个码点;   5.汉字分配45,056(11)个码点,真是其大无比。   这样的局面是可笑的,同时又是可悲的,它将会给中国和世界的其他地方在 经济上带来可怕的后果。   正如冯志伟指出的,我们应该面对现实,停止给一个处于崩溃边缘的系统分 配如此不均衡的资源。为了对付由于过时的字符而造成的危机,作为第一步,我 们首先要把计算机用字的字模严格限制在 6,500个以内,这 6,500个汉字可覆盖 现行通用书面文章的99.9%。十年以后(在2005年),这个字数减少到3,000 个, 可覆盖现行通用书面文章的99.15%(极小量的不足部分可以采用罗马化的替换 方法和其他的调节方法来补足)。再过十年以后(在 2015 年),这个字数减少 到 1,500个,可覆盖现行通用书面文章的94.67%。这样做,不仅会给中国和全 世界在经济上带来好处和实惠,而且,数亿中国儿童将不必再记忆那些数目巨大 而并非必须记忆的汉字,摆脱单调乏味的记忆之苦。我预见到,在第三个阶段的 目标完全实现之后,也就是到2020年,英语和拼音化的现代标准汉语(MSM)以 及其他的中文信息处理系统将成为中国电子信息处理中大多数科学工作者和商贸 人员的第一选择。至于电子信息处理领域之外汉字的处境,那将完全是另外一回 事。作为一种书面的文字,汉字在很长一段时间内大概还会继续保持其生命力。 作为一种书法艺术,汉字还将保持更长的时间。作为一种学者们的研究对象,至 少在一千多年的时间内,汉字大概还会继续起作用,在某些特点的领域,汉字也 许会成为永恒的研究主题。   (YBY译自 Sino-Platonic Papers,46,Philadelphia,USA,July,1994)
#9# 下一篇 返回目录 ●拼写实验●          Daazi Gei Canji Ertong Dailai Xingfu            (打字给残疾儿童带来幸福)                .Maoge.
  1965 nian, Ireland(爱尔兰) chushengle yi ge zhòngdù canji ertong, mingzi jiao Nolan(诺兰). Ta jiangsheng de shihou, youyu nanchan, danao shiqu yangqi gōngjǐ you liangge xiaoshi, shii ta chengle zhongdu canji ertong. Ta tóubù yixia, quanshen meiyou yi chu nenggou huodong, ye bu hui shuohua, zhiyou yanjiang neng huodong. Wànxìng de shi, danao de zhìlì hai zhengchang. Zai quanjia he shehui wuweibuzhi de aihu he naixin de guanhuai xia, ta de zhili dedao le hen hao de kaifa.

  Danshi ta gen shuohua wúyuán, zenme gen bieren jiaoliu sixiang ne? Shi daazi geile ta xingfu. Bieren ba yi ge dai xiangpitao de xiao gùnzi guding zai ta de tóubu, ta kao bozi de dongzuo daazi lai biaoda ziji desixiang.

  Ta zai yong daaziji chuangzuo de di-1 shou shi zhong xiedao:

    Wo shi yi ge tanhuan'er

      Jiāngyìng rutong mutou.

    Renmen gei wo guwu he anwei,

      Danshi tamen xinli shifen qingchu:

    Wo zhongjiu shi yi ge chéng bu liǎo qihou de canji'er.

    Bu wo cán er bu fèi,

      Yidan wo rang tamen kan qīng wo de xianzhuang,

      Tamen jiu hui mingbai ziji shi cuwu de,--

    Wo yijing neng yong tou dazi le!

  Ta de wanqiang yizhi tongguo daazi zhanshengle ta de zhongdu canji.70 niandai, ta de chuangzuo kaishi hongdongle Yingguo, haoduo ci huode jígao de róngy~[7~] he jiangli, ye yinci wenming quanqiu.


#10# 下一篇 返回目录              谈谈同音单位的定型分化             --评 Maoge 的拼写实验--               陆丙甫 (bingfu@usc.eu)   Maoge 的这篇拼写实验,我是完全看得懂的。可惜,速度不快。这是现行汉 语拼音的主要弱点:不是说不能读,问题是读起来不顺畅,要“边读边猜”,比 较费劲。改进拼写和连写形式,是缓和这个矛盾的途径之一。   文中把“打字”拼作 daazi(可将“大”、“打”两个常用字明确区分开 来),将“使”拼作 shii,都有减少猜测的作用。这是从前北拉(北方话拉丁 文)的聪明作法,值得继承。记得北拉中还把“再”拼作 zaai(以区别于同为 常用字的“在”),也是很解决问题的。汉语拼音邮政地名,把“山西”、 “陕西”分别拼为 Shanxi 和 Shaanxi,也很管用。这种写法分化可以进一步扩 大。如果有二、三十个常用而易混淆的音节语素能够这样定型化,就可大大减少 “边读边猜”的程度,极大地提高阅读速度。拼音中文看上去也就更像“正式文 字”了(任何一种成熟的拼音文字都有一些约定俗成的定型化特殊拼法)。   但是这种拼法分化(定型化)必须严格控制。如果同音汉字普遍采取定型分 化,那就是“汉字拼音化”,而不再是“汉语拼音化”了。英语音节的拼法是非 常丰富多采的,同一音节往往有多种拼法。这固然有方便阅读的一面,但普遍的 一音多拼也导致了混乱,造成学习的麻烦,往往为某些教育界人士和语言学者所 诟病。其实英语的同音多拼,最起作用的也不过是 right、write,know、no, knew、new,not、knot,night、knight 和 I、eye 等常用词的分化,大部分同 音分化是没有效果不明显甚至徒增麻烦的。所以拼音中文,一方面不必完全拒绝 同音词的拼法分化和定型化,另一方面自也不必将所有或大部同音词、字都在拼 法上分化。可以采取“从严控制、逐渐开放”的方针,主要局限于一些出现率很 高的常用字、词。首先需要分化的包括“有、右”,“心、新、信”,“一、 亿”,“是、时、使”等等,并不很多。这样才能以最小的(读、写一致性方面 的)牺牲,来换取最大的(避免歧义猜测)的受益。随着定型分化数量的增加, 效果逐渐减弱而说、写不一致的弊病逐渐增加,所以要谨慎地、在约定俗成的原 则下严格控制。   在文字改革的阵线中,可以分两大派。一派就是“汉字拼音化”,另一方派 则是“口语拼音化”。前者主张尽量把同音单位定型分化,后者认为既然口语交 际中同音单位不成问题,拼音文字也不必分化同音字。两种意见都有一定道理, 但都不能绝对化。一方面,文字的基础毕竟是口语,书面写法上过多地采取口语 中所不存在的区别,是不妥的。(当然 daa、da 的区分,其实还反映声调的不 同,zaai、zai 的分化,才是口语中所基本不存在的分化。但是北京话中的 “在”往往轻读,从这个角度来说,它们的定型分化仍不是完全无中生有)另一 方面,书面语毕竟也有许多不同于口语的地方,虽然不比口语生动,但表达的内 容往往比口语细致、精确,汉语作为有悠久书面历史的语言尤其如此。因此我们 主张“基本上写、读一致,适当分化同音单位”的作法,或者说“口语为主、兼 顾汉字”的作法。   文中把“一个、两个”分别拼为 yi ge、liangge,不协调。是否可以统一 为“yi-ge、liang-ge”。yi-ge,出现率特高,不妨简化为 ige 甚至 ig,简化 的同时得到了定型化,便于快速识别。具体落实定型化,或者是繁化,或者是简 化,两条腿走,多一个手段,比一律繁化好,有利于拼法丰富化。    “誉满全球”为成语,可拼为 yuman-quanqiu。“成不了”实为一词,可 全连成 chengbliao (“不”简化定型为 b)。   必须明白,汉语拼音不管如何改进,终究不能完全替代汉字的功能(当然另 一方面,它又有许多汉字所不具备的重要功能)。拼音中文的目的是为了应付日 常工作、生产、生活的一般需要,而不是在所有的场合都代替方块字。所以我们 不必、也不该采取普遍的同音分化。   正像汉字不能也不必在所有场合代替甲骨文,白话文不能也不必在所有场合 代替文言文,简化字不能也不必在所有场合代替繁体字一样,拼音中文将不可能 也不必要在所有场合同汉字对应起来。今天我们在特定的场合还是需要使用甲骨 文,但谁能否认甲古文以后的那些语言文字改革呢!并且拼音文字一旦进入实用 阶段,在失去某些功能的同时,必然会在广泛的实际运用中不断改进发展出其它 一些方面的新功能,例如方便地吸收各地方言中一些用汉字难以写出的生动词汇 ,方便地吸收外来语等等,拼音文字这方面的巨大潜力恐怕远超出多数人的想象 。   不像理解,初始阶段的拼音文字同成熟的汉字相比,弱点是明显的,但是它 的潜力却不是一下子能够显示和实现的。我们必须放远目光,开阔思路,才能充 分预见到到它那巨大的适应能力。                                                        
#11# 下一篇 返回目录 ●来往信件●             美洲中国文字改革促进会           1995年10月22日给会员和会友的信 各位会员和会友:   谨随函寄上《语文与信息》第3和第4期。本会从今年2月起同北京市语文现代 化研究会合作在北京出版《语文与信息》双月刊。目的在于扩大影响,团结语文学 界和信息学界,共同为中国语文现代化而努力。   当前的情况是,中国语文现代化的需要越来越引起国家当局和民众的注意。但 实际进展缓慢,似乎难以满足普及教育和提高教育水平、吸收先进技术、语文接 轨、尽快进入信息时代等迫切需要。中文在电脑输入、输出和检索方面由于必须使 用不同的手段而日益陷于难以为继的困境。   鉴于INTERNET(交互网)的使用日益普及,为了接触更多的潜在读者,本会已 在今年9月在INTERNET上出版《语文与信息》第一期。今后将继续发行INTERNET版。 欢迎各位提供e-mail地址,以便由本会直接寄上INTERNET版。   NJSTAR(南极星)中文软件的最新基本版(ver. 3.04)是一套很好的中文软件。 特别适合用来看《语文与信息》的INTERNET版。本会已征得NJSTAR软件开发者倪鸿 波先生的同意,由本会代销售该软件,一方面使读者能够使用该优良软件,另一方 面则让本会得到一些经费收益。各位自己或朋友如愿意购买该软件,请寄给本会 99美元(支票抬头WENCUHUI,并请注明用来购买NJSTAR)。如需要有关技术资料, 请来信或e-mail索取.   最后,各位如尚未缴交本年的会费,请补寄25美元给本会(支票抬头 WENCUHUI)。本会衷心感谢各位一贯的热心支持,希望一起为中国的语文现代化 而奋斗。欢迎各位来信提出意见、撰写稿件、和介绍本会的活动。                     执行干事 吴文超 Apollo Wu
#12# 下一篇 返回目录 【语文与信息】存入万维网(WWW) 吴文超 先生: 我已将【语文与信息】制作成 HOMG PAGE 放入万维网(WWW)中,其地址是:     http://www.njstar.com.au/njstar/                  倪鸿波 Hongbo Ni


#13a# 下一篇 返回目录 ●消息●动态●头条 ▲“英汉扑克”简介  “中国英汉词语桥牌”,简称“英汉扑克”、“中国桥牌”,原名“汉语拼音 扑克”,又称“文字游戏”,是北京良乡中学教师雷震发明的新型智力扑克。它 寓知识于娱乐之中,是快乐教育的一种好形式,也是一个新兴的科学的高等竞技 群众体育项目。它与围棋、中国象棋、国际象棋和国际桥牌一样,可以进行多种 类型的比赛。   该牌由26个拉丁字母组成,把英语、汉语拼音和数学的知识内容,借用广 大群众喜闻乐见的扑克牌形式表现出来。通过变化多端的排列组合,可以拼出全 部英语单词全部汉语拼音音节及许多数学运算题,对激发学生学习兴趣、巩固所 学知识、推行汉语拼音方案、推广普通话、“注音识字、提前读写”、扫除文盲 以及外国人学习汉语等能起到极大的帮助作用。   有关专家认为,它具有严密的科学性、丰富的知识性、激烈的竞赛性、高尚 的趣味性和广泛的群众性。著名语言学家王力先生曾预言:“英汉扑克在全国广 大人民群众中普遍流行之日,将是汉语拼音方案被全国广大人民群众基本掌握之 时。” (知恩) #13b# 下一篇 返回目录 ▲美国大学图书馆面临挑战   美国加利福尼亚州立大学建造的新校园没有图书馆。校长巴里说,我们要把 钱更好地用在通过计算机得到信息技术上,根本用不着把钱浪费在砖头、泥浆和 昂贵的图书馆上。美国各大学都在努力实现全面信息联网,近几年来,在管理功 能和教学方式上发生了全面的变化。   宾夕法尼亚大学宿舍的每张床有4个插座,一个是有线电视插口,一个是连 接信息网的插座,一个是普通电话线插座,还有一个是连接私人电话线路的。许 多别的学校也有类似的布置。   现在,学生能够在观看有线电视教学节目的同时,接通互联网络线路,同时 还能在电话上聊天。学生在宿舍里查看联机卡片目录,预借一本书。学生无须到 办公室去就能了解自己的学习情况或办理改变课程等手续。教师通过电子邮件布 置作业;学生能更加自由地与教授交流。办公时间的传统观念也在逐步消失。 (Zx摘自《科技日报》1995-03-02第8版) #13c# 下一篇 返回目录 ▲1994年日本销售个人电脑320万台   据最近公布的关于日本个人电脑市场规模的统计数字,1994年日本个人电脑 销售量比1993年增长30.0%,达到320.5万台。年度销量首次突破了300万台大关, 彻底摆脱了进入90年代后,个人电脑销量一直在200余万台徘徊不前的停滞局面, 进入了高速增长期。 (Zx摘自《科技日报》1995-02-15第8版) #13d# 下一篇 返回目录 ▲评选:“五笔字型”榜上无名   有关专家们介绍说,“五笔字型”技术只是数百种汉字输入技术中的一种, 不管是在80年代初,还是在现在,它都不是最佳的方案。专家陈一凡介绍说, 1986年,国家科委、国务院电子振兴办公室、国家标准总局和中国中文信息 学会等有关部门组织专家对国内已上机使用的51种汉字输入方案进行一次技术 评测,最终评选出11种“A”的汉字编码方案,而“五笔字型”则榜上 无名。(Zx摘自《民主与法制》1995年第3期)
#14#  返回目录 <语文与信息> 交互网版出版单位:             美洲中国文字改革促进会
        Meizhou Zhongguo Wenzi Gaige Cujinhui (Wencuhui)

 Association in America for the Promotion of Chinese Language Reform

        PO Box 334, Scarsdale, NY 19583, USA

    执行干事:Mr.Apollo Wu吴文超Tel. & Fax: 914-725-5527

    国内: 100010 北京朝内后拐棒胡同甲二号

《语文与信息》编辑部电话: 0086-1-5250337; FAX: 0086-1-5138634

《语文与信息》美洲联合编辑:(请向下面任何一位编辑联系和投稿)

    吴文超 Apollo Wu  wengai@aol.com

    谢天蔚 Xie Tianwei twxie@ucdavis.edu

    陆丙甫 Lu Bingfu  bingfu@usc.edu

返回目录         □完□


This HTML version is converted by Hongbo Ni - Author of NJSTAR Chinese Word Processor