LOGO

      《語文與信息》雙月刊  Language and Information

              第2期  1995年11月

          Internet Ver. --- 1 November 95


                 目  錄
●專論● #1 論語文現代化及其當前的任務…………………………………………胡瑞昌 ●拼音化研究● #2 關于漢語拼音正詞法的幾個問題………………………日本 伊井 健一郎 #3 在幼兒園裡可否進行漢語拼音教學﹖…………………………………張 雁 #4 應大力推廣詞彙化的漢語拼音…………………………………………李步其 ●評論● #5 漢字輸入比英文快﹖……………………………………………………尹斌庸 ●資料● #6 南極星拼音連詞輸入法的又一新改進…………………………………陸丙甫 #7 面嚮計算機的語言研究(二)…………………………………………馮志偉 ●書評● #8 評馮志偉教授的兩本書…………………………………………美國 梅維恆 ●拼寫實驗● #9 Daazi Gei Canji Ertong Dailai Xingfu ……………… Maoge #10 談談同音單位的定型分化--評 Maoge 的拼寫實驗………………陸丙甫 ●來往信件● #11 給會員和會友的信 ……………………………………………………吳文超 #12 【語文與信息】存入萬維網(WWW)…………………………………倪鴻波 ●消息與動態● #13 ▲“英漢扑克”簡介    ▲美國大學圖書館面臨挑戰    ▲1994年日本銷售個人電腦320萬臺   ▲ 評選﹕“五筆字型”榜上無名
  ●>> 讀者注意: 如要按目錄的文章編號(例如 #00 號)找尋該文,      請找尋(search for) #00# 字符即可 (NJSTAR 用 F5 鍵).
#1# 下一篇 返回目錄 ●專論●             論語文現代化及其當前的任務           中國人民大學語言文字研究所 胡瑞昌   什么是中國語文的現代化﹖語文現代化的研究對象和工作內容有哪些﹖怎樣 實現中國語文的現代化﹖這些問題,前些年還認識不太清楚和深刻。近年來,經 過各界人士的討論和研究,已經有了比較清楚的認識,但是並不是所有人的認識 都一致了。   語文運動的老前輩、語文學界的專家周有光教授,對中國語文現代化問題多 次進行過詳細、全面而精闢的論述。ヾ 尤其1993年10月在“中國語文現 代化學會成立大會暨第一屆學術討論會”上的主旨發言《信息化時代的中國語文 現代化》最為詳細、全面、精闢。ゝ在這裡就不贅述了。   什么是語文的現代化﹖那就是語言和文字為適應現代社會的語言和文字的應 用而實現自身的現代化。這是不言而喻的道理。因為語言是隨著社會的產生而產 生的,是隨人類社會交際的需要而產生的交際工具﹔而文字則是為了突破語言交 際時間、空間的限制而產生的記錄語言的符號系統。因此語言和文字必然地要依 存于社會,也隨著社會的發展而發展。所以語言文字必然地要為社會語言文字的 應用而服務。如果一旦語言文字不能適應社會生活的需要,不能很好地適應它和 為它服務,則必然會被社會生活所淘汰、揚棄。這是不依人們主觀意志的客觀規 律。誠然語言和文字有其本身的自然屬性,即語言和文字本身並不是社會,但語 言和文字是社會現象──有人類社會才有人類的語言和文字,社會以外無所謂語 言和文字。所以語言和文字有其社會屬性的一面,而且是本質的一面。語言和文 字有它自身的內部發展規律,但社會對語言文字的發展起著十分重大而深刻的影 響和制約作用。畢竟語言和文字是人類社會交際的工具,所以人類社會的發展對 語言和文字的發展必然產生制約作用的。   那么,什么是現代化社會﹖我們認為現代化是個歷史範疇的概念。不同的社 會發展階段有不同的現代化內涵。比方說,原始人類社會的漁獵經濟社會同轉入 畜牧和農業經濟的社會顯然畜牧業、農業經濟的社會比起漁獵經濟的社會來說那 是更為先進的社會,也就是相對于漁獵經濟的社會來說是現代化的社會了。而初 級階段的畜牧業和農業經濟的社會轉入高度發達的農業、畜牧業經濟的社會時, 則高度發達的農業、畜牧業經濟的社會比起初級階段的畜牧業、農業經濟的社會 來說,高度發達的農業、畜牧業經濟的社會是現代化社會了。到了十六七世紀產 業革命的工業社會比起即使是最發達的農業、畜牧業經濟的社會來說,工業社會 當然是現代化社會了。而到了即將進入21世紀以高新技術為特點的高度發達的 工業化社會來說,產業革命的工業社會當然是落後了。以高新技術為特點、以第 二次信息革命的信息化為特征的工業化社會、信息化社會當然是現代化的社會了 。每一歷史階段的社會,對語言和文字現代化的要求當然不會相同。   當原始漁獵經濟轉入畜牧業、農業經濟社會時,社會生產力極大的提高,社 會的物質生產有了極大的發展,使社會勞動有了分工。社會財富的積累產生了富 人和窮人,加上戰爭的掠奪和奴役,產生了階級和奴隸,使得有可能出現腦力勞 動和體力勞動的分工,加上國家的產生,政治、經濟、軍事、社會事務的日益繁 忙,創製文字以適應社會的需要就成為十分必要了。於是產生了文字。文字的產 生極大地推動了社會的發展,使人類社會從野蠻社會進入到文明的社會﹗ 這是語言文字發展的一次飛躍。   當產業革命促進工業生產的發展時,社會商品生產高度的發達,要求有全民 的統一市場,於是社會對語言文字的應用,要求有統一的全民共同語。而諸侯割 據的高度發達的封建農業國,為鞏固統一的國家,要求有全國統一的文字,如秦 始皇的“書同文”。   而當電力代替蒸汽動力,核能代替電能工業高度發展的工業化社會,對語言 文字應用的要求,就是要求語言和文字要有高度的統一規範和統一標準,以適應 快節奏、高效率、高集約、高智能的機械化、自動化、信息化的語言和文字的處 理。   而今天,面對第二次信息革命的信息化現代社會,對語言和文字的現代化要 求就更高了。它要求語言和文字要有高度精密的規範和標準,以便實現計算機人 工智能化﹕文字和語音的自動識別。做到自動機器翻譯(多語種的對譯)和人機 對話(及多語種的對譯)﹔資料庫、數據庫的自動檢索等等。   由上述簡述中可知,現代化社會的涵義是歷史範疇的概念。不同的歷史階段 ,社會的現代化內容是不同的、相對的。而不同的歷史階段,對語言和文字應用 實現自身現代化的要求也是不同的。   那么,中國的現代化社會指的是怎樣的一種社會呢﹖中國的現代化社會指的 是1957年1月13日周恩來總理在第四屆全國人民代表大會第一次全體會議上作 的《政府工作報告》中所指出的﹕在本世紀內實現農業、工業、國防和科學技術 的現代化。也就是今天所說的﹕具有中國特色的社會主義的四個現代化的社會。   為實現社會主義的四化建設,語言文字如何適應四化建設的需要而實現自身 的現代化呢﹖我們認為﹕必須以漢語、漢字的規範化、標準化為中心﹔以漢語、 漢字的基礎研究和應用研究為基礎﹔以掃盲、普及文化教育、漢語漢字信息處理 技術和理論研究與開發為重點。這就是中國語文現代化的當前任務。   為什么要以漢語、漢字的規範化、標準化為中心呢﹖很明顯,社會主義市場 經濟的高速發展,使得全國性的政治、經濟、文化教育及科學技術、交通運輸 ……所有生活領域、生產領域人員的來往和交流空前的活躍和頻繁。很難想象, 如果沒有全國統一的、規範的、標準化的通用語,怎樣協調人們的交際和交流 呢﹖ 社會主義的商品經濟要求要有全國統一的商品市場和商品流通,如果沒有 全國通行的、規範的、標準的全面共同語,那是不行的。然而時至今日,普通 話還沒有在全國範圍內普及。無疑會對社會主義統一市場的形成和發展,商品 市場的發展等等產生消極的影響。這對于四化建設當然是十分不利的。如果再 考慮到對文化教育、國防建設等方面的影響,普通話的普及是何等緊迫的任務﹗   中華人民共和國成立以後,黨和政府對于漢字的規範化、標準化工作十分重 視,先後公佈了常用字表、通用字表、異體字整理表、簡化字總表、信息交換用 漢字編碼字符集•基本集等等,使得漢字的規範化、標準化工作取得了很大的成 績,對四化建設作出了很大的貢獻。可是近年來,社會用字十分混亂﹕濫用繁體 字、亂造簡化字、寫錯別字的情況比較嚴重。如果任其氾濫,必然會損害文字應 用的交際效能。   漢語、漢字的規範化、標準化對于語言和文字的計算機處理的重要性更是十 分明顯。如果沒有規範的、標準的全民共同語,人機對話就談不上。雖然方言和 普通話的對譯從方法和技術上來說是能辦到的,但這種對譯不能全國通行,只局 限于方言區,從社會效益和人力物力的浪費來說是得不償失的。由于目前計算機 漢字輸入編碼幾百種上千種,已經浪費了無法計算的人力物力﹗這也是嚴重阻礙 計算機普及的一個重要原因﹗ 如果全國只一種通行的文字輸入計算機的輸入系 統,人們就可以不必耗費無數的人力物力去設計五花八門的編碼,而把人力物力 投入到軟件的研製中,使計算機具有更多的功能,價格更低廉些。何愁計算機不 普及﹗ 對智力的開發和人才的培養將作出何等巨大的貢獻﹗   由此可知,沒有漢語、漢字的規範化、標準化,政治的、經濟的、國防的、 文化教育的、科學技術的、計算機信息處理……等等,等等,將受到何等嚴重的 影響﹗   為什么中國語文的現代化要以漢語、漢字的基礎研究和應用研究為基礎呢﹖ 任何事物都有其內在的客觀規律,不進行漢語、漢字的基礎研究和應用研究, 我們的工作和實踐就會是盲目的,就會失敗,或者事倍功半。比如諸多的形碼方 案,有哪一種方案對漢字的歷史發展、漢字的字形結構作過深入、全面、系統的 研究過﹖可以肯定地說﹕沒有﹗沒有進行過文字的基礎研究就想設計出完善的字 形編碼方案,這豈不是枉費心機﹖所以無論哪一種字形編碼方案都漏洞百出,修 修補補的結果,有許多的“規則”不但不符合漢字本身的結構規律,甚至違反了 漢字自身的結構系統﹗音碼方案也同樣存在問題。同音詞的問題沒有解決之前, 就無法避免同音重碼的問題。原因就是沒有對漢語的言語動態情況作深入、全 面、系統的研究,因此陷入困境。實際上音碼比形碼更有前途,但目前形碼似乎 比音碼佔上風。由此可見一斑。任何中國語文的現代化,必須建立在對漢語、漢 字的基礎研究和應用研究的基礎之上,否則就會是盲目的,不可能科學地解決問 題。   為什么要以掃盲、普及文化教育、漢語漢字信息處理技術和理論研究與開發 為重點呢﹖據最新統計中國有一億多人口為文盲半文盲。這比第一次人口普查兩 億多人口為文盲半文盲減少了許多。語言文字要為實現四化服務,要適應四化建 設的需要,那么首先的任務就是要為掃除文盲服務。否則侈談語文現代化,豈不 是背離了語言文字工作的最起碼的宗旨﹖語言文字想要發展,想要實現現代化, 首先必須為廣大的人民群眾服務,否則脫離廣大人民群眾的語言文字應用需要的 現代化,還有什么意義可言﹖其次要為普及文化教育服務。要實現四個現代化, 沒有有文化素養的勞動者和技術人員那是不可能實現的。如果使全國的人口10 0%具有中等文化水平以上,加以其中人口的70%以上具有中等專業技術的勞 動者和技術人員,人口的30%-50%以上具有大專以上文化水平,30%或 更多的人口具有高級文化水平(包括專家、科學家等),那么中國的四個現代化 是指日可待的了﹗而目前普及文化教育是工作的重點。語文現代化的當前重點之 一,就是要為掃盲、普及文化教育服務。   其次,目前西方發達國家提出建設“信息高速公路”和“實現全球信息網絡 的聯網”。這對于我們來說是一種挑戰。由此,在語文界、語言文字信息處理界 產生一種錯覺,以為語文現代化就是實現“語文信息化”,而且是壓倒一切的頭 等任務。這是不正確的。也是不切實際和不現實的。   首先應當肯定,中國的語文現代化要適應信息革命的挑戰,要把漢語、漢字 適應計算機信息處理技術的理論研究和應用開發列為重點。這是不容置疑的。但 這只是實現中國語文自身現代化重點任務之一,而不是全部,更不是壓倒一切的 頭等任務。就目前中國經濟的發展水平而言,計算機還無法普及到每個家庭,I BM486個人電腦,在美國本土的售價為一千美元,中關村康柏(COMPAQ) 386個人電腦售價七千元左右。如果還加上其他附件和軟件、電源等等,使用 一臺個人電腦(不是打印機),大約一萬至一萬多元人民幣。一般的工薪階層年 均收入,按國家統計局公佈的數字為四千多元,農村約為兩千多元。根本無法支 付這筆巨額的開支。其次,電腦的應用畢竟是高層次的文化用品,連九年義務教 育都尚未普及的情況下,侈談普及家庭電腦,豈不是離現實生活太遠﹖即使普及 了九年義務教育,但並不等于普及了電腦應用的知識﹗最後,目前中文電腦,即 使最出名的幾種個人電腦,其編碼系統也不是通用的﹗如果一種電腦兼收並蓄把 幾種編碼方案都兼容進去了,那么使用時也只能選一種方案,如不然,則要多學 幾種。那時候,靠死記的編碼必然容易遺忘,用來用去也只記得一種而已。電腦 不能普及除了經濟原因之外,編碼方案與日常使用的文字分離造成操作上的困難 是很重要的原因。可見,即使建設了“信息高速公路”,能“上路”的人又有多 少呢﹖(何況幾百種、上千種的編碼方案是“高速公路”上的絆腳石和暗礁,不 把絆腳石和暗礁搬掉,公路無法開通﹗)   不過,研究和開發漢語、漢字的信息處理技術和進行有關的理論研究仍然是 中國語文為適應信息化時代所必須作為重點來進行的工作。漢語漢字的信息處理 比西方發達國家起步要晚,加上方塊字比西方拼音文字存在先天的缺點──效率 和成本都比拼音文字要差。(這點計算機技術界是有共識的。)所以更要未雨綢 繆,迎頭趕上。我們呼籲﹕由國家有關部門進行協調,集中人力物力,進行研製 一種規範的、標準的“電腦拼音文字”以代替目前所有的形碼、音碼方案,作為 國家的統一標準。這一時機已經成熟。 註釋﹕ ヾ周有光《談語文現代化》,《語文建設》1993年10月﹔《中國的語文      現代化》,《語文建設通訊》(香港)1994年9月,45期。     ゝ周有光《信息時代的中國語文現代化》,《普通話》(香港)1994年2月。
#2# 下一篇 返回目錄 ●拼音化研究●                    關于漢語拼音正詞法的幾個問題              日本 伊井健一郎   1988年 7月,中國國家教委和國家語委聯合公佈了《漢語拼音正詞法基本規 則》。這個“基本規則”是在84年發表的“試用稿”研究和修訂的基礎上公佈的 正式文件。因此,我認為它應是我們書寫漢語拼音時應當遵守的基本準則。然 而,近年來我見到的一些中國語課本、中國雜誌以及中國社會上一些商品包裝說 明上的漢語拼音卻存在著極其混亂不規範的現象。   另外,我在拼寫中國語中級講讀課本《別了,瀨戶內海﹗》和80年將《新華 字典》改編為漢語拼音版時也遇到了不少問題和難點。在這裡把我遇到和想到的 幾個問題提出來,就教于大家。同時在最後一部份對“基本規則”中的某些部份 作一簡單介紹,以便各位作為參考資料。   1.書寫不規範,錯誤百出。   (a) WENHWA YWE KAN (文化月刊)     RE DIAN TO SHI (熱點透視)     TAIGANGAOSHENG (臺港澳聲)     FUJIAN ANXI ZHENPIN TIEGUANGYIN (福建安溪鐵觀音)   這些是曾經刊登在《文化月刊》雜誌上的漢語拼音和商品名。這個雜誌是由 《群眾文化》改名而來的。首先它把《文化月刊》雜誌名拼寫成“WENHWA YWE KAN”,就十分令人費解。無論在拼寫上,還是在詞分寫上都很不規範。《文化 月刊》應寫成“WENHUA YUEKAN”。其中專欄題目“熱點透視”應連寫成“ REDIAN TOUSHI”。“臺港澳聲”的漢語拼音,中間應加短橫,寫成“TAI-GAN G-AO SHENG”。   “文化月刊、熱點透視”的拼音,現在拼寫對了。可是“簡訊”,為什么是 “JIE XIUN”呢﹖主辦單位是文化部社會文化司,絕不應該有這樣基礎知識的錯 誤。(《文化月刊》總第25期,1995.1 P.64)   “鐵觀音”應寫成“TIEGUANYIN”。   (b) RENSHENFENGWANGJIANG (人參蜂王漿)     HONGQIZHIYAOCHANG(紅旗製藥廠)   將這些詞拼寫時,都要分寫,如﹕Renshen Fengwangjiang, Hongqi Zhiyaochang。   (c) JI NAI YUAN (擠奶員)     SHI ZI WU (獅子舞)   1993年8月內蒙古少年友好藝術團到日本演出,在其節目單上,將“擠奶 員”“獅子舞”寫成如上所示。這些都是一個詞,所以應該連寫為“Jinaiyuan” “Shiziwu”。   (d) KWEICHOW MOUTAI (貴州茅臺)   “基本規則”規定“非漢語人名、地名本著‘名從主人’的原則,按照該文 字的羅馬字母轉寫法拼寫。不過,“貴州”“茅臺”不是非漢語的地名,這也是 很不規範的。中國的人名、地名應該用漢語拼音書寫,所以“貴州茅臺”應寫成 “Guizhou Maotai”。   GUANGMING DAILY (光明日報)   《光明日報》刊頭的漢語拼音,最近由“GUANGMING RIBAO”改變成了 “GUANGMING DAILY”。不知為什么“日報”部份變成了英語﹖   我查《中文書刊名稱漢語拼音拼寫法》,“中國青年”是“Zhongguo Qing nian”“人民日報”是“Renmin Ribao”。這是一個很好的範例。   (e)凱麗(kelly)、喬伊(Joy)     蒙勃朗(MontBlanc)、赫爾梅斯(Hermes)、維頓(Vuitton )   這些詞是在《國際商報》INTERNATIONAL BUSINESS(1993.3.7)上 的“名牌逸聞”欄裡登載的專名。   非漢語人名、地名本著“名從主人”的原則,按照羅馬字母“拉丁字母” 原文書寫。可以在原文後面注上漢字或漢字的拼音。(“基本規則”1.5 )落 實“名從主人”的原則是日中兩國專家要共同研究的題目。東京→Tokyo、 神戶→Kobe、芥川→Akutagawa。相反,日本方面也按照漢語拼音的發音來拼 寫中國的人名、地名。   北京 Pekin→Beijing、廈門 Amoi→Xiamen、蔡元培 SaiGenbai→Cai Yuanpei。   2.“基本規則”和“試用稿”的比較(省略)   3.漢語拼音和英語讀法的問題(省略)   4.實際問題令人棘手   我們在日本教授漢語和編寫教材時,常常要考慮詞的分寫、連寫問題。也有 名詞和方位詞、動詞和補語的寫法,成語、少數民族和外國的專名的寫法等。 “聲調一律標原調,不標變調”這條規則合不合于實際運用﹖還有不少未解決的、 不能令人滿意的問題。   我最近看到NHK出版的“廣播中國語講座”“電視中國語會話”、北京廣播電 臺編的“大家的中國語會話”以及北京大學、北京語言學院等出版的漢語課本, 拼寫很不統一。   《語文建設》(1992年12期)的一篇文章說,一定要消滅拼寫不規範的現象。 任何部門或單位沒有權限決定在應該使用漢語拼音的場合使用或推行其它的拼音方 案。《人民日報》(1992年12月19日)也在糾正語言文字應用時的混亂現象的文章 中號召繼續推行漢語拼音方案,借以擴大拼音方案的使用範圍。   為了響應這些號召,在中國出現了一個實踐“文字質量萬里行”的人物。這就 是李延良萬里找錯字,介紹他的事跡的文章刊登在《光明日報》(1993年6月4日) 上。他為了尋找出社會上的錯別字而于93年 4月中旬從常州市出發騎車奔向北京。 他沿途發現路標、商店的招牌、廣告和報刊上的錯別字,並講解宣傳文字規範化的 意義。他在91年和92年就曾經作過這樣事,人們稱他為“現代的‘愚公’﹗”。   編者按﹕伊井健一郎,日本姬路獨協大學學者,1994年3月31日至1995年3月 29日在北京大學中文系進修。這篇文章是根據1993年6月19日在日本大阪市召開 的“日本□□□□中國語學會”年會上所作的報告之一部份。
#3# 下一篇 返回目錄          在幼兒園裡可否進行漢語拼音教學﹖             哈鐵老戰士協會 張雁   1989年9月11日,國家教委第四號令,發佈《幼兒園管理條例》,共 有32條。其中第15條說﹕“幼兒園應當使用全國通用的普通話”。第16條 說﹕“幼兒園可以根據本園的實際,安排和選擇教育內容與方法”。憑這兩條, 我認為在幼兒園裡就可以進行漢語拼音教學,因為﹕   1.漢語拼音是全國通用的教學普通話最有力的工具﹔   2.在幼兒園裡安排初級的漢語拼音教學很簡便,孩子們都能接受,可為將來 上小學奠定一個良好的基礎,能與小學的語文教學相銜接。   當然,在幼兒園裡進行漢語拼音教學應與小學有區別,首先是教材,不能用 小學的《語文》課本,應該根據幼兒園的特點,另編簡易的教材。其次是教學方 法,不能只限于在課堂呆板的教與學,應該採取靈活多樣的游戲方式,做到趣味 化,寓教于樂。為此,在幼兒園裡要進行漢語拼音教學, 必須具備以下三個條 件﹕   1.要有能承擔這個課程的優秀教師﹔   2.要有適用的教材和教具﹔   3.要有幼兒園的領導人(包括上級)和家長們的積極支持。   這些條件從哪裡來﹖從天上是掉不下來的,就得由教育行政領導部門創設。 首先應該狠抓幼兒師範教育,把漢語拼音列入正式課程,成為幼兒師範的必修課 。其次,應該與出版部門合作,組織人力編寫出版彩色的圖文並茂的漢語拼音課 本。教具可由教師動手製作,比較好辦。對幼兒園的領導人和家長們如何支持的 問題,就得大力做好宣傳工作,要懇切地說明﹕在幼兒園裡進行漢語拼音教學, 是為了提高中華民族的文化水平,以適應我國現代化建設的需要,必須從娃娃抓 起的一件具有戰略意義的大事,不要等閑視之。   社會上有許多人對幼兒園進行漢語拼音教學這個問題很不理解,總認為這是 一種超前行為。他們盲目議論,口口聲聲說﹕幼兒園的孩子們年歲小,學不了漢 語拼音,要他們寫拉丁字母,那太困難了﹗還有的人說﹕幼兒園的孩子們學了漢 語拼音,上小學還得學,他們就不感興趣,不願再學了等等。總而言之,他們不 贊成在幼兒園裡進行漢語拼音教學。   我認為這些議論和說法,都是不對的,完全是一種主觀臆斷,不符合實際的 。那末應該怎樣對待才對呢﹖請看下面的事例。   1985年7月10日,哈爾濱市南馬路幼兒園,為了加強改革幼兒教育, 準備進行漢語拼音教學的實驗,特聘我為顧問,經過三年,完成了實驗的計劃。 在結業典禮的大會上,被黑龍江省關心下一代協會送給的條幅稱讚為﹕“實驗漢 語拼音教學的典範”。大會還宣讀了國家語委和黑龍江省語委熱情洋溢的賀信。   兩位優秀的教師李立春和黃新民,在上級領導和家長的大力支持下,認真負 責,各從一個小班教起,一直跟到大班,貫徹以游戲的方式,利用各種各樣的教 具,按部就班地進行教學,掌握了一套最佳的教學方法,最後總結出三條完整的 好經驗,情況如下﹕   小班,認讀正楷大寫的26個基本字母,唱會一個字母歌,從而掌握了基本 字母的順序。   中班,認讀正楷小寫的26個基本字母,並從描紅到臨摹,寫會了大寫和小 寫兩種字母的字體。   大班,根據我編寫的《初級漢語拼音課本》,用直呼法,進行88個基本音 節的教學(聲母與單韻母拼成的音節和整體認讀的音節),並按課文進行常用的 複音詞兒和短語的教學。此外,還教會打旗語、作記錄的技能。孩子們很感興趣 ,認真學習,取得了非常好的成勣。   1987年,哈爾濱市南馬路幼兒園教學漢語拼音的兩個班結業之後,孩子 們都上小學了。他們在小學裡情況怎樣﹖據我調查了解,大家對再學漢語拼音的 事,依然很感興趣,沒有發生厭倦的情緒。不僅如此,他們對于深入學習新的字 母和音節覺得很方便,記得扎實,而且在作業中都能正確地寫和使用,因此,進 步特快。其中原先在幼兒園是優秀的12名同學尤為顯著,他們保持了優秀的成 績。這對李立春和黃新民兩位優秀的教師來說,那是莫大的安慰﹗
#4# 下一篇 返回目錄      應大力推廣詞彙化的漢語拼音──有感于一小學生的幾句話               南京大學 李步其   一天,到朋友家作客。朋友的一個上小學一年級的孩子做完語文作業之後, 拿著課本,翻到最後幾頁,有點自豪地對我說﹕“叔叔,後面的課文我們還沒有 學,好多字不認識,可是我會朗讀。你信不信﹖”我瞧著他那天真無邪的樣子, 還未作出回答,他已大聲讀了起來,相當流利。我正在納悶,這小傢伙已把小嘴 巴靠近我的耳邊,低低地說﹕“叔叔,告訴你個秘密,千萬不要告訴別人,我學 會了拼音。剛纔,我是看著拼音讀的。我還用拼音給同學寫過信呢﹗”   是的,看著拼音就能朗讀,運用拼音還能寫作,這是一個小學一年級學生就 能做到的。可見,學會拼音對說、寫多么重要。它越來越引起人們的高度重視。   先追溯一下歷史。只要略有一點知識的人就都知道,語言先于文字。自從有 了人類,就有了語言,它主要以語音的形式來傳遞信息,交流思想感情的。當然 ,人們還要借助手勢、表情、姿態、圖畫、實物等輔助性的非語言的手段來完成 交際。而文字是在人類的文化發展到一定階段的時候才出現的,是建立在語言基 礎之上的一種最重要的輔助性交際工具。自從有了文字,人類社會也就有了用文 字記載的歷史,知識、技術和經驗得以系統地流傳下來,傳播開去,促進了社會 文明的發展。但是,漢字數量眾多,如《中華大字典》(1915年)收入漢字 44908個,《漢字大字典》(1980年)收入漢字60000個,即使常 用漢字,也有3755個﹔筆劃結構繁雜,如“ ”、“ ”等字,它們有二十 五畫之多﹔字音和字形脫離,如“牘”字,準確的讀音是“d□”而有些人卻往 往容易按照形聲字的特點將其讀為“m□i”,現實生活中的類似現象屢見不 鮮。正是由于以上這幾方面的原因,導致了漢字在學習速度、應用效率、溝通中 西方文化、便于記錄語言等方面不如只用為數有限的拉丁字母有規律地排列組合 而構成的拼音文字。   再說,自古至今,不識漢字的人,卻因語音不同而不能很好地進行交際。很 顯然,語音的同一性在交際過程中起著非常重要的作用。因而,為了我國社會主 義革命和社會主義建設的需要,為了國家統一和人民團結的需要,人人都應學好 拼音,力爭說一口流利的普通話。   目前,隨著社會的進步,語音處理和聲控技術的發展,在原來使用文字的場 合,人們越來越多地使用語言來代替。呂叔湘先生曾經說過﹕“現代各種事業沒 有一樣不要講效率,處處要快,要能機械化。在這種社會裡,自然用拼音文字寫 語體文最合適。”因為漢字不適合現代化的傳聲技術和文字處理技術,遠遠不能 滿足世界信息現代化發展的要求。   既然拼音文字向信息現代化的生活中,有它的優越性,有它的獨特的價值, 因此,我們應大力提倡在一切可行的環境裡,特別是在小學教學、掃盲工作、計 算機輸入漢字和文獻檢索等方面,使用詞彙化的漢語拼音,更好地推廣普通話, 普及提高社會文化教育,促進世界文化交流﹗
#5# 下一篇 返回目錄 ●評論●              漢字輸入比英文快﹖                 尹斌庸   漢字輸入電腦的問題還沒有很好解決的時候,有一些人就在那裡吹噓起來﹕ “漢字不但能夠輸入電腦,而且速度比英文快。”消息不脛而走,一些報刊競相 刊載,並以此作為“漢字優越”的論據。用一句六、七十年代常見的話來說“蒙 蔽一些不明真相的群眾”來形容,真是再恰當不過了。   文字符號的輸入可以分為兩種類型。第一種叫做“全符輸入”,即文字的字 符一個不漏的全部輸入。英文以及其它拼音文字幾乎都是採用這個方法。例如﹕ climb(攀),輸入時按c,l,i,m,b逐個字母輸入就行了。只要懂得這種文字, 而且熟悉鍵盤指法,不必花錢花時間去“培訓”,人人一說就會。   另一種叫做“略符輸入”,即只輸入文字字符的一部份,用部份來代表全體 。漢字編碼的所有方案,都帶有這種“略符輸入”的性質。例如李金鎧先生的“ 筆形編碼法”,“磨”字只用了廣(413)、木(734)、石(130),省去了一個“木”, 而代碼4137341又在尾巴上省去了30兩個數字。王永民先生的“五筆字型編碼法”, “攀”字只用了木(S)、□(Q)、□(Q)、手(R),省去了木、大兩個部件。如果漢 字也像英文那樣採用“全符輸入”,“磨”字應該是點、橫、撇、橫、豎、撇、 點、橫、豎、撇、點、橫、撇、豎、折、橫,比英文的grind(磨)5個字母,哪 個快呢﹖   用自己的“略符輸入”去和別人的“全符輸入”比快慢,這有什么意義呢﹖ 好比甲乙兩個人比輕重,甲說﹕“我的一條腿比你整個身體要輕得多,我比贏了 。”這不是笑話嗎﹖用這種近乎荒謬的比較,得出漢字比拼音文字“優越”,這 不是更大的笑話嗎﹖   英文能不能搞“略符輸入”呢﹖當然能,而且可能比漢字編碼還要簡單。比 如,grind(磨)略成grnd,climb(攀)略成clmb,等等。這樣一來,英文輸入 的速度可以大大加快,但是卻要記住很多規則(比如區分重碼的規則等)。據我 所知,直到今天,幾乎沒有一個使用英文的人去設計這種“英文編碼”方案,而 都是老老實實地一個字母、一個字母地“全符輸入”。難道他們不知道求快﹖難 道他們個個都是大傻瓜﹖(據說,英文也有速記方案,但除了極少數速記人員外, 一般人都不願意學。)   我國的漢字編碼即使是比英文輸入快(這一點尚未有嚴格的證明材料,只憑 幾次“比賽”是不能下結論的),也是我們付出了重大代價或重大犧牲換來的。 首先,全國有多少人,花多少時間、精力在搞這種編碼方案呢﹖據前幾年錢偉長 等先生頗為自豪地說,我國編碼隊伍有幾十萬人之多。第二,搞出幾百上千種編 碼方案來,各人要去宣傳、推銷、申請專利等等。遇到矛盾,產生利害衝突,又 要爭論、吵架,甚至打官司上法庭。這又要花費多少時間、精力和金錢呢﹖第三 ,也是最要命的一點,全國上億的人(特別是我們的中小學生)如果都來學習這 種死記硬背的編碼方案,每個人花一個月,算一算要花掉多少時間﹖(比如“五 筆字型”,宣傳者說幾個小時即可學會,但實際上很多人學了一個月還不會用, 騙人而已。)再進一步,如果子孫后代都學下去,中國人永遠要白白浪費這么多 時間、精力和金錢。真是可怕呀﹗   這樣比較下來,到底誰是傻瓜呢﹖
#6# 下一篇 返回目錄 ●資料●             南極星拼音連詞輸入法的又一新改進                           --同音詞的連續替換--                        陸丙甫Lu Bingfu bingfu@usc.edu   謝天蔚在“南極星拼音連詞輸入法的一個大飛躍”介紹了南極星 3.0新版本 連拼輸入法﹕輸入時眼睛不需要看最下面的一行。鍵入漢語拼音時,字母就出現 在所寫的那一行,一個詞寫完後,按一下 space bar字母就立即轉換成漢字。當 有同音字出現的時候,就出現在最下面一行供選擇。這一改進使南極星的輸入速 度從每分鐘32 個左右字提高到52 個字左右。   最近,南極星作者倪鴻波先生又對該軟件的輸入法作了一個很有意義的改 進,這就是“同音詞的連續替換”。   原來的輸入法中,如果有同義詞,就會出現在底行供選擇(可用空格鍵選下 一個同音詞或用數字鍵選後面的同音詞),一經選擇後選擇狀態就自動消失。新 的改進是在用空格鍵換了詞後繼續保持選擇狀態,容許挨次不斷替換下去。   例如輸入 shiji,按空格鍵後屏幕上就出現“時機”,同時在底行出現 了供選擇的一行同音詞﹕           _實際 1 事跡 2 世紀 3 史記 4 試劑 如果“時機”不是你所需要的,你可以直接根據每個同義詞前的數字按數字鍵 選擇替換。也可以直接按一下空格鍵,“時機”就自動轉換成下一個候選詞 “實際”,此時“實際”從底行中消去,底行成為﹕           _事跡 1 世紀 2 史記 3 試劑 如果還不是,再按一下空格鍵,“實際”就自動換成“事跡”,底行縮短成﹕             _世紀 1 史記 2 試劑 如此下去,一直到所有同音詞都選過消失為止。這就是說,“待選狀態”並不因 為替換過一次就馬上消失,而是繼續保留在那裡,直到你輸入新的字母,待選狀 態才自動消失。   這樣的好處是,在同音詞數量不多的情況下,不用看底行,只要“盲目地” 不斷按空格鍵替換下去,很快就會出現你需要的同音詞。在通常的情況下,特別 是選擇同音詞組時,由於同音詞組數量不多,一般不需要用眼睛選擇。根據本人 的經驗,絕大多數需要重新選擇的情況下,只要按一下空格鍵,替換上來的詞都 是正確的。少數仍然不對的情況下,在敲一下空格鍵,命中率也是相當高的。例 如打 shijian, 屏幕上出現“時間”,底行出現“_實踐 1 事件”,按一下空格 鍵“時間”替換成“實踐”,你發覺不對,再按一下空格鍵,“實踐”就替換成 “事件”。   漢語中 zhi, shi, ji, xi 的使用率非常高,因此由這些音節組成的同義詞 就比較多,這種情況下,只要加上聲調就可以大大縮小選擇範圍,如 shi2ji4, 就只會出現“實際”。如果還發生同音詞,再按空格鍵的命中率也相當高。   這個方法也適用於同音字。當然同音字往往數量很多,有時要按許多次空格 鍵才能得到所需要的字,還不如直接根據順序數字選。但如果是高頻率的字,則 也很容易按空格鍵迅速地得到。如打 zai 後得到“在”,同音字有 “_再 1 載 2 栽 3 災 4 仔 5 宰 6 哉 7 崽 8 甾”。 除“再”外,其他都不 是常用的,所以用“再”的情況下按一個空格鍵也就能得到。由於同義字是按頻 率排列的,同義詞也是按照第一個字的頻率排列的,總的說來,按空格鍵“挨次 換下去”的效率是很高的。這個,只有通過實際的使用才能有體會。   我覺得使用了“連續替換”後的速度有了明顯的提高,但還沒有作具體的統 計比較。   新版本的南極星還有其他一些改進,如原來的輸入法隔音符號的使用率很 高。按照漢語拼音慣例不需要隔音符號的地方,在原來的輸入法中都需要用上隔 音符號,如﹕“公安gongan、才能caineng、多年duonian、不能buneng、海南島 hainandao、頭腦tounao”,必須打cai'neng、duo'nian、bu'neng、hai'nandao、 tou'nao 才行。而現在不用加進這些隔音符號也能正確得到那些詞。        從純中文輸入轉入輸入英文時要按alt-F9、altF-6 兩次,推出英文狀態也要 按兩次。現在按一下 alt-F6 就可以進入英文狀態,再按一下 alt-F6, 又退出英 文輸入狀態而回到漢字輸入狀態。由於這個轉換是經常要用的,這一改進也提高 了不少效率。   南極星發展到這個地步,已經是接近本人多年來理想中的中文軟件輸入法了 。這種輸入法效率已經接近拼音文字的輸入。如剛纔講的“南極星……拼音文字 的輸入”這段話,我只要擊“nanjixing fazhandao zhege dibu,yijing shi j iejin benren duonian lai lixiang zhong d zhongwen ruanjian l.zhezhong shurufa d xiaoluu yijing jiejin pinyin wenzi d shuru.”。完全不用聲調, 利用適當的分詞連寫法就可以自動都正確轉成漢字。事實上,“南極星”只要打 njx 也能正確出來漢字,因為詞典中已經有這個詞。凡是詞典中收進去的三音節 詞,絕大多數只要打出聲母就可以了。極偶然出現同音三音節詞,按一下空格鍵 就可以了。四音節的成語只要輸入詞典,擊打出三個或四個聲母也都可以正確出 字。   嚴重阻礙中文輸入速度的問題,現在在南極星中都已經基本克服了。剩下的 問題是錦上添花的事情。讀者可以通過改進、修改自己的詞典(南極星增添新詞 和去掉舊詞均非常方便)和編寫縮寫詞典等方法不斷提高輸入速度。例如,我一 度覺得同音詞不是出現在底行,而是出現在光標的下一行,是非常重要的,因為 這樣輸入者的眼睛就不必上下大幅度移動。但其實這一點可以通過下移屏幕(光 標)把正在輸入的地方移到靠近底行來解決。   如果說還有比較重要的有待改進的地方,我覺得就是增加一些文字處理的智 能,使軟件能夠自動識別一些“變形”的詞。   拼音輸入的好處,除了不用特地學習之外(因為掌握正確的標準發音,本來 就是現代社會的基礎教育內容之一),就是對思維干擾最小。而要使這種干擾減 少到最小程度,就必須使輸入的節奏方式和口語節奏方式儘量一致。例如口語中 “聽得見、聽不見,看得透、看不透”各自是一個節奏單位,寫起來也應該按 tingdejian, tingbujian, kandetou, kanbutou 這樣的自然節奏,而不是 tin g de jian, ting bu jian, kan de tou, kan bu tou 這樣七零八碎的劃分節奏 。這樣的話,“聽得見、聽不見,看得透、看不透”和“聽見,看透”一樣,都 各自算一個詞。但這些“變形詞”也算作詞的話,詞典的收詞量就太大了。如果 把這樣的程序編進軟件,使軟件看到 tingbujian, tingdejian 就自動識別出其 “原形”tingjian, 並且知道插入的“變形成份”是“不、得”。這樣的話,可 以大大提高輸入效率而不必大幅度增加詞典容量。這樣的軟件也可以說是具有了 較強的智能。希望這一點也能在不久的將來得到實現﹗
#7# 下一篇 返回目錄             面嚮計算機的語言研究(二)                 國家語委 馮志偉   (2)復甦期(1970-1976年)﹕   在這個復甦期,研究者們普遍認識到,原語和譯語兩種語言的差異,不僅只 表現在詞彙的不同上,而且,還表現在句法結構的不同上,為了得到可讀性強的 譯文,必須在自動句法分析上多下功夫。   早在1957年,美國學者英格維(V.Yingve)在《句法翻譯的框架》 (Framework for syntactic translation)一文中就指出,一個好的機器翻譯系 統,應該分別地對原語和譯語都作出恰如其分的描寫,這樣的描寫應該互不影響, 相對獨立。英格維主張,機器翻譯可以分為三個階段來進行。   第一階段﹕用代碼化的結構標誌來表示原語文句的結構﹔   第二階段﹕把原語的結構標誌轉換為譯語的結構標誌﹔   第三階段﹕構成譯語的輸出文句。   第一階段只涉及原語,不受譯語的影響,第三階段只涉及譯語,不受原語的 影響,只是在第二階段才涉及到原語和譯語二者。在第一階段,除了作原語的詞 法分析之外,還要進行原語的句法分析,才能把原語文句的結構表示為代碼化的 結構標誌。在第二階段,除了進行原語和譯語的詞彙轉換之外,還要進行原語和 譯語的結構轉換,才能把原語的結構標誌變成譯語的結構標誌。在第三階段,除 了作譯語的詞法生成之外,還要作譯語的句法生成,才能正確地輸出譯文的文句 。   英格維的這些主張,在這個時期廣為傳播,並被機器翻譯系統的開發人員普 遍接受,因此,這個時期的機器翻譯系統幾乎都把句法分析放在第一位,並且在 句法分析方面取得了很大的成勣。   這個時期機器翻譯的另一個特點是語法(grammar)與算法(algorithm)分 開。   早在1957年,英格維就提出了把語法與“機製”(mechanism)分開的思 想。英格維所說的“機製”,實質上就是算法。所謂語法與算法分開,就是要把 語言分析和程序設計分開,程序設計工作者提出規則描述的方法,而語言學工作 者使用這種方法來描述語言的規則。語法和算法分開,是機器翻譯技術的一大進 步,它非常有利于程序設計工作者與語言工作者的分工合作。   這個復甦期的機器翻譯系統的典型代表是法國格勒諾布理科醫科大學自動翻 譯中心的機器翻譯系統。這個自動翻譯中心的主任沃古瓦(B.Vouquois)教授明 確地提出,一個完整的機器翻譯過程可以分為如下六個步驟﹕   (1)原語詞法分析,(2)原語句法分析,(3)原語譯語詞彙轉換,(4)原語譯語 結構轉換,(5)譯語句法生成,(6)譯語詞法生成。   其中,第一、第二步只與原語有關,第五、第六步只與譯語有關,只有第三 、第四步牽涉到原語和譯語二者。這就是機器翻譯中的“獨立分析-獨立生成- 相關轉換”的方法。他們用這種研製的俄法機器翻譯系統,已經接近實用水平。   他們還根據語法與算法分開的思想,設計了一套機器翻譯軟件ARIANE-78,這 個軟件分為ATEF,ROBRA,TRANSF和SYGMOR 四個部份。語言工作者可以利用這個 軟件來描述自然語言的各種規則。其中,ATEF是一個非確定性的有限狀態轉換器, 用于原語詞法分析,它的程序接收原語文句作為輸入,並提供出該文句中每個詞 的形態解釋作為輸出﹔ROBRA是一個樹型轉換器,它的程序接收詞法分析的結果 作為輸入,借助語法規則對此進行運算,輸出能表示文句結構的樹形圖﹔ROBRA 還可以按同樣的方式實現結構轉換和句法生成﹔TRANSF可借助與雙語詞典實現詞 匯轉換﹔SYGMOR是一個確定性的樹-鏈轉換器,它接收譯語句法生成的結果作為 輸入,並以字符鏈的形式提供出 譯文。   通過大量的科學實驗的實踐,機器翻譯的研究者們認識到,機器翻譯中必須 保持原語和譯語在語義上的一致,一個好的機器翻譯系統應該把原語的語義準確 無誤地在譯語中表現出來。這樣,語義分析在機器翻譯中越來越受到重視。   美國斯坦福大學威爾克斯(Y.A. Wilks)提出了“優選語義學” (Preference Semantics),並在此基礎上設計了英法機器翻譯系統,這個系統 特別強調在原語和譯語生成階段,都要把語義問題放在第一位,英語的輸入文句 首先被轉換成某種一般化的通用的語義表示,然後再由這種語義表示生成法語譯 文輸出。由于這個系統的語義表示方法比較細緻,能夠解決僅用句法分析方法難 于解決的歧義、代詞所指等困難問題,譯文質量較高。   (3)繁榮期(1976-現在)﹕   繁榮期的最重要的特點,是機器翻譯研究走向了實用化,出現了一大批實用 化的機器翻譯系統,機器翻譯產品開始進入市場,變成了商品,由機器翻譯系統 的實用化引起了機器翻譯系統的商品化。   機器翻譯的繁榮期是以1976年加拿大蒙特利爾大學與加拿大聯邦政府翻 譯局聯合開發的實用性機器翻譯系統TAUM-METEO正式提供天氣預報服務為標誌 的。這個機器翻譯系統投入實用之後,每小時可以翻譯6萬-30萬個詞,每天 可以翻譯1500-2000篇天氣預報的資料,並能夠通過電視、報紙立即公 布。TAUM-METEO系統是機器翻譯發展史上一箇里程碑,它標誌著機器翻譯由復 蘇走向了繁榮。   日本富士通公司開發的ATLAS-I(Automatic Translation System-I)系統 是一個建立在大型計算機上的英日機器翻譯系統,該系統以句法分析為中心,可 進行科學技術文章的翻譯,在FACOM M380計算機上,每小時可翻譯60000詞。   日本富士通公司開發的ATLAS-II機器翻譯系統也建立在大型計算 機上,但其翻譯方式與ATLAS-I不同。ATLAS-I以句法分析為 中心,而ATLAS-II則以語義分析為中心。該系統目前用于日英機器翻 譯。   此外,日本的實用化機器翻譯系統還有﹕日立公司開發的HICATS(Hit achi Computer Aided Translation System)英日、日英機器翻譯系統,日本電 氣公司開發的PIVOT英日、日英機器翻譯系統,三菱電機公司開發的MELTRAN日英 機器翻譯系統,沖電氣公司開發的PENSEE日英機器翻譯系統,理光公司開發的RMT 英日機器翻譯系統,三洋電氣公司開發的SWP-7800日英機器翻譯系統,東芝公司 開發的TAURAS英日機器翻譯系統,日本布拉維斯公司(BRAVICE INTERNATIONAL) 研製的BRAVICE PAK 11/73日英機器翻譯系統等。   歐美除TAUM-METEO機器翻譯系統之外,還陸續推出了一批實用化的機器翻譯 系統。   法國紡織研究所的TITUS-IV系統,可以進行英、德、法、西班牙等四種語言 的互譯,每種語言都有一部14000個詞的機器詞典,每秒鐘可譯240個詞,主要用 于翻譯紡織技術方面的文獻。   美國在喬治敦大學機器翻譯系統的基礎上,進一步開發了大型的機器翻譯系 統SYSTRAN,已提供試用。例如,提供給美國空軍的SYSTRAN系統,詞典有16萬 8千個詞干形式和13萬6千個詞組,可進行俄英機器翻譯,每小時可翻譯15 萬詞﹔提供給美國拉特塞克(Latsec)公司的SYSTRAN系統,可進行俄英、英俄、 德英、漢法、漢英機器翻譯,每小時可譯30萬-35萬個詞。SYSTRAN是目前 應用最為廣泛、所開發的語種最為豐富的一個實用化機器翻譯系統。   美國羅各斯(LOGOS)公司開發的LOGOS-III機器翻譯系統,可進行英語- 越南語機器翻譯和英俄機器翻譯,詞典有10萬個詞。   美國國家航空和航天的NASA系統,可進行俄英和英俄機器翻譯。   美國魏德納(WEIDNER)通訊公司WCC的WEIDNER機器翻譯系統,可進行英語 與法語、英語與德語、英語與西班牙語、英語與葡萄牙語之間的雙向機器翻譯, 並可進行英語-阿拉伯語的單向機器翻譯。   設在華盛頓的泛美衛生組織研製成的PAHO系統,可進行西班牙語-英語的機 器翻譯。從1980年以來,已經翻譯了100多萬詞的資料。近來,他們又推 出了ENGSPAN和SPANAM兩個實用化系統。   德國西門子(SIMENS)公司與美國德克薩斯大學(TEXAS University)合作, 研製成METAL系統,可進行德英機器翻譯,詞典包含1萬個詞條。   德國薩爾大學(Universitat des Saarlandes)研製成SUSY(Saarbrucken Automatic Translation System)系統,以德語為中介,可以進行俄語、英語、 法語、世界語的機器翻譯。比如,由英語譯成法語,首先要由英語譯成德語,再 由德語譯成法語,每小時可譯15000詞。   此外,還有一些大規模的機器翻譯系統正在研製之中,例如,EUROTRA計劃、 Mu系統、ODA計劃、DLT系統等。   1978年,歐洲共同體在繼續使用和發展SYSTRAN系統的同時,提出了歐共 體內七種語言(後來變為九種)之間進行任何一方向翻譯的多語機器翻譯計劃 EUROTRA,此計劃于1982年正式實施,前後延續了十多年,至今尚未達到預 期的結果。   日本在提出第五代計算機計劃的同時,于1982年至1986年由政府開 展了英日、日英機器翻譯Mu系統的研製,接著,又由通產省出面,組織與亞洲四 個鄰國(中國、印度尼西亞、馬來西亞、泰國)合作研究日語、漢語、印度尼西 亞語、馬來語、泰語五種語言互譯的多語言機器翻譯ODA計劃,原定于1987 年至1992年完成,現在延長至1995年初完成。   歐洲共同體在1982年開始實施EUROTRA計劃的同時,還支持了多語言機器 翻譯系統DLT的可行性研究。從1984年開始,改由荷蘭政府和荷蘭的一家軟件 公司BSO各出資一半對此系統的研製進行長期的支持,從1984年到1992年 每年投資均在100萬美元左右。DLT系統原打算九十年代中期開始實用化,可是 至今尚未得到滿意的結果。
#8# 下一篇 返回目錄 ●書評●              評馮志偉教授的兩本書         梅維恆(V.H.Mair 美國賓夕法尼亞大學教授)   最近讀了馮志偉教授新出的兩本關于中文信息處理的書,一本是《現代漢語 和計算機》(Modern Chinese Characters and Electronic Computer,北京大 學出版社1989年出版,2+9+210頁),一本是《中文信息處理與漢語研究》 (Chinese Information Processing and Research on Sinitic,商務印書館 1992年出版,2+217頁),此書是《漢語知識叢書》(Sinitic Knowledge Series)之一。   1992年出版的第二本書實際上是在1989年出版的第一本書之前寫的 ,只是因為交稿之後出版時間拖得太長,作者只好將其中的一部份內容改寫,另 尋其他渠道先發表出來。《中文信息處理與漢語研究》(以下簡稱《中文信息》 )一書論述的內容涉及到現代標準漢語(Modern Standard Mandarin,以下簡稱 MSM)信息處理的各個方面,而《現代漢字和計算機》(以下簡稱《現代漢字》) 一書則把《中文信息》頭兩章的內容進一步加以充實和提煉,擴充改寫為五章, 專門討論漢字信息處理的問題。   《現代漢字》一書的重點在于討論漢字的性質及其在計算機處理中的遇到的 各種障礙。   這兩本書有許多豐富的材料值得我們加以評述。限于篇幅,這裡,我祇想對 我讀了這兩本書之後印象最深的幾個問題作出簡要的評論。   眾所週知,詞的概念對于有效地進行自然語言處理是十分重要的。可惜的 是,漢字連書對于明確地劃清詞的界限是極為不利的,因而漢字給信息處理專 家和計算機技術人員造成了巨大的障礙。   在閱讀這本書的時候,我認識了現代標準漢語(MSM)中的一個新詞── “熵”。這個新詞是用來翻譯英文“entropy”或“ information content ”的 (後者也可譯為“信息量”)。馮志偉計算出,一個漢字的熵為9.65比特, 而其他語言相比,法語一個字母的熵為3.98,意大利語一個字母的熵為 4.00比特,西班牙語一個字母的熵為4.01比特,英語一個字母的熵為 4.03比特,德語一個字母的熵為4.12比特,俄語一個字母的熵為4.35 比特,漢字的熵大得驚人。有些讚揚漢字的人宣稱,漢字的熵這樣大,似乎對 于信息處理大好好處。然而,馮志偉卻提出了與此完全不同而又令人信服的觀 點。他在書中直言不諱地解釋道﹕   “漢字的熵如此之大,對于通信技術和漢字信息處理工作都極為不利。根據 申農(Shannon)信道編碼定理,在一種非擴展的無記憶信源中,碼字的平均長度 不能小于信源的熵。漢字的熵值大,其相應的碼字的平均長度也就很大,即使是 一個最優的信道編碼系統,其碼字的平均長度至少也要與漢字的熵相等,這就必 然要影響到通信的效率。在漢字信息處理中,漢字的輸入輸出是一個關鍵問題, 漢字的熵值大,其輸入輸出的信息量也就很大,這就給漢字的輸入輸出帶來很大 的困難。儘管現在已經研製出了一些漢字輸入輸出設備,但其工作效率比英文或 俄文輸入輸出的工作效率差得多。因此,我們一定要搞好現代漢字的規範化、標 准化,嚴格限制常用漢字的數量,使漢語的書面形式適應現代科學技術發展的要 求。”(《現代漢字》,P207)   漢字的熵大得使有效的信息處理難于接受,而漢字的書寫系統的多余度(R edundancy)卻小得令人沮喪。書中指出,書面漢語的多余度為56-74%, 而書面英語的多余度卻為67-80%。這意味著,與拼音文字的信息處理相比 ,在漢字信息處理中,容易出現更多的差錯、錯誤和歧義的麻煩。   本文作者的評論將嚴格地限制在現代標準漢語( MSM)的範圍內,因為對于 漢語其他變體的信息處理問題 ,至今實際上還沒有作過任何的評價。如果一個 人能夠用科技術語和數學方程式來論述他的對于現代標準漢語(MSM)的觀點, 那么,這樣的論述當然應該是非常雄辯而有說服力的。不過,我卻樂于通過直覺 和觀察的方法來研究,經過我自己也有了一個比較科學的基礎。根據我的經驗, 我曾經斷言,漢字的平均筆畫數應該是12畫,二十年來對于漢字的這種低效率 的質特性的直觀感覺和細心觀察,我的研究現在馮志偉在他的書中已經證實,簡 化漢字標準集的平均筆畫數與我在過去宣佈的結論幾乎完全相同,而如果考慮到 被簡化的繁體字,這個平均筆畫數只是比12畫稍微高一些。這樣的不謀而合真 使我高興萬分。   在現代生活的背景之下,這種繁雜而低效率漢字使中國在所有的科技和貿易 的競爭中處于十分不利的地位。(這大概就是為什么中國和日本的科學家只有當 他們到西方在拼音文字的環境下工作時才得到諾貝爾獎金的原因。日本在工業、 財政和商貿領域採取儘量使用英語或羅馬化的日語的辦法,巧妙地避開了這個問 題。)為了支持這個註定要瓦解的系統──正如兩千年前埃及的象形文字、蘇末 人和赫梯人的圖畫表意文字在遇到拼音文字時就崩潰一樣──漢字的維護者們正 在要求世界其他地方的人為此付出代價。Unicode(通用編碼)採用2字節/8 比特的代碼,其主要目的就是為了遷就漢字。顯而易見,這樣做的結果,它的開 銷是ASCII碼的兩倍而效率(速度)則是ASCII碼的一半,而英語、法語、德語、 俄語等語言採用1字節/8比特的代碼就綽綽有余了。請看下面Unicode代碼空 間資源的分配情況,這種分配具有諷刺意味的比例清楚地說明問題的嚴重性﹕   1.全世界的一切拼音、音節、語音系統分配8,192個碼點﹔   2.標點符號、數學運算符號、通用技術符號和裝飾標誌符號分配4,096 個碼點﹔   3.中文注音字母、日文假名、朝鮮諺文、漢字標點符號分配4,096個碼 點﹔   4.私人用戶代碼分配3,584個碼點﹔   5.漢字分配45,056(11)個碼點,真是其大無比。   這樣的局面是可笑的,同時又是可悲的,它將會給中國和世界的其他地方在 經濟上帶來可怕的後果。   正如馮志偉指出的,我們應該面對現實,停止給一個處于崩潰邊緣的系統分 配如此不均衡的資源。為了對付由于過時的字符而造成的危機,作為第一步,我 們首先要把計算機用字的字模嚴格限制在 6,500個以內,這 6,500個漢字可覆蓋 現行通用書面文章的99.9%。十年以後(在2005年),這個字數減少到3,000 個, 可覆蓋現行通用書面文章的99.15%(極小量的不足部份可以採用羅馬化的替換 方法和其他的調節方法來補足)。再過十年以後(在 2015 年),這個字數減少 到 1,500個,可覆蓋現行通用書面文章的94.67%。這樣做,不僅會給中國和全 世界在經濟上帶來好處和實惠,而且,數億中國兒童將不必再記憶那些數目巨大 而並非必須記憶的漢字,擺脫單調乏味的記憶之苦。我預見到,在第三個階段的 目標完全實現之後,也就是到2020年,英語和拼音化的現代標準漢語(MSM)以 及其他的中文信息處理系統將成為中國電子信息處理中大多數科學工作者和商貿 人員的第一選擇。至于電子信息處理領域之外漢字的處境,那將完全是另外一回 事。作為一種書面的文字,漢字在很長一段時間內大概還會繼續保持其生命力。 作為一種書法藝術,漢字還將保持更長的時間。作為一種學者們的研究對象,至 少在一千多年的時間內,漢字大概還會繼續起作用,在某些特點的領域,漢字也 許會成為永恆的研究主題。   (YBY譯自 Sino-Platonic Papers,46,Philadelphia,USA,July,1994)
#9# 下一篇 返回目錄 ●拼寫實驗●          Daazi Gei Canji Ertong Dailai Xingfu            (打字給殘疾兒童帶來幸福)                .Maoge.
  1965 nian, Ireland(愛爾蘭) chushengle yi ge zh□ngd□ canji ertong, mingzi jiao Nolan(諾蘭). Ta jiangsheng de shihou, youyu nanchan, danao shiqu yangqi g□ngj□ you liangge xiaoshi, shii ta chengle zhongdu canji ertong. Ta t□ub□ yixia, quanshen meiyou yi chu nenggou huodong, ye bu hui shuohua, zhiyou yanjiang neng huodong. W□nx□ng de shi, danao de zh□l□ hai zhengchang. Zai quanjia he shehui wuweibuzhi de aihu he naixin de guanhuai xia, ta de zhili dedao le hen hao de kaifa.

  Danshi ta gen shuohua w□yu□n, zenme gen bieren jiaoliu sixiang ne? Shi daazi geile ta xingfu. Bieren ba yi ge dai xiangpitao de xiao g□nzi guding zai ta de t□ubu, ta kao bozi de dongzuo daazi lai biaoda ziji desixiang.

  Ta zai yong daaziji chuangzuo de di-1 shou shi zhong xiedao:

    Wo shi yi ge tanhuan'er

      Ji□ngy□ng rutong mutou.

    Renmen gei wo guwu he anwei,

      Danshi tamen xinli shifen qingchu:

    Wo zhongjiu shi yi ge ch□ng bu li□o qihou de canji'er.

    Bu wo c□n er bu f□i,

      Yidan wo rang tamen kan q□ng wo de xianzhuang,

      Tamen jiu hui mingbai ziji shi cuwu de,--

    Wo yijing neng yong tou dazi le﹗

  Ta de wanqiang yizhi tongguo daazi zhanshengle ta de zhongdu canji.70 niandai, ta de chuangzuo kaishi hongdongle Yingguo, haoduo ci huode j□gao de r□ngy~[7~] he jiangli, ye yinci wenming quanqiu.


#10# 下一篇 返回目錄              談談同音單位的定型分化             --評 Maoge 的拼寫實驗--               陸丙甫 (bingfu@usc.eu)   Maoge 的這篇拼寫實驗,我是完全看得懂的。可惜,速度不快。這是現行漢 語拼音的主要弱點﹕不是說不能讀,問題是讀起來不順暢,要“邊讀邊猜”,比 較費勁。改進拼寫和連寫形式,是緩和這個矛盾的途徑之一。   文中把“打字”拼作 daazi(可將“大”、“打”兩個常用字明確區分開 來),將“使”拼作 shii,都有減少猜測的作用。這是從前北拉(北方話拉丁 文)的聰明作法,值得繼承。記得北拉中還把“再”拼作 zaai(以區別于同為 常用字的“在”),也是很解決問題的。漢語拼音郵政地名,把“山西”、 “陝西”分別拼為 Shanxi 和 Shaanxi,也很管用。這種寫法分化可以進一步擴 大。如果有二、三十個常用而易混淆的音節語素能夠這樣定型化,就可大大減少 “邊讀邊猜”的程度,極大地提高閱讀速度。拼音中文看上去也就更像“正式文 字”了(任何一種成熟的拼音文字都有一些約定俗成的定型化特殊拼法)。   但是這種拼法分化(定型化)必須嚴格控制。如果同音漢字普遍採取定型分 化,那就是“漢字拼音化”,而不再是“漢語拼音化”了。英語音節的拼法是非 常豐富多采的,同一音節往往有多種拼法。這固然有方便閱讀的一面,但普遍的 一音多拼也導致了混亂,造成學習的麻煩,往往為某些教育界人士和語言學者所 詬病。其實英語的同音多拼,最起作用的也不過是 right、write,know、no, knew、new,not、knot,night、knight 和 I、eye 等常用詞的分化,大部份同 音分化是沒有效果不明顯甚至徒增麻煩的。所以拼音中文,一方面不必完全拒絕 同音詞的拼法分化和定型化,另一方面自也不必將所有或大部同音詞、字都在拼 法上分化。可以採取“從嚴控制、逐漸開放”的方針,主要局限于一些出現率很 高的常用字、詞。首先需要分化的包括“有、右”,“心、新、信”,“一、 億”,“是、時、使”等等,並不很多。這樣才能以最小的(讀、寫一致性方面 的)犧牲,來換取最大的(避免歧義猜測)的受益。隨著定型分化數量的增加, 效果逐漸減弱而說、寫不一致的弊病逐漸增加,所以要謹慎地、在約定俗成的原 則下嚴格控制。   在文字改革的陣線中,可以分兩大派。一派就是“漢字拼音化”,另一方派 則是“口語拼音化”。前者主張儘量把同音單位定型分化,後者認為既然口語交 際中同音單位不成問題,拼音文字也不必分化同音字。兩種意見都有一定道理, 但都不能絕對化。一方面,文字的基礎畢竟是口語,書面寫法上過多地採取口語 中所不存在的區別,是不妥的。(當然 daa、da 的區分,其實還反映聲調的不 同,zaai、zai 的分化,才是口語中所基本不存在的分化。但是北京話中的 “在”往往輕讀,從這個角度來說,它們的定型分化仍不是完全無中生有)另一 方面,書面語畢竟也有許多不同于口語的地方,雖然不比口語生動,但表達的內 容往往比口語細緻、精確,漢語作為有悠久書面歷史的語言尤其如此。因此我們 主張“基本上寫、讀一致,適當分化同音單位”的作法,或者說“口語為主、兼 顧漢字”的作法。   文中把“一個、兩個”分別拼為 yi ge、liangge,不協調。是否可以統一 為“yi-ge、liang-ge”。yi-ge,出現率特高,不妨簡化為 ige 甚至 ig,簡化 的同時得到了定型化,便于快速識別。具體落實定型化,或者是繁化,或者是簡 化,兩條腿走,多一個手段,比一律繁化好,有利于拼法豐富化。    “譽滿全球”為成語,可拼為 yuman-quanqiu。“成不了”實為一詞,可 全連成 chengbliao (“不”簡化定型為 b)。   必須明白,漢語拼音不管如何改進,終究不能完全替代漢字的功能(當然另 一方面,它又有許多漢字所不具備的重要功能)。拼音中文的目的是為了應付日 常工作、生產、生活的一般需要,而不是在所有的場合都代替方塊字。所以我們 不必、也不該採取普遍的同音分化。   正像漢字不能也不必在所有場合代替甲骨文,白話文不能也不必在所有場合 代替文言文,簡化字不能也不必在所有場合代替繁體字一樣,拼音中文將不可能 也不必要在所有場合同漢字對應起來。今天我們在特定的場合還是需要使用甲骨 文,但誰能否認甲古文以後的那些語言文字改革呢﹗並且拼音文字一旦進入實用 階段,在失去某些功能的同時,必然會在廣泛的實際運用中不斷改進發展出其它 一些方面的新功能,例如方便地吸收各地方言中一些用漢字難以寫出的生動詞彙 ,方便地吸收外來語等等,拼音文字這方面的巨大潛力恐怕遠超出多數人的想象 。   不像理解,初始階段的拼音文字同成熟的漢字相比,弱點是明顯的,但是它 的潛力卻不是一下子能夠顯示和實現的。我們必須放遠目光,開闊思路,才能充 分預見到到它那巨大的適應能力。                                                        
#11# 下一篇 返回目錄 ●來往信件●             美洲中國文字改革促進會           1995年10月22日給會員和會友的信 各位會員和會友﹕   謹隨函寄上《語文與信息》第3和第4期。本會從今年2月起同北京市語文現代 化研究會合作在北京出版《語文與信息》雙月刊。目的在于擴大影響,團結語文學 界和信息學界,共同為中國語文現代化而努力。   當前的情況是,中國語文現代化的需要越來越引起國家當局和民眾的注意。但 實際進展緩慢,似乎難以滿足普及教育和提高教育水平、吸收先進技術、語文接 軌、儘快進入信息時代等迫切需要。中文在電腦輸入、輸出和檢索方面由于必須使 用不同的手段而日益陷于難以為繼的困境。   鑒于INTERNET(交互網)的使用日益普及,為了接觸更多的潛在讀者,本會已 在今年9月在INTERNET上出版《語文與信息》第一期。今後將繼續發行INTERNET版。 歡迎各位提供e-mail地址,以便由本會直接寄上INTERNET版。   NJSTAR(南極星)中文軟件的最新基本版(ver. 3.04)是一套很好的中文軟件。 特別適合用來看《語文與信息》的INTERNET版。本會已征得NJSTAR軟件開發者倪鴻 波先生的同意,由本會代銷售該軟件,一方面使讀者能夠使用該優良軟件,另一方 面則讓本會得到一些經費收益。各位自己或朋友如願意購買該軟件,請寄給本會 99美元(支票抬頭WENCUHUI,並請註明用來購買NJSTAR)。如需要有關技術資料, 請來信或e-mail索取.   最後,各位如尚未繳交本年的會費,請補寄25美元給本會(支票抬頭 WENCUHUI)。本會衷心感謝各位一貫的熱心支持,希望一起為中國的語文現代化 而奮鬥。歡迎各位來信提出意見、撰寫稿件、和介紹本會的活動。                     執行幹事 吳文超 Apollo Wu
#12# 下一篇 返回目錄 【語文與信息】存入萬維網(WWW) 吳文超 先生﹕ 我已將【語文與信息】製作成 HOMG PAGE 放入萬維網(WWW)中,其地址是﹕     http://www.njstar.com.au/njstar/                  倪鴻波 Hongbo Ni


#13a# 下一篇 返回目錄 ●消息●動態●頭條 ▲“英漢扑克”簡介  “中國英漢詞語橋牌”,簡稱“英漢扑克”、“中國橋牌”,原名“漢語拼音 扑克”,又稱“文字游戲”,是北京良鄉中學教師雷震發明的新型智力扑克。它 寓知識于娛樂之中,是快樂教育的一種好形式,也是一個新興的科學的高等競技 群眾體育項目。它與圍棋、中國象棋、國際象棋和國際橋牌一樣,可以進行多種 類型的比賽。   該牌由26個拉丁字母組成,把英語、漢語拼音和數學的知識內容,借用廣 大群眾喜聞樂見的扑克牌形式表現出來。通過變化多端的排列組合,可以拼出全 部英語單詞全部漢語拼音音節及許多數學運算題,對激發學生學習興趣、鞏固所 學知識、推行漢語拼音方案、推廣普通話、“注音識字、提前讀寫”、掃除文盲 以及外國人學習漢語等能起到極大的幫助作用。   有關專家認為,它具有嚴密的科學性、豐富的知識性、激烈的競賽性、高尚 的趣味性和廣泛的群眾性。著名語言學家王力先生曾預言﹕“英漢扑克在全國廣 大人民群眾中普遍流行之日,將是漢語拼音方案被全國廣大人民群眾基本掌握之 時。” (知恩) #13b# 下一篇 返回目錄 ▲美國大學圖書館面臨挑戰   美國加利福尼亞州立大學建造的新校園沒有圖書館。校長巴裡說,我們要把 錢更好地用在通過計算機得到信息技術上,根本用不著把錢浪費在磚頭、泥漿和 昂貴的圖書館上。美國各大學都在努力實現全面信息聯網,近幾年來,在管理功 能和教學方式上發生了全面的變化。   賓夕法尼亞大學宿舍的每張床有4個插座,一個是有線電視插口,一個是連 接信息網的插座,一個是普通電話線插座,還有一個是連接私人電話線路的。許 多別的學校也有類似的佈置。   現在,學生能夠在觀看有線電視教學節目的同時,接通互聯網絡線路,同時 還能在電話上聊天。學生在宿舍裡查看聯機卡片目錄,預借一本書。學生無須到 辦公室去就能了解自己的學習情況或辦理改變課程等手續。教師通過電子郵件布 置作業﹔學生能更加自由地與教授交流。辦公時間的傳統觀念也在逐步消失。 (Zx摘自《科技日報》1995-03-02第8版) #13c# 下一篇 返回目錄 ▲1994年日本銷售個人電腦320萬臺   據最近公佈的關于日本個人電腦市場規模的統計數字,1994年日本個人電腦 銷售量比1993年增長30.0%,達到320.5萬臺。年度銷量首次突破了300萬台大關, 徹底擺脫了進入90年代後,個人電腦銷量一直在200余萬臺徘徊不前的停滯局面, 進入了高速增長期。 (Zx摘自《科技日報》1995-02-15第8版) #13d# 下一篇 返回目錄 ▲評選﹕“五筆字型”榜上無名   有關專家們介紹說,“五筆字型”技術只是數百種漢字輸入技術中的一種, 不管是在80年代初,還是在現在,它都不是最佳的方案。專家陳一凡介紹說, 1986年,國家科委、國務院電子振興辦公室、國家標準總局和中國中文信息 學會等有關部門組織專家對國內已上機使用的51種漢字輸入方案進行一次技術 評測,最終評選出11種“A”的漢字編碼方案,而“五筆字型”則榜上 無名。(Zx摘自《民主與法制》1995年第3期)
#14#  返回目錄 <語文與信息> 交互網版出版單位:             美洲中國文字改革促進會
        Meizhou Zhongguo Wenzi Gaige Cujinhui (Wencuhui)

 Association in America for the Promotion of Chinese Language Reform

        PO Box 334, Scarsdale, NY 19583, USA

    執行幹事﹕Mr.Apollo Wu吳文超Tel. & Fax: 914-725-5527

    國內: 100010 北京朝內後拐棒衚衕甲二號

《語文與信息》編輯部電話: 0086-1-5250337; FAX: 0086-1-5138634

《語文與信息》美洲聯合編輯﹕(請向下面任何一位編輯聯係和投稿)

    吳文超 Apollo Wu  wengai@aol.com

    謝天蔚 Xie Tianwei twxie@ucdavis.edu

    陸丙甫 Lu Bingfu  bingfu@usc.edu

返回目錄         □完□


This HTML version is converted by Hongbo Ni - Author of NJSTAR Chinese Word Processor