四川省科學(xué)技術(shù)協(xié)會(huì) 錢玉趾
文字記錄語(yǔ)言,是傳輸信息的重要工具。世界已經(jīng)跨入電腦為特征的信息時(shí)代,語(yǔ)文應(yīng)該跟上這個(gè)時(shí)代,也就是說(shuō),語(yǔ)文的現(xiàn)代化,必須適應(yīng)高度信息化的要求。文字與書寫工具之間有一定的聯(lián)系和相互制約的關(guān)系,古代的蘇美爾人用蘆葦或骨棒在泥板上"壓寫"楔形文字,而印歐文字、漢字等是用筆"劃寫"出來(lái)的。在電腦時(shí)代,文字主要通過鍵盤"觸寫"出來(lái)。鍵盤上有26個(gè)字母鍵,10個(gè)數(shù)字鍵和其他符號(hào)鍵。人們敲擊這些鍵符,就能書寫、傳輸和存貯文字符號(hào)。英文是由26個(gè)拉丁字母按線型排列書寫的文字,用電腦鍵盤"觸寫",可以說(shuō)是珠聯(lián)璧合,得心應(yīng)手。我國(guó)的漢字,是由筆畫按平面組合的一種二維圖形。其特點(diǎn)是漢字的平均筆畫多、結(jié)構(gòu)復(fù)雜,總字?jǐn)?shù)多,而且一字一音,全靠死記硬背,不能直接用電腦進(jìn)行信息處理,必須先將漢字進(jìn)行編碼才行。現(xiàn)有的漢字編碼(包括形碼、音碼、音形碼),可以將漢字輸入電腦,在一定的范圍傳輸、存貯和輸出,在排序和情報(bào)檢索方面還無(wú)能為力。所以,實(shí)際上漢字編碼只使電腦變?yōu)橐环N漢字打字機(jī),并且是效率不太高的打字機(jī)。
文字信息處理技術(shù)可分為三種方式:一、鍵盤處理;二、字符識(shí)別;三、語(yǔ)音識(shí)別。漢字編碼只能用于鍵盤處理的某些部分(不是全部),不能用于更高級(jí)的字符識(shí)別和語(yǔ)音識(shí)別方面。所以,漢字編碼只是使文字信息處理技術(shù)處于低級(jí)階段。在這種情況下,有人設(shè)計(jì)了一種漢字編碼,可應(yīng)用于電腦打字,就宣布說(shuō)使古老的漢字"趕上了電腦時(shí)代","在信息時(shí)代重光了",這相當(dāng)于在社會(huì)主義初級(jí)階段宣布進(jìn)入了共產(chǎn)主義一樣幼稚可笑。
在字符識(shí)別方面,光學(xué)字符識(shí)別機(jī)對(duì)于拉丁字母和阿拉伯?dāng)?shù)字的印刷體,采用16×16或18×20點(diǎn)陣就行,而方塊漢字的印刷體,用60×60點(diǎn)陣還不夠。識(shí)別英文只需識(shí)別26個(gè)字母。在日本,識(shí)別50個(gè)假名和2000個(gè)漢字,識(shí)別字符的數(shù)量約是英文字符的80倍,加之漢字結(jié)構(gòu)的復(fù)雜性,日本專家估計(jì):日本漢字識(shí)別的難度是拉丁字母的500倍。我國(guó)專家估計(jì),識(shí)別中國(guó)一、二級(jí)漢字的難度將是拉丁字母的2000倍[1].
漢字不是拼音文字,在語(yǔ)音識(shí)別方面更為困難,現(xiàn)有的編碼也不能用于語(yǔ)音識(shí)別。在機(jī)器翻譯方面,我國(guó)1957年開始研究,至今近40年,成績(jī)不小。但是翻譯質(zhì)量還不十分令人滿意,一些稍長(zhǎng)的句子或結(jié)構(gòu)復(fù)雜的句子,譯文質(zhì)量就較差,有時(shí)簡(jiǎn)直不能卒讀[2]。曾有人指出:"采用方塊漢字中文-外文翻譯系統(tǒng),即使勉強(qiáng)實(shí)現(xiàn),也將是世界上造價(jià)最高、效率最低的機(jī)器翻譯系統(tǒng)。[3]"要解決機(jī)器翻譯的質(zhì)量問題,提高機(jī)器的智能化是一個(gè)方面,更重要的是要有一種精密而單義的漢語(yǔ)拼音文字所表達(dá)的形式語(yǔ)文,可惜現(xiàn)在沒有。
世界進(jìn)入了信息時(shí)代,真正有用的信息將是具有跨文化傳通功能的信息,并且是高度精密、高度可靠的信息。作為這種信息載體的語(yǔ)言文字,也必須具有跨文化傳通的功能,高度精密、高度可靠,能滿足信息處理技術(shù)三種方式的要求,能滿足機(jī)器翻譯的高質(zhì)量的要求。
符合高度信息化要求的漢語(yǔ)拼音文字,具體地說(shuō),我們認(rèn)為,應(yīng)該滿足以下條件:
一、采用26個(gè)國(guó)際通用的拉丁字母,從左至右,線型排列;
二、漢語(yǔ)是有聲調(diào)的語(yǔ)文,其音節(jié)應(yīng)該使用字母妥善地標(biāo)明聲調(diào);
三、妥善分化同音詞,拼音詞與方塊漢字詞應(yīng)基本上一一對(duì)應(yīng),沒有同形詞;
四、為了便于識(shí)讀和理解(包括人和機(jī)器的識(shí)讀理解),詞匯應(yīng)有標(biāo)明詞性詞義之類的詞綴,并按詞分寫。
五、有科學(xué)合理的正詞法及語(yǔ)法規(guī)則。
當(dāng)然,上述條件不是一成不變的,在其些場(chǎng)合為了簡(jiǎn)便快捷,音節(jié)可有簡(jiǎn)化形式,詞語(yǔ)可有縮略式等等。
漢語(yǔ)拼音文字既然是一種拼音形式的文字,就應(yīng)該具備拼音文字必須具備的特點(diǎn)。我們不妨分析一下世界上主要語(yǔ)種的文字。
印歐語(yǔ)系的絕大多數(shù)文字都具有表示詞性的詞尾或冠詞。西班牙語(yǔ)的名詞的性可根據(jù)詞尾辨認(rèn),以?結(jié)尾的名詞,一般都是陽(yáng)性,以?結(jié)尾的名詞,一般都是陰性,冠詞放在名詞之前,表示名詞的性、數(shù)等等。形容詞的性和它所修飾的名詞的性、數(shù)相一致,修飾陽(yáng)性名詞時(shí)以?結(jié)尾,修飾陰性名詞時(shí)以?結(jié)尾。動(dòng)詞的原形動(dòng)詞都以-ar、-er、-ir結(jié)尾(分別稱為第一、第二、第三變位動(dòng)詞)。
德語(yǔ)的名詞是用冠詞來(lái)表示的,而且,名詞的第一個(gè)字母必須大寫,這些名詞的特征更強(qiáng),如陽(yáng)性名詞:der Mann(男人、夫);陰性名詞:die Frau(婦女)。德語(yǔ)的形容詞與西班牙語(yǔ)類似,也必須與名詞的性、數(shù)和格一致。德語(yǔ)的動(dòng)詞的不定式,是由動(dòng)詞的詞根加后綴-en或n構(gòu)成。
世界語(yǔ)的單數(shù)名詞以-o結(jié)尾,陰性名詞以-ino結(jié)尾;形容詞以-a結(jié)尾;動(dòng)詞不定式的詞尾都是-i,其現(xiàn)在式、過去式等等都有明確規(guī)定。
英語(yǔ)的名詞也有自己的特點(diǎn),約有50個(gè)習(xí)用詞(稱為名詞限定詞),主要作用是標(biāo)明其后的詞是名詞。表示人的名詞有相應(yīng)的后綴,還有專門表示女性名詞的后綴。英語(yǔ)的形容詞也有專門的構(gòu)詞后綴。英語(yǔ)中的名詞、動(dòng)詞、形容詞相互轉(zhuǎn)類都有一定的規(guī)則。
日本在古代借用中國(guó)的漢字作為書寫文字,初期全用漢字,在平安時(shí)代產(chǎn)生了假名。現(xiàn)代日文是漢字假名混用的文字。日本借用漢字并沒有照搬,而讓有些漢字詞長(zhǎng)了尾巴。日語(yǔ)的動(dòng)詞以う段音結(jié)尾,如:會(huì)ぅ(會(huì)見)、行く(去)、踴る (跳)、打つ(打)、踏む(踩);日語(yǔ)的形容詞都以假名字母い結(jié)尾,如:赤い(紅的)、甘い(甜的)、高い(高的)、美しい(美的)。此外,還有一些助詞,在句子中起到確定主語(yǔ)、賓語(yǔ)、謂語(yǔ)等等的語(yǔ)法作用。
漢語(yǔ)拼音文字加上詞性詞義的詞綴,主要的作用是使文字變得精密,能準(zhǔn)確表達(dá),便于識(shí)讀和機(jī)器翻譯,同時(shí)還可以與區(qū)分同音詞結(jié)合起來(lái)考慮。可謂一舉兩得。例如:"父女兩個(gè)談枇杷"、"婦女兩個(gè)彈琵琶"兩句,其中詞性相同的"父女"與"婦女","談"與"彈","枇杷"與"琵琶"必須有不同的音節(jié)拼寫形式,才不致弄混。有人認(rèn)為,詞性不同的同音詞不全混淆,其實(shí)不然。例如:"(撞見/壯健)的是個(gè)大傻瓜",就容易混淆。如用動(dòng)詞性詞尾?、形容詞詞尾?加以區(qū)分,即:撞見zhuàngjiànd、壯健zhuàngjiànx(標(biāo)調(diào)字母暫不討論),就比較理想了。
三十年代制訂推行拉丁化新文字的年代,中國(guó)還是半封建半殖民地的國(guó)家,十分貧窮落后,為了掃除眾多的文盲,文字的簡(jiǎn)易是歷史的需要。趙元任的《通字方案》也是在中國(guó)比較貧窮的歷史背景下產(chǎn)生的,"兒童不識(shí)"簡(jiǎn)化為"而同不式",已經(jīng)不適應(yīng)今天的需要。科學(xué)技術(shù)飛速發(fā)展的今天,每秒運(yùn)算4000億次的超級(jí)計(jì)算機(jī)已經(jīng)造成,宇宙飛船可以在太空對(duì)接。這一切都與高速度、高精密、高可靠分不開。我國(guó)未來(lái)的文字,必須能滿足超級(jí)計(jì)算機(jī)信息處理的要求。有些人喜歡沉緬于"一東二冬"的音韻和"篆隸行草"的書法,故步自封。從秦代兵馬俑深坑里挖出的車輛,就算轉(zhuǎn)動(dòng)靈活,再加注高級(jí)潤(rùn)滑油,在高速公路上只能起堵車作用。在信息高速公路上,古老的漢字也只能起堵車作用。為了國(guó)家的現(xiàn)代化,必須實(shí)現(xiàn)語(yǔ)文現(xiàn)代化。而語(yǔ)文現(xiàn)代化,必須著眼于高度信息化,設(shè)計(jì)出相應(yīng)的漢語(yǔ)拼音文字。
注釋:
[1] 陳明遠(yuǎn):《語(yǔ)言文字的信息處理》,知識(shí)出版社1985年版
[2] 馮志偉:《邁向?qū)嵱没蜕唐坊臋C(jī)器翻譯研究》,《語(yǔ)文建設(shè)》1994年8月
[3] Chen Guan:《機(jī)器翻譯和漢語(yǔ)拼音正詞法》、《語(yǔ)文現(xiàn)代化》1980.3
[語(yǔ)文現(xiàn)代化應(yīng)著眼于高度信息化]相關(guān)文章: