大西洋 发表于 2011-9-13 06:11:55

汉字的兼容性与电脑化

      上篇说到,汉语是一种单音节语素为主的语言,一个汉字作为一个符号,既是音节,又是语素,还有表示一个意思,汉字就成了形、音、义的结合体。汉字与汉语简短明确的优点相适应,使之与拼音文字相比,就无多词之难。所谓无多词之难,是指单字之间可以自由组合,形成具有新意义的词,不用造新词(这个词是指拼音文字意义上的词)。

    只有一个单个形体的字称为独体字,不是由两个或两个以上形体组成。这种字应该说是真正的象形文字,因为这类字是从直接从图画演变而成,每一个字都是一个整体。 如日、月、 山、水、人、牛等。

    东汉许慎在《说文解字*叙》中说:“象形者,画成其物,随体诘诎,日月是也”。独体字指的是它不能再行分析,是相对合体字而言的。段玉裁在《说文解字注》中说:“析言之,独体为文,合体为字,统言之,则文字可互称。”(所谓“独体为文,合体为字”是指文和字是有区别的)。

    这些独体字合成合体字,字之间再组合形成词。只举一例:人,一人是人;二人是从(随从、跟从);三人成众;五人就是队伍了。

    据北大中文论坛一专家统计,这些独体汉字并不多,只有280个。见附录《简化汉字独体字表》。

    现在说说汉字的兼容性和电脑化。这里的兼容性也可以说是包容性或同化力。

    在人类历史上,不同文化在不同的时期都有所交流,甚至碰撞。亨廷顿说不同文明的碰撞甚至可以引发战争(大意)。我认为,从中华文明的发展进程来看,这个结论是不正确的。汉字(中华文化文明的形体)在其发展的历史过程中,显示了对外来文化巨大的包容性和同化力。不管这种文化是宗教的还是科学的。

    从宗教角度说,基督教对中华传统文明来说是一个全新的信仰,汉语语境中本没有基督教信仰方面的内容。但自十六世纪末基督教全面传中国之后,基督教的神学内容很快便被汉字所包容。首先基督教所崇拜的神God。中华文化当然没有God,但翻译者(不知何人)以中国古典《书*立政》篇中“吁俊尊上帝”中的上帝来称呼God,可谓完美。天主教则用了“天主”二字,同样恰如其分。除此之外,汉语以其原有的字与词,完美的表达了基督教教义的深刻含义。如,启示、拯救、忏悔、恩宠、复活…。当然,这一过程也极大的丰富和扩充了汉语语言。

    还有一个表面现象不同,但同样也是汉文化包容性的例子。众所周知,世界各地的犹太人历来以坚强的族性身份著称,世界各地的文明都没能改变他们的身份。唯独在中国,曾居住在河南开封的犹太族群最终销声匿迹了(对这个历史情况史学界有着不同意见,姑且相信一方)。不是他们走了,而是他们被汉化了。这一同化过程应该说主要是汉文化力量的体现,而汉字作为文化的载体,其包容性在其中起的作用是不可忽视的。

    从科学技术角度看,现代科学技术日益发展壮大,新产品、新理论的问世必然导致新名词的出现。这时,不同语言文字的包容能力的差距也就显现了出来。

    太平洋岛国玻利尼西亚的居民语言简单,见到飞机不知如何称呼,只能称之为大鸟。中文则不同,中文取它飞翔与器械之意,一“飞”一“机”两个字即组成了一个形象的名词。面对电脑的出现,英文创造了一个新词computer。中文则根据电脑用电这一基本属性,及其记忆、处理信息等功能类似人脑的特点,使用了原有的“电”、“脑”二字,形象而简洁。这样的例子举不胜数,化学元素,或根据外文第一音节的发音,或根据物质的属性,找一个字,如果是气体,加个气字头,如果是金属,加个金字边即可,简单明了。当然,对专业人士来说,外文更清楚。

    汉字的可容性,使科学技术真实的进入到汉语当中。中文不用创造新字即可表达最先进的科技成果。这也是汉字能够在日新月异的社会中,继续保持其稳定性的原因。

    现代汉语中大量的词汇,尤其是科技、社会类词汇是从日文来的。造成这一现象的主要原因,我想是不是这个:五四运动期间,新文化运动的领军人物们急于把外面世界的情况介绍到国内来,这种信息是大量的。作为近邻,日本先行一步,已经把西方先进的科学技术、社会学领域的理念翻译成了日文,而日语的源头是汉语(这也是一般的见识,不是科学考评),所以先贤们就直接把日语拿了过来(很容易找到相应的字)。实际上我觉得这恰恰证明了汉字的兼容性。

    顺便说说字典,据我所知,英文字典是要经常出新版的,日文好像比英文翻新的更快。而汉语字典则不同,我们都熟悉的那本《新华字典》(不是现代汉语词典,是小小的那本64开《新华字典》),1951年开始编纂,1953年完成。从那时起至2008年,一共翻版了十次。翻新也主要是因为社会的进步变化删改“词条”,基本上不添加新“字”。

    再说说学汉语到底难不难的问题,在我看来不是想象的的那么难。明白了汉字的象形特点,认单个的字不是很难的,而理解了单个字之后,两个字组合成的词就很容易理解了。

    再鼓励鼓励那些想学汉语的朋友们,据统计(还是没有正式的出处),如果你只是看报纸,只需要认识五百个汉字就可以了;如果想看现代小说,一千个字足够;古典小说(简体现在版),也就1500个字。认一千个方块字比背英语单词应该相对容易些吧?

    最后说说汉字电脑化的问题。早在东汉年间,中国人就发明了印刷术(毕升)。到了宋代,又创造了活字印刷(木版印刷、活字印刷)。这两项发明使中国人的印刷技术处于世界领先地位达一千年之久。

    进入近代之后,随着打字机的出现,拼音文字的书写优势一下显示出来。中文打字机字盘有两千多个常用字,还有两千多个准备用字。使用打字机的专业人员,必须经过长时间的死记硬背,花费大量时间精力掌握每个字的位置。而拼音文字打字机只有三十多个键,使用起来自然方便快捷。中文打字机与西文打字机的体积之比就更不用说了。

    世界进入信息时代以后,电脑的普及、应用成了现代化最重要的标志之一。使用电脑离不开文字的输入,汉字输入在打字机上表现出来的弱点,在电脑之初显得更加突出。

    电脑一问世,就有人预言:中国人要想进入计算机的世界,方块形的汉字必须彻底改成拼音文字。听过一个说法,美国人曾花费十年时间,投入数亿美元,研究如何将中文输入电脑。结论是,汉字进入电脑是不可能的。

    那么,为所有炎黄子孙推崇、使用了几千年的汉字,能否适应电脑时代的要求,与时俱进呢?

    以当代毕升――王选院士为代表的中国人,以自己聪明智慧,潜心钻研,终于结出累累硕果:仓颉码、五十字元法、五笔型相继问世;还有五笔画、五笔桥、国际区位、表形码、标准郑码等,拼音输入法更不用说,可谓“万码奔腾”。

    象形的汉字用拼音字母输入电脑,这是美国人无论如何也想不出来的。这需要深厚的中华文化底蕴,对方块字的起源、发展有着深刻的了解才行。

    中文信息化处理已经不再是一个科学的梦。古老的汉字与现代化的科学技术完美地结合在了一起。汉字的电脑化,把汉字的科学性在当今电脑时代更加体现了出来。我们甚至可以说,汉字使电脑的现代化科学技术得到了最充分的发挥。在知识爆炸的今天,汉字处理大量信息的能力就显示出来了。

附:北大中文论坛哲哲豆 2009-1-14整理的《简化汉字独体字表》

共280字

1 画:一乙
2 画:二十丁厂七卜八人入乂儿九匕几刁了乃刀力又乜
3 画:三亍干于士土工才下寸丈大兀与万弋上小口山巾千川彳个么久

丸夕及广亡门丫义之尸已巳弓己卫孑子孓也女飞刃习叉马乡幺
4 画:丰王井开夫天无韦专丐廿木五卅不太犬歹尤车巨牙屯戈互瓦
止少曰日中贝内水见手午牛毛气壬升夭长片币斤爪父月氏勿欠丹乌
卞文方火为斗户心尹尺夬丑爿巴办予书毋
5 画:玉末未示戋正甘世本术石龙戊平东凸业目且甲申电田由央史冉皿凹民弗出皮矛母生失矢乍禾丘白斥瓜乎用甩氐乐匆册鸟主立半头必永
6 画:耒耳亚臣吏再西百而页夹夷曳虫曲肉年朱缶乒乓臼自血甪舟兆
产亥羊米州农聿艮
7 画:严求甫更束两酉豕来芈里串我身豸系羌良
8 画:事雨果垂秉臾肃隶承
9 画:柬面韭禺重鬼禹食彖
11 画:象

老兵帅客 发表于 2011-9-13 06:52:19

参与一下哈。

“听过一个说法,美国人曾花费十年时间,投入数亿美元,研究如何将中文输入电脑。结论是,汉字进入电脑是不可能的。”这个绝对是瞎编的。

事实上,早在大陆的汉字显示和输入系统出来以前,IBM就有了自己的DBCS,也就是双字节字符集,汉字显示和处理只是其中的一个子集而已,而台湾的基于BIG5码的汉字显示和处理软件也是很成熟的,大陆只是后起者。之所以在大陆是GB汉字占绝对优势,是因为当初台湾跟大陆对立,BIG5是繁体汉字,而IBM又不看重PC市场段,这才有了大陆人的机会,否则现在就是IBM或者BIG5的世界了,因为IBM的汉字有简体字版本。

我之所以熟悉这个领域,是因为当年我做过这个方面的东西,分析过各自的码表,当然也就写过对应的程序。

大西洋 发表于 2011-9-13 09:34:31

老兵帅客 发表于 2011-9-13 06:52 static/image/common/back.gif
参与一下哈。

“听过一个说法,美国人曾花费十年时间,投入数亿美元,研究如何将中文输入电脑。结论是,汉 ...

受教。一个小问题,现在可不可以说,汉字输入大陆是后起而迎头赶上,甚至超出呢?

老兵帅客 发表于 2011-9-13 09:41:26

大西洋 发表于 2011-9-12 20:34 static/image/common/back.gif
受教。一个小问题,现在可不可以说,汉字输入大陆是后起而迎头赶上,甚至超出呢? ...

汉字处理,包括显示和输入,谈不上超出,因为所基于的硬件和软件都是人家现成的,你写的只是应用程序而已。拿应用程序和系统程序去比,会被内行人笑话地。

毛锥子 发表于 2011-9-13 09:42:34

最后说说汉字电脑化的问题。早在东汉年间,中国人就发明了印刷术(毕升)。到了宋代,又创造了活字印刷(木版印刷、活字印刷)。这两项发明使中国人的印刷技术处于世界领先地位达一千年之久。

我了个去!!!!!!!!!!!!!

大西洋 发表于 2011-9-13 11:00:58

老兵帅客 发表于 2011-9-13 09:41 static/image/common/back.gif
汉字处理,包括显示和输入,谈不上超出,因为所基于的硬件和软件都是人家现成的,你写的只是应用程序而已 ...

太专业了,个人觉得,五笔输入法还是比较快的,比仓颉等其他输入法好使,拼音另说。

老兵帅客 发表于 2011-9-13 19:23:07

大西洋 发表于 2011-9-12 22:00 static/image/common/back.gif
太专业了,个人觉得,五笔输入法还是比较快的,比仓颉等其他输入法好使,拼音另说。 ...

在输入方法的易用性方面,大陆确实做得比台湾强,这方面最差的是IBM,真正的给你个样子货到头了,因为他们认为这是应用级的东西,这就是IBM的风格。

大西洋 发表于 2011-9-13 21:06:09

老兵帅客 发表于 2011-9-13 19:23 static/image/common/back.gif
在输入方法的易用性方面,大陆确实做得比台湾强,这方面最差的是IBM,真正的给你个样子货到头了,因为他 ...

听过一个笑话,说的是两个飞行员驾驶一架直升机,在空中突然遇到大雾。二人不知下面是什么地方,仔细搜索,看到前方有一电视发射塔形的建筑,忙发报询:我现在在什么地方?回电称:你现在在离地面200米的空中。飞行员甲叹口气,唉,和没说一样。乙却兴奋的大叫道,我知道了,这是IMB总部。
电脑经常告诉你一些非常准确,却对你毫无用处的东西。
这和汉字输入已经没关系了。

老兵帅客 发表于 2011-9-13 21:39:02

大西洋 发表于 2011-9-13 08:06 static/image/common/back.gif
听过一个笑话,说的是两个飞行员驾驶一架直升机,在空中突然遇到大雾。二人不知下面是什么地方,仔细搜索 ...

俺怎么记得那个笑话讽刺的是微软涅?

大西洋 发表于 2011-9-14 06:42:47

老兵帅客 发表于 2011-9-13 21:39 static/image/common/back.gif
俺怎么记得那个笑话讽刺的是微软涅?

兄台在IBM工作过哈{:191:}

老兵帅客 发表于 2011-9-14 06:52:56

大西洋 发表于 2011-9-13 17:42 static/image/common/back.gif
兄台在IBM工作过哈

居然讽刺俺,切:loveliness:其实我是在IBM的BP工作过。

张七公子 发表于 2011-9-30 09:59:56

大西洋 发表于 2011-9-13 11:00 static/image/common/back.gif
太专业了,个人觉得,五笔输入法还是比较快的,比仓颉等其他输入法好使,拼音另说。 ...

可以尝试郑码

冰蚁 发表于 2011-9-30 12:08:49

老兵帅客 发表于 2011-9-13 17:52 static/image/common/back.gif
居然讽刺俺,切其实我是在IBM的BP工作过。

BP 啥意思?

冰蚁 发表于 2011-9-30 12:23:45

毛锥子 发表于 2011-9-12 20:42 static/image/common/back.gif
最后说说汉字电脑化的问题。早在东汉年间,中国人就发明了印刷术(毕升)。到了宋代,又创造了活字印刷( ...

这个确实要改掉。毕升不是东汉人。宋朝已经是公元1000多年了。咋可能领先世界1000年。{:193:}

大黑蚊子 发表于 2011-9-30 12:40:19

但有点儿讽刺的是,我印象中很长一段时间内,雕版印刷占据主要的地位。
原因很简单,刻雕版的工人可以不认识字,但活字排版的工人那可得认字。古代受教育的人少,能胜任活字排版的人太少,成本也高。

毛锥子 发表于 2011-9-30 14:51:10

冰蚁 发表于 2011-9-30 12:23 static/image/common/back.gif
这个确实要改掉。毕升不是东汉人。宋朝已经是公元1000多年了。咋可能领先世界1000年。 ...

现存的世界最早的木板印刷品是出土于韩国庆州佛国寺的《无垢净光大陀罗经》。其印成时间不应早于公元704年。另参考现存的一些文字资料推测,木板印刷术的发明时间最早只可能是是初唐。

老兵帅客 发表于 2011-9-30 19:11:44

冰蚁 发表于 2011-9-29 23:08 static/image/common/back.gif
BP 啥意思?

business partner

老兵帅客 发表于 2011-9-30 19:15:51

大黑蚊子 发表于 2011-9-29 23:40 static/image/common/back.gif
但有点儿讽刺的是,我印象中很长一段时间内,雕版印刷占据主要的地位。
原因很简单,刻雕版的工人可以不认 ...

而且用泥或者木头做活字并不实用,因为损坏率太高了,后人改用金属做活字才解决这个问题,因此毕升的这个发明应该属于good idea但不实用的东西,实用化是相当后来在别的国家做到的。

河蚌 发表于 2011-10-24 17:00:34

老兵帅客 发表于 2011-9-13 06:52 static/image/common/back.gif
参与一下哈。

“听过一个说法,美国人曾花费十年时间,投入数亿美元,研究如何将中文输入电脑。结论是,汉 ...

同意,美国人如果做出这个结论,那就是弱智。实际上有电脑,就有拼音输入,汉字本身就有四角号码以及区位码。
在任何电脑时代,汉字输入不是问题,问题是显示终端,很多终端只支持固定的字母显示,不支持图形。
这就象七段码的LCD无法显示汉字,而图形LCD可以一样,但这只是个成本问题,并不是技术问题。

老兵帅客 发表于 2011-10-24 19:28:08

河蚌 发表于 2011-10-24 04:00 static/image/common/back.gif
同意,美国人如果做出这个结论,那就是弱智。实际上有电脑,就有拼音输入,汉字本身就有四角号码以及区位 ...

关键在于在那个时代,PC不是主流而主机终端才是,图形终端太贵了以至于字符终端才是主流。另外华人中文市场主要是在港澳台新这些地区,而在这些地区,是以使用英文为荣的,因此市场不大,这就是为什么这方面的发展海外一直不如国内的原因。但是技术上根本就不存在问题,存在的只是市场需要而已。
页: [1]
查看完整版本: 汉字的兼容性与电脑化