有关中国汉字的小故事 汉字的历史小故事,汉字的历史小故事
汉字的历史小故事,汉字的历史小故事
汉字的历史小故事,3xm中文网小编整理,欢迎阅读!
汉字的历史故事之汉字简史
中国最早的文字可追溯到公元前1200年左右的“甲骨文”(不过这是个现代词汇)。些许零星分散的陶器标记和其他人造器皿上的符号可以追溯到三千到四千年前,不过它们构不成可以记录一种句法清晰的语言的书写体系,而且也没有证据表明它们与后来中国文字有什么关联。这样,基于现存记录,中国的书写体系首先出现于将近两千年前,比美索不达米亚和埃及(二者都出现在公元前3000年左右,美索不达米亚明显略先于埃及)要晚。这自然生发了一个问题,即中国文字是否独立产生?以下几点证据会表明,颇有一些刺激性传播发生着作用:一、汉字看起来是在一夜之间羽翼丰满,没有经历过长期的逐渐演化过程,而在西南亚,文字产生中的这些演化有案可稽;二、汉字被证明是紧接着炼铜术产生的,并和马车的出现几乎同时,而考古学家和科学史专家已经确认炼铜术和马车都源出于西亚;三、中国文字体系的特性(基本上是具有语义量词和听觉元素的语素音节,同时也包括象形成分和表意成分等等);四、许多学者多次独立发现最早汉字的一些字符群在视觉上和对应的西亚字符群很相像(在中国用于计数和历法的二十二个天干地支,可比之于在它之前的腓尼基人和乌干特人呈现各种变体的二十二个字母[特别是其最短形式最明显]),并且就我们所知的三千多年前它们的发音而言,它们似乎有共同的语音对应(这不必然需要黎凡特地区和中国之间有直接联系,而是某种间接传播,或者刺激物最早产生于东西方之间的某地,同时向两个方向传播);五、大量个体汉字在形状上、意思上以及有时甚至发音上很像其西亚对应字;六、已经高度发展的汉字在最初的几百年间只服务于一种高度专门化的用途(王朝卜筮的记录),而在接下来的几百年中又用于另一个高度专门化的用途(贵族青铜钟鼎上的铭文),这暗示着汉字为贵族或者神职人员及其后继者这一小团体所垄断,他们小心翼翼地护卫着自己书写汉字的技能。以上没有哪个单独证据能够充分质疑汉字的本土原生性,但是这些证据加在一起就足以说明,不能轻易打消外来影响的可能性。
不论它何时形成,我们今天所知的汉字原来只是用来记录卜筮中的问与答,这就是上文中提到的甲骨文。甲骨文和商朝国君有密切的关系,起始于武丁(在位时期:约前1200—约前1181)及其长于卜筮和释卜的亲近顾问。这样,中国最早的文字是王室专属物,专门指派给史官卜人。然而在近东(西南亚和东北非),早期的文字有从经济管理到文学宗教等各种用途。
不能说甲骨文是出于一种文学意图,它们所触及的仅是君王所感兴趣诸主题的一小部分,但是有时也显示出某些文学效果,或者预见了后来中国文学写作的一些特质。下一时期的文字(金文)同样也是如此。金文主要是在周朝,不过重要的是,汉字在这一阶段已经伴随着青铜器流布到王公贵族一层。而且,现存最长的金文从甲骨文的十数个字扩展到将近五百字。
随着文本长度的增加,汉字的数量也激增。甲骨文单字总共加起来接近4500个(包括约1000个异体字),其中仅有1000到1500个字有后世的对应文字。周朝的金文有差不多4000个单字,其中略超过2400个字是可辨的。由于证据过于支离破碎,所以很难确定战国时代(前403—前221)丝帛、竹简、青铜和石刻铭文等中使用的汉字数量,不过肯定是超过了5000个,包括各地使用的许多异体字。秦始皇在公元前三世纪后期统一六国,“书同文”政策清除了各地的异体字和重复字,不过不久汉字的数量又再次激增。此后各时代字典收录的汉字个数如下:9353(100),11520(约227—239),12824(400),13734(500),22726(534),26911(753),31319(1066)。最近的字典收录了超过六万个汉字,有两部字典甚至收录了超过八万汉字,而几位北京大学学者甚至计划编写一部罗列超过十万汉字的大字典。汉字的这种天文级数量对于表音文字使用者而言是不可思议的,因为他们字母表中的字母通常在20到40个之间。
实际上,汉字的数量是开放的,仍然在不断增长。汉字使用者可以自由创制新字(许多人这样做了,比如在取名时,或者科学家首次发现未知元素时)。某个汉字一经创制,它就永久在汉字表中获得一席之地。这迥异于不增加字母总数而通过重新排列字母来创造新词的表音文字(莎士比亚一个人创造了将近1700个新词,比如barefaced, castigate, countless, critical, dwindle, excellent, fretful, frugal, gust, hint, hurry, leapfrog, lonely, majestic, monumental, obscene, pedant, radiance, submerged和summit)。也就是说,无论英语中加入多少新词,字母的数目(26个)是不变的。当然,汉语也可以通过组合语素来增加词汇量,而从来就是这么做的。比如在官话中,天、花、粉和板四个字可以组合成为“天花”“天花粉”(栝楼根制成的一种中药)“天花板”等等。实际上这是汉语中创造新词的标准方式,但它没有阻止新汉字的激增,这部分是因为每个时代都有全新语素产生,不过也是由于人们希望与众不同,而与众不同的方式之一就是创造新词。
很明显,人们只能记住这些天文级数量汉字中的很小一部分。若要基本能够识文断字,需要记住1000个汉字,2000—3000个汉字则足以应付大多数环境,而达到“完全识读”水平(包括读报以及就各种主题进行书面交流)则需要约4000个汉字。掌握6000个汉字(中文处理软件和常用案头字典所提供的汉字字数)是非常了不起的,而单个人是否掌握1万或者更多汉字则值得怀疑。大多数书写都习惯性地仅限于使用几千个汉字,这一现象不仅发生在今天,在中国文学的最高峰唐诗中亦如是。数万汉字中的许多字在历史上仅仅被使用过一两次,它们的发音或意义(或者二者都)很难确定。然而,字体创建者必须要考虑到这些汉字,因为它们会不时出现在文本中。信息处理专家必须准备提供至少25000个汉字以敷日常之用,即便这些汉字中的绝大多数在大多数文本中的出现频率小于十万分之一,它们仍然不时出现在姓名、历史事件、词汇讨论等中间。
汉字的数量虽然很庞大,但它明显不等同于任何一种汉语中的全部词汇,也更不等同于所有汉语中的全部词汇。实际上现代标准汉语中的词通常是双音节的,即便是文言文中也经常使用双音节或者多音节的词或者术语(包括所谓连绵字、复合字或者复音字、拟声词、同义词,以及其他种类的共同词项)。于是,虽然汉语被广泛认为是单音节的(由单音节词构成),但是经过对实际使用情况的细心分析后,我们会发现并非如此。汉语中的绝大多数语素是单音节的,但是包括英语在内的绝大多数其他语言中的语素也以单音节为主,另外在汉语中(甚至在文言中)有大量多音节语素,比如“蝴蝶”“蜘蛛”“孑孓”“琵琶”“枇杷”“珊瑚”“麒麟”“凤凰”“忐忑”“逶迤”和“尴尬”。这些词中的一部分也许在古代是包含复辅音的单音节字,而语音演化以及随之而来的音位配列导致了汉语中所有复辅音的分裂。复辅音被再分配在两个相邻音节中,这叫做“一分为二”(dimidiation),此种双音节化过程似乎在晚近的上古汉语中相当常见。并且一些学者认为,复辅音的分裂和某些末尾辅音的消失导致了汉语中声调作为一种补偿而诞生。还有一些学者则提出,这些过程也导致了双音节词数目的激增,使得汉语在面临日趋同音化时,能确保口语中有足够的词汇差异性,特别是在一些汉方言中的声调日趋减少的时候(在普通话中,现在只剩下四声:阴平、阳平、上声和去声,但在一些传统分支如闽南语和粤语中,声调要多得多)。
藏缅语中的对应词研究,以及与印欧语系、南亚语系、南岛语系和其他语系之间相互的古老借词比较,表明了汉语中原来是有复辅音的。除了上面提到的语音变动,汉字本身的音节特性也强化了复辅音的分裂,因为世界范围内的音节文字都展现了一种在结构上单个辅音加元音的大趋势。类似的语音约束,加之以上提到的对极致简洁的追求,也导致了曾经一度存在于上古汉语中的词形成分(前缀、后缀和屈折等等)的丢失。而在中古汉语,甚至在现代汉语中,这些丢失的词形成分在上文提到的阿尔泰化和白话过程中,又得到了复原,区别在于语法成分不再加于词根之上作为变化,而是作为加于语素音节开头或末尾的单独音节(书面中则为单独汉字)。

汉字的历史故事之汉字的特性
正如上文所提到,文字不等于语言,语言不等于文字。某种特定文字可以用来书写多种不同而彼此无关的语言(比如英语、土耳其语、越南语和印尼语都用罗马字来书写),而某种特定语言也可以用不同文字来书写(如维吾尔语根据历史年代排序曾用过以下文字来书写:卢恩文字[runes]、古回鹘文字[起源于阿拉米文字,经由粟特草体演变而来,是蒙文字和满文字的祖先]、阿拉伯文字、西里尔文字、罗马文字,然后又再是阿拉伯文字)。因此文字的分类与语言的分类是无关的,反之亦然。汉语的分类上面已经讨论过了,本节主要对汉字进行分类。
对于该给汉字贴上什么样的标签,仍旧未有定论。虽然在非专业文献中,经常把汉字称为“象形文字”,这是非常不正确的,因为只有一小部分汉字如山、日、马、鸟、鱼、龟,在创制之初是有意仿照事物样子的。即使是这一小部分象形字,其现在的字形,对于不熟悉汉字的人来说,也完全辨认不出来它们的象形对象。同样只有一小部分汉字——如“上”“下”和“中”等等——是表意的,而且只有接受过专门训练的人才能辨识出它们的表意之处。所以将汉字称为表意文字也不妥当。许多权威专家比较接受“意符文字”(logographic)这个提法,这意味着汉字的每个音节单位都等于一个词,因而汉语是单音节的。对汉字的更准确描述应该是语素音节型(morphosyllabic),这指的是每一个汉字单位在长度上都是单音节,传递一个基本意思。这里要重申的是,汉字的基本音节特性不能用来宣称所有汉字只包含一个音节。学者们使用语法分析、心理语言学和其他方法结论性地表明,除了汉字,汉语使用者对于其他单词的不同音节长度也有一种明白无误的感觉。
诚然,汉字基本上是单音节的,但还是有些例外,因为确实存在一些具有多个音节的汉字(有些可追溯到唐朝,甚至更早)。在这种所谓“合文”的汉字中,有比如“”(菩萨)、“”(菩提)、“”(涅)、“”(某乙)、“”(营田[使])、“”(千瓦)、“”(问题)、“邗”(干部)、“”(社会主义)、“”(图书馆)(这些汉字当然也可以用多个汉字写出来),有些合字被广泛使用,甚至今天还能在标准字典中找到。在二十世纪,超过1000个这样的多音节汉字被广泛使用,这清楚地说明了汉语使用者有一种汉语并非完全单音节的天然的认知。这些多音节汉字多为代替许多常用词汇,所以这也预示着简化汉字的内心愿望。
另一个从十世纪后半期一直持续到十九世纪末的相关现象,是反切的使用。这是一种受佛教启发的注音方法,用两个汉字合起来为另一个汉字注音。反切时,通常写做“X Y反”,这表示X(反切上字)注声母,Y(反切下字)注韵母和声调。有时“X Y反”(三个字)经常写做“XY”(一个字)。在这种情况中,两个汉字就合成了一个汉字。这再次显示了,中华帝国晚期的学者不仅能进行语音分析——这一分析具有发展成真正拼音的潜力,而且显示了汉字体系并非毫无变通即注定是单音节以及单语素的,汉语更是如此。
实际上,在已知的最早汉字(甲骨文)中,两个甚至三个音节写成一个汉字的情况并不罕见,比如“乙祖”、“三万”、“十五发”所对应的甲骨文字。周朝的金文中双音节汉字不乏其例,如“小子”“小臣” “武王”和“文王”对应的金文。这些证据表明,在中国文字的最早阶段中,仍然有清晰的认识,即文字(和明显的词汇单位)是可以有一个以上的音节的。然而到了秦汉时期,汉字的单音节化趋势将有保留和传承价值的文本中的双音节字和多音节字几乎铲除殆尽。不过词汇单位可以是多音节的这一直觉还是保留着的,所以多音节汉字仍在不断被创造出来,如“不要”“二十”“三十”和“四十”的对应字。但是由于忠实于汉字单音节限制的压力太过强大,这些表达的合音和别的特定发音便孕育而生(分别是“甭”“廿”“卅”“”)。不过许多汉字双音节和多音节特质是不可否认的。而且上面提到过,许多汉语语素不止包括一个音节,因此在汉字的基本单位同时传递语音与语义的意义上,我们最好认为汉字是语素语音型或语义语音型(而非简单称之为语素音节性),而汉字的长度并不必然是单音节的。
不管我们将汉字完全称为意符型、语素音节型,还是语素语音型/语义语音型,大多数汉字(约85%,即形声字)都由一个传达语音的部分(声旁)和一个传达意义的部分(形旁)构成。不过声旁和形旁都不会准确告诉读者这个汉字的意思或者发音,而只是给出大略近似于该字的字义和字音。比如,读者也许会碰到一个字,它的形旁是三点水。三点水意味着这个汉字极有可能(但不必然)与水或者液体有关,这样我们会猜这个字也许意思是“浪”“溅”“浅”,等等。但是,仅仅从三点水来判断,我们不可能确定这个字的确切含义,只能得出这个字与水及其引申义沾亲带故。带三点水的汉字超过2000个,词义纷呈,从洁到汽、河、游、渔、泡、消、汁、液、油、酒、沟、淌、泻、沫、湿、滞、泥、淫、泪和澳,等等。仅仅辨识出一个汉字的形旁,在实际判断其词义的时候不一定会派上很大用场。同样的,读者可能会碰到一个汉字声旁为“方”(其四声代表的意思有很多,如方、妨、仿、访、舫、放、芳、枋等),而它的形旁表示它和“门”有关。只有将声旁和形旁连起来看,有经验的读者才能明白这个字读fang的第二声,它的意思是“房子,建筑物”。这一词素在文言文中是单独出现的,不过在现代标准汉语中与名词后缀或者一个同义字组成双音节词,比如“房子”、“房间”和“楼房”。另外,要确定某个汉字的意思,我们必须暂时忘记声旁(如“方”)自身也可以作为形旁,例如在於、施、游和旗等汉字中。在“旁”这个汉字中,“方”既是声旁也是形旁。