由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 为什么汉语是世界上最先进的语言
相关主题
为什么汉语是世界上最先进的语言之一学了几句鸟语,简直就是汉语的一个方言
印第安语是不是劣质汉语?两个例子说明英语的落后性
语言比较的基本点人有三逼:牛逼、吊逼、苦逼,话有三语:汉语、英语、西班牙语
汉语的拼音化是汉语的巨大倒退 (转载)请教各位将军一个语言学问题
汉语是高度发展的孤立语,决定了它的优势地位公元前300年发生的事
自由远比字母更重要万倍为什么阿尔泰语系日韩通古斯语族跟汉藏语系差那么多?
汉语是一种落后的语言英语的一个好处就是定语后置
西方社会注重沟通,是因为表音文字沟通困难 zz嘉绒语和藏语用s-前缀表使动
相关话题的讨论汇总
话题: 汉语话题: 语言话题: 英语话题: 汉字话题: 日本
进入Military版参与讨论
1 (共1页)
w*********g
发帖数: 30882
1
为什么汉语是世界上最先进的语言
一、语言水平高低的评判准则
口语,实际上是一种通讯协议。就是说,语言实际上是把人的思想通过发音器官变
成一串频率不同、波形不同的声波,然后被另一个体的听觉器官和相关的脑部组织重新
转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于
传输的信号的规则
计算机上,通讯协议有两个基本评判标准:【传输效率】和【抗噪能力】
传输效率:在单位时间里,按照该通讯协议能够传输多少信息。
抗噪能力:这种通讯方式能够在多大的噪音下仍然保证绝大多数信息正确传输。
【传输效率】又分两个方面,编码效率和传输速度
编码效率:这个通讯协议能够把一个信息用多短的一串信号来表达
传输速度:一段信号,能够以多快的速度传输
评价一种语言的口语是否先进,就要分析上面这几个问题。
文字,则是一种数据存储方式,存储格式的要求与通讯协议不同,存储格式要求储
存空间小、读写速度快,相比于读取速度,书写速度是次要的。这是因为平均下来一次
书写对应很多次阅读,而人在阅读文字上花的时间一般远远大于书写。尤其是现代社会
,手写越来越少,计算机输入、打印、印刷都大大加快了记录文字的速度,而阅读速度
却没有多少提升,因此在现代社会,阅读速度就在定义文字水平上占据了更重要的地位。
需要注意的是,下面的讨论中“音节”均采用西方语言学定义,粗略地讲就是一组
连续元音与其前后的辅音共同构成一个音节。比如To、Bliss、Strength是单音节。汉
语Ba、Chuang也是单音节,虽然单音节词的发音长度并不完全相同,但至少是可比的
二、语言的分类
世界上的语言大致分为两种,【孤立语】和【综合语】
(综合语 其下又划分为黏着语、屈折语等子类型)
【孤立语】 单纯通过词与词之间的关系来表达不同的意思
【综合语】 可以通过改变词的形态来表达不同的意思
我们举个简单的例子:
中文(孤立语):我昨天告诉他了。
英文(综合语):I told him yesterday.
英文你首先可以看到told和him两个变形,其中把tell变成told表示过去发生的动
作。把he变成him表示客体
而中文用昨天来直接指明时间,如果不指明时间则需要用“已经”、“过”之类来
表示过去,而并不改变词的形态,中文还通过各自的位置来体现谁是主体谁是客体
实际上,英语已经是综合语中非常接近【孤立语】的了。英语的未来时态用的词形
和一般时态没有区别,而很多其他语言中不同的时态都是用不同的词形来表达的。英文
对于各个词的位置有明确的规定,而很多其他综合语,诸如拉丁语中,词的位置可以不
固定。换句话说就是可以说出这样的句子:Him yesterday told I 然后通过词形里的
主格词形和宾格词形来判断究竟是谁告诉了谁
这是非常糟糕的,因为在读取的时候,总是有先后的差别,我们希望的读取顺序是
:先读取我们的大脑需要先处理的部分,【孤立语】天然就有这种优势,很多【综合语
】在逐步的发展中也确立了类似的规则,比如拉丁语的后裔之一——法语
上古古汉语也曾是一种【综合语】但是由于汉字的限制,古汉语的词形变化仅存在
于口头中,比方说文言文中的使动用法,如“文王以百里之壤而臣诸侯”中的臣(使臣
服,在上古时期,是需要在汉字发音前加“s-”音来标识的,就是一个典型的综合语的
词形变化
有人认为现在的汉语仍然带有一定的综合语色彩,他们认为加入诸如“了”、“的
”这种助词实际上就是词的变形,这种看法就只能见仁见智了
从整体发展趋势来看,世界各地的口语都是从【综合语】向【孤立语】发展,虽然
不能说【孤立语】就一定优于综合语,但是这个趋势说明【孤立语】的某种特性符合历
史的发展,这个优势就是数据的压缩
三、数据压缩:【孤立语】的高超之处
当计算机发展到了新的时代,人们开始研究如何在计算机上存储视频文件,一开始
的方案极其简单,就是把一帧一帧图像全部都存储下来,但是这无疑是低效的,因为这
里面的冗余信息太多
举个简单的例子,一个夜晚的场景,画面上很多地方都是黑的,何必把每一个点的
色彩反复记录呢?所以接下来的一个思路就是,不再存储每一帧图像的完整信息,而存
储下一帧图像与上一帧图像之间的差异之处,两幅图像中颜色一样的部分全部跳过
【孤立语】恰恰就具有这样的效果
举个简单的例子,一个人在用汉语谈论昨天发生的事情时,只需要一开始提及“下
面这些事情都发生在昨天”,后面就再也不必提及时态了,而英文,则需要反复使用时
态来表明这事情发生在过去
在交流时你需要时刻考虑时间、主格/宾格、数量、主动/被动,这对交流是有影响
的,当然,熟练使用这种语言之后会大大降低考虑这些的时间,但是即便熟练的综合语
使用者还是会在这方面犯错,在上下文的帮助下,这些变化都可以省掉
时间变形,可以依靠在第一句中加入时间状语完成描述,其后描述相同时间段的句
子就再也不用考虑描述时间了,这就是【孤立语】的数据压缩能力。
随着人类社会交流量的上升,一次交流的上下文就变得丰富起来,很多在单词、单
句的条件下很有效率的信息交流方式,也就显得越来越冗余了,因此世界上的各个主要
语言纷纷向【孤立语】靠拢。
关于各个语言的表意效率,也就是信息密度,2011年法国里昂大学做了一个实验
http://ohll.ish-lyon.cnrs.fr/fulltext/pellegrino/Pellegrino_2011_Language.pdf
这个实验里,研究者找了59位不同语言使用者,其中包括英语、法语、德语、日语
、汉语、意大利语和西班牙语。为他们提供了20段文字,这些文字都翻译成各自的语言
,然后请这些人分别用正常语速朗读,研究者全程录音,然后研究者计算所有音节数量
,计算朗读中表现的义项(表意的基本单位)的数量,最后得出结论
研究的结果是
【汉语】信息密度为0.94,位居 第一
【英语】信息密度为0.91,位居第二
德语(0.79)
法语(0.74)
意大利语(0.72)
西班牙语(0.63)
日语(0.49)
w*********g
发帖数: 30882
2
此处信息密度是通过计算每个音节所包含的义项数量来获得的,由于义项的数量是
从原始文本——英文版里统计的,翻译之后有可能会增加或减少义项,为防止翻译过程
中的扭曲造成数据标准不统一,各个语言的文本都被单独翻译为越南语,然后与各自越
南语文本中每个音节所包含的义项数量相除,最终得到比较公平的数据
这让我不由地想到,经过大规模注水的现代汉语信息密度还是这么高,那么文言文
究竟已经高到了何种地步?很遗憾没有这方面的研究
不过,根据使用频率进行加权平均,现代汉语平均每个词中的字数差不多是1.5左
右,在文言文中,其中很多都是用单音节词表达的,折中一下,我猜想文言文的信息密
度达到现代汉语的1.25倍应该是不成问题的,这在古代更是个恐怖的数字
因为拉丁语可不是比现代欧洲各主要语言简单,受到古代文字记录空间的限制,汉
语的显然在文字记录方面更加占优,这也许就是我国古代文字记录非常丰富的原因所在
有人说,音节不能作为衡量信息密度的单位,因为不同的音节,发音长度很不一样
。这个问题提的非常好,事实上,我下一节就要讲到【英语】与【汉语】发音长度的问
题,英语单音节平均发音长度比汉语长,因此在口语的信息密度方面,【汉语】的优势
更大。
四、传输的优势:声调
口语信息的传输,是通过声音完成的
声音一般分为四个部分:音质、音高、音长、音强
对于语言中的一个音节来说,音质指的是其中辅音与元音的组合,其他三个都很好
理解。现代语言不太规定【音强】,因为这实在无法在各个人之间得到统一,而且受到
说话人的距离、情绪、身体状态等影响,此处需注意,英语中的“重读”实际上是音高
变化,而剩余的三个元素,则都在语言中得到了广泛的运用
拿汉语举例
【音质】很容易理解,就是发音除去声调
而声调本身则分为【音高】和【音长】两项
汉语普通话的四声,是四种不同音高变化模式
一声 是 保持音高
二声 是 音高由低到高变化
三声 是 音高从高到低再到高
四声 是 音高由高到低
虽然我们语文课里说轻声是没有声调,但实质上轻声是缩短音长,轻声一般是缩短
音长的四声或一声(有时音高很低),不过轻声很短,比较难以听清,所以普通话中仅
作为特定用途使用 (语气助词、复数标志等)
英语的【重读】实际上是音高的差异,所以严格地说,英语是有声调的,只不过英
语的音调只有两个:高和低,但是英语中音调仅用于部分音节,除了表示疑问、强调等
情况,通常英语单词不变调,除少量英语单词(如Record)外,英语单词不借助音调来
区分不同的词义,英语的确使用音长要素(如Sheep和Ship)由于英语一般只用音质和
音长来区分词义,所以一般也认为是一种没有声调的语言。
首先从【编码效率】上,我们可以说【汉语】是世界上编码效率最高的语言
汉语是世界上为数不多的使用音高来区分不同单词的语言,因此从编码上说,汉语
发音的表意能力就比一般语言高出一个维度,也就是说,使用单个音节,汉语能够表达
的不同信息的种类,理论上最高可以达到一般外语的4倍
为什么外国人学汉语学得这么辛苦,而中国人学英语则没有那么辛苦?就是中国人
是已经掌握了在发音是音高变化,现在再去学低级的两个固定音高。而在学习汉语中,
很多外国人最吃力的问题之一就是声调。因为只习惯于两个固定的音高,而没有听到过
、练习过在发音时连续变化音高。
有人提出,声调本身会影响发音速度,这当然是存在的,比方说二声,要求发音时
音调逐渐上升。要表现出这个,发音时要表现出两个音调,自然是要比单一音调要费事
,但是声调的好处在于,能够在同一组辅音和元音组合的基础上产生出多种不同的发音
,所以就不必借助更多的辅音来区别两个具有类似发音的词(比如英文life和light)
英文音节中,辅音-元音组模式的音节,发音确实比汉语略快。但是其他模式,诸
如辅音-辅音-元音组-辅音(Blight)或辅音-元音组-辅音,往往就比汉语发音慢了。
而辅音-元音组模式的音节,由于英语缺乏音调,所以数量远小于汉语。整体平均下来
,英语单个音节的发音慢于汉语
对于“英语单个音节的发音应慢于汉语”这个结论,可能有的人觉得不是很信服。
我们来举一个非常简单的例子,普通中国人的初等数学能力往往超过欧美。这并不简简
单单是教育的问题,更关键地,这是中文对数字命名结果。
汉语所有数字均为单音节
其中6和9有两个元音(或按照国际学术便准,三个元音),发音稍慢
0有后鼻音,发音可能稍慢,还有几个带卷舌音,可能会稍慢
英语所有数字,除7以外,全部都是单音节
其中覆盖了“辅音-元音”结构(如4)
“辅音-辅音-元音”结构(如3)
“辅音-元音-辅音”结构(如5)
“辅音-元音-辅音-辅音”结构(如6)
"元音-辅音"结构(如8)
双元音结构(如0,注意一般数字里0读“ou”,不读zero,后者实在太费劲了)
可以说英语的这些数字大致包含了英语的各种单音节词的音节结构,当然这里还没
有最神奇的辅-辅-元-辅-辅结构,但是那个和单元音结构一样比较少见。
那么平均下来英语的数字比汉语慢多少呢?
那么平均下来英语的数字比汉语慢多少呢?
首先我们需要知道,人对数字的短期记忆,实际上是对数字发音的记忆。换句话说
,你能记住的数字位数,是由数字发音的总长度决定的
研究表明(详细请下载,自行阅读)http://deepblue.lib.umich.edu/bitstream/handle/2027.42/26140/0000216.pdf?sequence=1
中国人从小开始短期数字记忆能力就高过美国人,该文献说明,美国大学生的数字
记忆长度平均为7.2位,中国大学生为9.2位。美国大学生的短期数字记忆位数,是中国
学生的78.26%。换句话说就是,英语数字的平均发音长度比汉语数字高27.78%,去掉英
文数字7(双音节)对平均音长的影响(10%)那么平均下来,单音节英语发音长度大概
比汉语高17.78%左右。
更进一步,中国的数字都是彻彻底底的单音节,因此可以采用绝对逻辑的方式构建
整个数字表。九十六,就是九个十加一个六。英语是“90”(与九和十都不同的特殊词
)再加一个6。法语是4个20加16
【汉语】是一种最简洁而最富逻辑的结构,在世界上是极为罕见的,九九乘法口诀
表,就是构建在这个基础上的。其他国家的儿童如果想背下来这张表,可以说比中国儿
童难了几倍,这种语言上的优势就提高了中国人的初等数学能力
顺便,还有人说,古汉语声调更多啊,难道汉语越发展越回去了么?这当然是错误的,
有些音调受说话者情绪等条件的影响,在辨识的时候不确定性因素比较多。这个问题我
们将在抗噪能力一节中详细讲解
五、信息论上的优势
从信息论角度来考虑,编码是很有学问的。举个例子,我们知道计算机传输信息,
实际上传输的都是0和1。那么,如果我们传输的各种信息出现的频率不一样高怎么办?
答案是,出现越频繁的,编码越短。这样就能提高总体效率
比方说,我们只有四种信息要传递,按一般的想法,自然是把这四种信息分别用00
、01、10、11来表示。每个信息都需要用两位二进制数来表示,也就是说传播100条信
息需要发送200个二进制数。但是如果其中有一种信息出现的概率是91%,而另外三种分
别是3% 那么就可以使用另一种编码方式:1,01,001,000 平均下来这种传播方式传
播100条信息需要发送91+2*3+3*3+3*3=115个二进制数。显然比前面那种效率要高。
世界各主要语言经过了几千年的进化,其词汇的长度分布,都比较符合信息论的要
求,你会发现各个语言中越常用的词,一般就越短。英语里,我、你、他、她、我们,
都是单音节词
英文的单音节词非常丰富,实际上比中文的单音节发音要多。这是因为英文可以在
一个辅音-元音组合的前后都添加辅音,来实现各种不同的单音节发音,这样排列组合
下来,英文的单音节词就是一个比较庞大的词库了,但是这就有一个代价,就是抗噪性
能低,这个问题我们放在下一节讲解。
按西方音节定义,英语的单音节词的使用比汉语要频繁,根据统计分析,汉语使用
者平均词长约为1.5字上下(见《ReadingChineseScript: A Cognitive Analysis》这
本书里有一个章节《Eye Movements in Reading Chinese andEnglish Text》)
而成年英语使用者平均每词音节数约为1.4(见http://www.waisman.wisc.edu/phonology/pubs/PUB30.pdf 这也得到了另一个研究的支持:分析10小时的发听录音,平均没词音节长度为1.38)。
所以,就音节数而言,汉语词平均比英语词长7.14%,然而,考虑到英语一个音节
比汉语单音节实际上长得多(即便把上一节得到的17.78%折半,也有8.89%)再加上汉
语每音节信息含量大致比英语高3.30%(见第三节数据)从信息论的角度讲,汉语的信
息传递效率基本上比英语高
这一点也得到了另一个实验的验证
(见http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3111932/
这篇论文找了8个汉语使用者和8个英语使用者,然后让他们两人一组。一组之中,
一个人描述图片(描述者),另一个人根据描述来绘制(绘画者)。最后对比图片的准
确度,同时观察描述者的语言。
最后结果是,汉语描述者明显比英语描述者先开始描述,描述者开始描述与绘画者
开始绘画之间的时间差,汉语使用者低于英语使用者,绘画时间,汉语绘画者低于英语
使用者,整体时间,汉语组显著低于英语使用者,汉语组所有都比英语组快,而且越复
杂的绘画,汉语组就快得越多。
绘画结果,144次绘画。汉语组平均每次犯8.1个错误
其中描述者平均每次犯3.7个错误,绘画者犯4.4个错误
英语组平均每次犯13.25个错误
其中描述者平均每次犯8.5个错误,绘画者犯4.75个
两者的差距仍然在统计误差之内。所以并不算显著
(嗯,是谁说汉语没有英语精确来着?)
之后,为了考虑绘画者的技巧差异,让每个绘画者直接对照原图绘画。结果【汉语
】组反而慢于【英语】组。绘画期间,汉语组使用音节数显著少于英语使用者,两组语
速(每秒音节数)接近(这个结论与前面的播音速度分析结果一致)。
这虽然是一个初步的实验,但是还是能看出汉语在交流上的优势的:用词更少,时
间更短,描述精确水平差不多(如果不是更高的话)这个实验还说明了……我国人民美
术水平还有待提高……
至于欧洲主要其他语言,根据第三节提到的数据,它们发音频率比英语高,信息密
度比英语低,要那些语言在这方面超过汉语,我觉得可能性不大
六、组词逻辑
由于英语单音节词资源比较丰富,但平均发音长度较长,所以你会注意到英语里单
音节词比例高于汉语,而多音节词的使用比例就小于汉语,很多逻辑上非常相关的词由
于不得不全部挤入有限的单音节词库,其发音就失去了联系。这就导致英语的常用词往
往【缺乏】组词的逻辑
比如我们可以很轻松地说“公鸡”、“母鸡”、“小鸡”、“鸡蛋”
而英语里就成了“Cock”、“Hen”、“Chick”、“Egg”,毫无联系
如果常用词要建立联系,那么英语就必须提高这些单词的音节数,那么平均词长就
要上升,从信息论角度讲,信息传递效率就更低了,所以【英语】只能在组词的逻辑性
上进行妥协
相比之下,汉语就从容的多了,即便在当前这种信息效率下,汉语仍然能保证绝大
多数词语构造具有逻辑性,因此相比于英语词汇,【汉语】词汇就比较容易记忆,这就
产生了一个结果,那就是汉语的常用词汇量远远多于英语。
英文使用者的单词量和生词辨识能力可见1995年的以下论文:http://jlr.sagepub.com/content/27/2/201.full.pdf
其中,大学生平均自称单词量为16141,经过多项选择测试发现,平均能够辨识其
中71%的词汇,也就是说平均大学生词汇量估计为11460个单词。老年人平均自称单词量
为21252,经过多项选择测试,发现平均能辨识其中80%,也就是说老年人的词汇量大致
为17002,对于从未见过的词的正确理解概率,大学生为30%,老年人为39%
没找到中国的相关研究,不过这里是商务印书馆的《现代汉语常用词表(草案)》http://wenku.baidu.com/view/51636fec551810a6f5248676.html
大家可以进去看看自己的词汇量,我感觉大学生达到五万应该不成问题。而且这肯
定不是一个人的全部单词量,不过这里面有些词是英语里几个词合起来的,所以中国人
词汇量未必比美国人高这么多,但我觉得定性的结论还是可以下的
另外里面可能有你没见过的词,可以看看有多少你猜不出正确含义……我觉得除了
极少数,确实没什么难度……
另外,汉语和英语都各自在组词上有一个弱点
汉语有大量的【同音词】例如“攻击”和“公鸡”
英语有大量的【多义词】英语的Ball既可以是球也可以是舞会
汉语中,曾经在文言文中大规模使用的单音节多义词现在大多变成了双音节单义词
,汉语中真正的多义词(各个意思之间没有直观逻辑联系)是极少数。而英语里的同音
词也是极少数,可以说这两种语言在各自的发展路径上都做了妥协
由于英语多义词比例比较大,所以尽管英语使用者词汇量比汉语使用者低,也不能
说明英语的描述能力不如汉语,另外,美国大学生的词汇量远低于老年人,这说明他们
并不是已经记下了所有能见到的词汇,而是在那个年龄段,还没有足够的时间记下。因
此可以看出,英语一词多义很多的原因,很可能就是英语单词的记忆难度比汉语大。
总的来说,由于汉语精简了发音,并且每音节信息密度较高,这使得汉语可以有较
长的平均词长,因此组词逻辑相比于英语就有了一定的优势,至于其他主要语言,信息
传递效率与汉语相比差距更大。主要方面都无法相比,这种次要方面就不需要再比了
七、强劲的抗噪能力
前面讲到,英语依靠大量的单音节词才能够接近汉语的信息传递效率。但这不是没
有代价的。构造大量的单音节词,就需要在词汇中使用大量的辅音
辅音分为两种
一种属于【响音】,就是能够持续发音的,诸如m、n、ng
(除这类辅音外,所有的元音也都是响音)
一类叫做【阻碍音】阻碍音本身发音短促、强度低、音高也很低
只有当阻碍音与元音结合,才能发出强度比较大的音。
汉语普通话中,所有阻碍音都是与元音结合的,而英语以及欧洲所有拼音语言,都
大量使用了不与元音结合的阻碍音,事实上,古汉语中不与元音结合的阻碍音是极度常
见的,音节结构比现代汉语的诸多方言都复杂,但是后来这种辅音用法就基本淘汰了
具体上古汉语的发音案例,大家可以自行搜索 《關雎》上古漢語朗讀
虽然学界对上古汉语的具体发音还有很多争议
但古汉语音节的复杂度在那个朗读中体现得很好
消灭独立的阻碍音,首先加快了发音速度,第二保证所有音都具有很高的强度。但
是其代价就是大大缩小了单音节词库,不过在上面的比较中我们可以看出,这个代价是
值得的,汉语的信息传递效率仍然非常高。
那么我们继续一个前面提到的话题,是不是音调越多越好呢?
有一个搞笑论调是这么说的 "我们的普通话叫“mandarin”,什么意思啊? 满大
人,满族人清朝入关之后,说不出我们的口语,他就把很多调去掉了,把入声去掉了。
说的发音越来越简单了,然后逼着全国人都这么说,所以我们现在的口语比粤语要简单
得多
这是一个非常愚昧的论调
首先,Mandarin 这个英语单词来自于葡萄牙语 mandarim 葡萄牙语这个词又来源
于马来语m?nt?ri 马来语这个词来源于梵语mantrin 而梵语这个词的意思是官员
换句话说,mandarin的愿意是【官话】
而且Mandarin这个词能查找到的最早的记录出现于1589年
大家可以查查那时候“满大人”在哪里呢
很多人以为粤语是正宗的汉语发音,这话对,也不对。粤语具备一些中古汉语的发
音特征。但是它也是在【中古汉语】的基础上发展而成的,语音还是有相当大的差异
有人认为北方官话/中原官话的形成,是因为蛮族入侵“污染”了汉语,这个说法
同样,对,也不对。北方官话之所以在中古汉语的基础上进一步的发展,就是因为战争
与征服。北方汉民与语言不通的外族加深的了交流,多种族的融合,教育,逐渐把一些
发音变得更加容易
举一个例子,粤语里白菜的白是Baak6,普通话是Bai2 粤语里尾部的这个k是一个
不发音的舌头动作,这个动作略微改变了原来Baa的发音,但这个音,如果不费力就很
难造成Baa明显的变化。相比之下,Bai本身就容易发,双元音ai的发音是通过舌头跟随
下颚动作完成的。我们知道咀嚼肌的力量比舌头大,运动也快,依靠下颚完成的ai音显
然比依靠舌头完成的aak音要容易发,当然这不是一个公平的比较。相比之下普通话Liu
、Lang的发音难度与粤语Baak相近,但是这两个音的尾部都是响音,不需要费力就能发
得很清楚
与这个不发音的k类似的,还有粤语中p和t结尾,这种发音方式正式名称叫做不除
阻的【塞音尾】在亚洲很多国家和方言里都有,这应该是【古汉语】流传下来的特点,
这种【塞音尾】既不抗噪也不省力,在交流更广泛、更频繁的北方方言里是很难见到的
,应该是已经演化成其他发音了
粤语依具体方言不同,有6-10个声调,其音高变化模式并不超出普通话的四个音调
,之所以多出来这么多音调,是因为粤语还引入了不同基准音高,比方说在一些方言里
,粤语的第1、3、6声都是保持音高,但是这三个声调各自保持的音调高度不同。再比
如粤语第2、5声,都是音高由低到高变化,但起始音高不同,粤语总共有四种不同的基
准音高,分别是do、re、mi和sol,类似的情况在很多南方方言里都存在。
这就是为什么有时候南方方言听起来有些像唱歌,大概也就是为什么吴侬软语听起
来很好听。
然而粤语音调最大的问题就是,每一个人音调高低是不一样的。有的人说话音调高
,有的人音调低,没有一个统一标准,甚至同一个人说话的时候,在低沉、平静、激动
时,音调高低也是不同的,因此,与一个不熟悉的人说话,出现单独的一个音高或两个
音高,都很难分辨出到底是哪一声,必须要三到四个基准音高都繁出现,才能判断准确
对方的音高究竟属于哪一声。而这些基准音高是否会频繁出现,这就是比较看人品的了
当然,就汉语的冗余度而言,一部分音高判断不准是没有太大关系的
但这就让粤语发音多变的优势大大削弱了。
此外,粤语的7、8、9声都是短促音,其音高和音高变化模式与1、3、6声没有区别
,短促音抗噪能力不如普通音长的发音,但它们的发音速度更快,不过在现今人类口语
交流中,瓶颈是大脑的思维速度,发音速度太快并没有明显的好处
有人问到底多少个声调最合适,我觉得这很不好说。现在没有客观的评估,但是无
论如何有声调的汉语(及其方言)总是要比没有声调的外语强
那么汉语的抗噪性能有没有什么证明呢?
有的。出了国,尤其是到了欧美的人,就会发现一个问题。那就是中国人说英语,
相比于当地人来说,总有点含混不清。外语老师总是要求中国人说英语的时候嘴巴要张
大、舌头的运动要有力,甚至要求用牙齿咬住一根铅笔来训练唇舌运动
这是为什么呢?因为中国人已经习惯了唇舌微微运动的发音过程。
汉语发音具有很高的信号强度,而且由于舍弃了所有单独发音的辅音,所以一个音
节里的元音就能保持更长的时间(这也就是为什么我们一般觉得汉语说话比英语慢的缘
故)我们知道长时间保持一个信号,也有利于对抗随机噪声。发音强度大、元音维持时
间长,这就导致,同等发音强度时,汉语的抗噪能力更加强大
换句话说就是,同等噪音条件下,汉语所需要的音量更小
因此汉语使用者发音不必费力,唇舌运动幅度比英语之类明显小
八、口语的速度
说到口语的速度,我们先来看这篇论文:http://ldc.upenn.edu/myl/llog/icslp06_final.pdf
图1显示,根据一些谈话样本,当去掉沉默与噪音占据的时间后
英语会话者每分钟一般能够说160-280个词
汉语会话者大致是250至400词(这里不是字)
这差不多是普通人不受思绪影响的最高语速
所以可以看出,汉语的理论最高信息传递能力是【远远高于】英语的。
但实际上受限于【思维速度】,两者的速度差距并不大
下面这篇论文研究了在不同语速下听众正确听得每个字的概率http://www.sciencedirect.com/science/article/pii/S0169814104001581
英文播音平均每分钟210-252个音节与汉语播音平均每分钟240-260字没有显著区别
。可以说,人类接受语音的速度,现在是受到了【人脑处理能力】的限制。上面的播音
速度,都不是播音员最快的说话速度,而是为了保证观众正常收听才控制的速度
随着交流的日益深入,人类说话的速度实际上在加快,40年前美国一般语速是145
词每分钟。如今是160-170词每分钟,中国60年代播音185字每分钟,如今是240-260字
每分钟,这也许是信息的丰富让人脑的处理能力上升的缘故
九、汉字:伟大的基础
汉语一开始也是一种【综合语】大量使用词根、词缀。但是从文字角度,汉字为汉
语成为【孤立语】提供了非常关键的基础结构,汉字导致词形变化无法记录在纸上。最
后词形变化就只能用额外的汉字来标记了。而这个增加的汉字就变成了一个通用的逻辑
规则,也就与修饰的特定词失去了必然关系,这样汉语就逐渐变成了【孤立语】
正是由于汉字将【读音】与【书写】割裂,使得汉语的语音能够相对自由地发展
因此,汉语语音在几千年中变化如此之大,而我们的文化却没有割裂
更进一步地,由于汉字并不受限于读音,因此可以创造出大量同音异形字,帮助汉
语降低平均音节长度、提高组词的逻辑性。虽然在口语上,汉语的同音异形词和英语的
多义词都属于“同一发音可能包含不同含义”的情况。但写到纸面上,同音异形词就比
多义词更容易辨识,减少歧义的可能。
有人可能会问,汉语口语交流,并没有多少歧义的问题,那为什么文字中会需要额
外的消除歧义的能力呢?这是因为一般情况下口语交流是一种双向交流。如果发现有可
能有歧义,可以向对方询问,主动消除歧义
而文字往往是一种单向交流(不包括网上文字聊天……)一旦出现歧义,就很难消
除,因此文字里的歧义一般需要比口语更小。我们的文字、我们的语音以及我们整个语
言整体,都是有机结合在一起的。推崇汉字的拼音化或拉丁语话,都是没有看清这种密
切联系
反面教材就是韩国,盲目将文字拼音化的,结果出现把防水材料搞成吸水材料的笑
话(韩语里“防水”和“放水”读音一致,结果建筑公司错误理解了图纸)
再有,由于汉字不需要空格,所以相比于类似字号的英文单词,同一个词要高而窄
,这在排版上有很大的优势(行距要占用额外的空间,高而窄可以减少行数)加上汉语
本身信息密度高,所以一般我们看到的中文版的书面文件都比外文版的页数少
十、阅读速度的比较
和语音一样,阅读速度同样受到大脑处理速度的制约,所以各个主要语言区别不大
《ReadingChineseScript: A Cognitive Analysis》这本书里有一个章节《Eye
Movements in Reading Chinese andEnglish Text》专门讲阅读中英文时的眼球移动,
这是中科院和悉尼大学的两位学者写的
熟练的中文阅读者能够每分钟阅读386个中文词汇
而熟练的英文阅读者可以每分钟阅读382个英文词汇
一般人可能会低100词左右
具体速度还取决于文章的复杂程度,文章简单的话阅读速度就更快。
汉语使用者眼睛每次凝视可以阅读1.71个词(2.57个汉字)每次凝视平均257毫秒
英文阅读者每次凝视可以阅读1.75个词,每次凝视平均265毫秒。
总体上说,两者阅读速度不相伯仲
十一、双线并行读取能力:更稳定
经过长期的研究,人们发现不同语言使用者在阅读时使用的大脑区域是不同的
一下这篇文章提供了部分综述http://www.pitt.edu/~perfetti/PDF/Brain%20activ%20process%20Chinese%20char%20and%20words-%20Tan%20et%20al..pdf
阅读自己母语时,阅读【汉语】的人 脑部激活范围 比阅读【英语】的人大。英语
阅读者在阅读时主要激活 左脑 的一些部分,而汉语阅读者则同时激活左右脑,这是一
个很有意思的发现
因为,时序信号(语音就是时序信号)的处理区域一般在左脑
图像、空间信息的处理区域一般在右脑
所以,很多人认为,汉语阅读者的阅读实际上有两个处理通道,就是说,在阅读汉
语时,我们总是一边通过图像来直接识别文字含义,一边通过图像转换为读音然后来识
别文字含义,而表音语言只有一条显著的处理通道
十二、不够严谨?
有人说【汉语】的劣势就是不够严谨,这其实可以说是孤立语和综合语的差异。孤
立语对于词的具体含义需要通过上下文确定,如果上下文给予信息不足,就有可能出现
歧义。而很多时候,上下文只能表明这个词更可能是什么意思,而不能完全否定其他理
解,这虽然在交流中不会有什么问题,但是在那些防止别人钻空子的文件里就可能造成
问题
我们举个例子:“中国绝不会首先使用核武器。”
这句话有三种解释:
1、在敌方没有使用核武器之前,中国不会使用核武器
2、中国在使用常规武器之前不会使用核武器
3、中国不会是世界上第一个使用核武器的国家
很显然理解应该是1,但是并无法否定2和3的可能性
因此,很多人认为【汉语】的这种不严谨性会妨碍法律条文和合同。
但是英文难道就很严谨么?
He ran into a girl with an umbrella
带伞的是男的还是女的?
I saw a car with a big flag, whichlooked really evil
哪个看起来很邪恶,车还是旗子?
China will not be the first to use anuclear weapon.
这应该是上面的解释1还是3?
想要做到严谨,都需要考虑到其他人阅读时的想法,然后用其他语句来消除歧义
顺便推荐搞笑英语书籍《Anguished English: AnAnthology of Accidental
Assaults Upon OurLanguage》里面收录了很多爆笑的歧义句,比如 If you have not
got any fresh vegetables, you may get canned
所以,汉语要想说的严谨,也是没有问题,只不过要比一般多一些口舌而已
分析语本身的表意效率就很高,多花一些笔墨,达到严谨的效果,也是完全可以做
到的
所以这方面如果有差距的话,差距也不大
j****i
发帖数: 68152
3
小破熊出本书吧。
N******K
发帖数: 10202
4
tnb了 哪找的? 哈哈

【在 w*********g 的大作中提到】
: 为什么汉语是世界上最先进的语言
: 一、语言水平高低的评判准则
: 口语,实际上是一种通讯协议。就是说,语言实际上是把人的思想通过发音器官变
: 成一串频率不同、波形不同的声波,然后被另一个体的听觉器官和相关的脑部组织重新
: 转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于
: 传输的信号的规则
: 计算机上,通讯协议有两个基本评判标准:【传输效率】和【抗噪能力】
: 传输效率:在单位时间里,按照该通讯协议能够传输多少信息。
: 抗噪能力:这种通讯方式能够在多大的噪音下仍然保证绝大多数信息正确传输。
: 【传输效率】又分两个方面,编码效率和传输速度

d*******r
发帖数: 3299
5
小破熊你整理一下,大家让版主置顶吧

【在 w*********g 的大作中提到】
: 为什么汉语是世界上最先进的语言
: 一、语言水平高低的评判准则
: 口语,实际上是一种通讯协议。就是说,语言实际上是把人的思想通过发音器官变
: 成一串频率不同、波形不同的声波,然后被另一个体的听觉器官和相关的脑部组织重新
: 转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于
: 传输的信号的规则
: 计算机上,通讯协议有两个基本评判标准:【传输效率】和【抗噪能力】
: 传输效率:在单位时间里,按照该通讯协议能够传输多少信息。
: 抗噪能力:这种通讯方式能够在多大的噪音下仍然保证绝大多数信息正确传输。
: 【传输效率】又分两个方面,编码效率和传输速度

d*******r
发帖数: 3299
6
查了下wiki,英文还真是在向 分析/孤立 语的方向发展
http://zh.wikipedia.org/wiki/%E5%88%86%E6%9E%90%E8%AF%AD
而现代英语和保加利亚语的语法则朝向分析语的方向发展(见下面的英语词汇例子)。
[3][4]

【在 w*********g 的大作中提到】
: 为什么汉语是世界上最先进的语言
: 一、语言水平高低的评判准则
: 口语,实际上是一种通讯协议。就是说,语言实际上是把人的思想通过发音器官变
: 成一串频率不同、波形不同的声波,然后被另一个体的听觉器官和相关的脑部组织重新
: 转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于
: 传输的信号的规则
: 计算机上,通讯协议有两个基本评判标准:【传输效率】和【抗噪能力】
: 传输效率:在单位时间里,按照该通讯协议能够传输多少信息。
: 抗噪能力:这种通讯方式能够在多大的噪音下仍然保证绝大多数信息正确传输。
: 【传输效率】又分两个方面,编码效率和传输速度

v*****2
发帖数: 280
7
谢谢楼主,非常感谢。
t*m
发帖数: 1044
8
同意。可是奇怪受中国影响那么大的日本竟然发展出来一种不伦不类,比西方字母语言
还破的日语。罗嗦,元音少,歧义多。
最烦老外语言(包括日语)的就是每个星期的哪天,每年的哪个月都有不同称呼。各种
天灾也有不同名字(Katrina,Sandy, Arthur, etc.)。实在是脑残。让人脑白白浪费在
记忆这些毫无意义的称号上。汉语全部给于编号就行了。简单又容易记忆。什么公鸡,
母鸡,小鸡,不都是鸡吗?鸡肉就是鸡的肉,牛肉就是牛的肉,干吗要换个完全没有关
联的新词表示?梅花鹿,驯鹿,麋鹿都是鹿,英语从字面上完全看不出这些动物的相似。
l***l
发帖数: 291
9
一切理论都是纸老虎, 作为海外华人, 把自己的母语传下去才是正经。 自家子女不
会中文就是失败。 咔咔咔。加油
B*********L
发帖数: 700
10
绳结是3维文字,编码效率比汉语更高,信息密度更大。请LZ把这篇传世之作用结绳记
事的方式表达出来,否则就是对不起祖宗的祖宗。
相关主题
自由远比字母更重要万倍学了几句鸟语,简直就是汉语的一个方言
汉语是一种落后的语言两个例子说明英语的落后性
西方社会注重沟通,是因为表音文字沟通困难 zz人有三逼:牛逼、吊逼、苦逼,话有三语:汉语、英语、西班牙语
进入Military版参与讨论
B*********L
发帖数: 700
11
看看这篇,《汉语中70%词汇来自日语》:
当中国人初次接触日语时,会发现日语中有很多的汉语词,并因此油然产生一种自豪感
;但是,如果告诉你汉语中有许多的日语词时,你会作何感想呢。
中日之间的文化交流史上,有着许多有趣味也有意味的事。从大的方面说,有两个
时期的情形特别引人注目。一是在中国唐代,一是在 近代。在唐代,是日本贪婪地向
中国学习,甚至是在与中国文化接触后,大和民族才首次与文字遭遇,从此才学会了书
写。日语的“假 名”(字母)不过是汉字的变体。而在近代,则是中国拼命地向日本
学习。别的方面且不论,仅就语言文字方面说,在近代,倒是日本成了 汉语的输出国
。日本“汉语”,冲击着东亚各国的语言系统,当然也大量进入中国的汉语中,成为中
国人日常语言的重要组成部分。
在近代由日本输入的汉语词,被称作日语“外来语”,这里也借用这种称谓。
在“外来语”上加上引号,是为了与直接来自西方的外来 语(如沙发、咖啡、逻辑等
)相区别。因为这二者毕竟有些不同。
现代汉语中的日语“外来语”,数量是很惊人的。据统计,我们今天使用的社
会和人文科学方面的名词、术语,有70%是从日本输入 的,这些都是日本人对西方相
应语词的翻译,传入中国后,便在汉语中牢牢扎根。我们每天用以高谈阔论、冥思苦想
和说“东”道“西”时 所用的概念,竟大都是日本人弄出来的,——想到这一层,我
的头皮就有些发麻。
实际上,离开了日语“外来语”,我们今天几乎就无法说话。就在我写这篇谈
论日语“外来语”的文章时,也必须大量使用日语“外来 语”,否则就根本无法成文
。这个问题近几年也不时被人以不同的方式道及。例如,雷颐先生在介绍美国学者任达
的《新政革命与日本》一 书的《“黄金十年”》一文中,便写道:
通过大量的翻译引介,一大批日语词汇融入到现代汉语之中。有意思的是,这
些词汇甚至迅速取代了“严译”(按:指严复的翻译)的 大部分术语。这些几乎涉及
各类学科的新词汇或是现代日本新创造的,或是使用旧词而赋以新意,现在又被广大中
国知识分子所借用,这大 大丰富了汉语词汇,并且促进了汉语多方面的变化,为中国
的现代化运动奠定了一块非常重要的基石。现在我们常用的一些基本术语、词 汇,大
都是此时自日本舶来。如服务、组织、纪律、政治、革命、政府、党、方针、政策、申
请、解决、理论、哲学、原则等等,实际上全 是来自日语的“外来语”,还有像经济
、科学、商业、干部、健康、社会主义、资本主义、法律、封建、共和、美学、文学、
美术、抽象 ……数不胜数,全是来自日语。
雷颐先生是以肯定的口气谈到日语对汉语的侵入的。而李兆忠先生的《汉字的
圈套》一文,则在与雷颐先生做了相同的介绍后,不无遗 憾地写道:
这真是个值得思索的问题,同样一个西方科学术语,到了中国和日本,就被译
成两种味道相去甚远的词,最后却是以中译失败,日译胜 利而告终,这是为什么 或者
换一种不太合理的问法:严复、梁启超们为什么没有想到采用明治初期的日本学者那种
比较自由和通俗的意译 法?同样,明治初期的日本学者为什么没有像二十年之后的大
陆学者那样,采用那种引经据典式的译法这里把梁启超与严复相提并论有些不 妥,但
提出的问题确实是值得思索的。汪丁丁先生的《“经济”原考》一文,是对“经济”二
字的汉语原意进行追溯,实际上也同样涉及到 日语“外来语”问题,因为“经济”也
是众多日语“外来语”中的一个。而考古学家陈星灿先生的《考古学就在我们身边》一
文,倡议中国 的考古学“建立自己的话语系统”,因为“所谓的国家、文明。私有制
等等概念都是从国外输入的”,它们用来说明中国古代的情形或许并 不很合适。陈先
生所说的这些概念,虽然源自西方,但毕竟是日本人把它们译成现在这样的汉语词的。
对这些概念的反思,也必然引发对翻 译过程的追问。
以上是我近年偶然见到的涉及到日语“外来语”的文章中的几篇。这些文章,
也引发我对这一问题的兴趣。
20年前,当我开始学习日语时,我发现日语中有那样多的汉语词,这令我有过
短暂的惊奇;而后来,当我知道汉语中有那样多的日语词 时,我却不得不有持久的惊
讶。
先是汉字和汉语词汇进入日本,并造就了日本的书面语;当日本在近代与西方
相遇后,便大量使用汉字和汉语词去译相应的西方名词、 术语;出自日本学人之手的
这些译语,在清末又潮水般涌入中国。——这个过程很复杂,也很有趣。我所能接触的
资料十分有限,只能勉强 说出一个大概。
二、
语言中的词汇, 有名词、 动词、形容词等数种区分。现代汉语中的所谓日语
“外来语”,基本属名词类。但名词本身也可分为两类。一 类是对可见可感可触的很
具体的事物、场景的命名,如桌、椅、草、木、山、川、日、月等等;一类则表示一种
抽象的意义,也就是所谓术 语、概念,如政治、经济、民主、自由、科学、文化等等
。前者可称之为具象名词,后者可称之为抽象名词。
在日语“外来语”中,具象和抽象两类名词都有。具象名词今天仍在使用的,
可举“电话”和“俱乐部”两词为例。“电话”是日本人 生造的汉语词,用来意译英
文的telephone。当初中国人对这个英文词采取了音译,译作“德律风”。在一段时期
内,“电话”和“德律风”两 种叫法通用。但后来,“德律风”这种叫法终于湮灭。
关于这个译名,我发现过一点有趣的资料。本世纪初年,一群在日本的绍兴籍留学生
曾联名给家乡写回一封长信,其中详细介绍了日本的近代化情形,鲁迅也列名其中。信
中说到“电话” 时,特意注释道:“以电气传达言 语,中国人译为‘德律风’,不如
电话之切。”于此亦可见日语输入中国的途径之一种。而“俱乐部”则是日本人对英文
Club的音译。这几 个汉字,音、形、意三方面都是绝佳的选择,所以在中国沿用至今
。但也有些日译具象名词进入中国后,又被淘汰例如“虎列拉”,在中国 曾被使用了
相当长的时间,但如今却被“霍乱”取代。
具象名词本身也许并不值得多谈,我感兴趣的是抽象名词。但具象名词与抽象
名词之间,有时并无明确的界限。有些名词,在古汉语中 本不具有抽象的意义,传入
日本后,则被抽象化。
在与汉字遭遇之前,大和民族没有自己的文字,但却有自己的语言系统。在原
有的日语中,具象名词很丰富,对种种具体事物都有很精 确的命名,但抽象名词却极
不发达。这也并不奇怪。当一个民族还没有自己的文字时,是不可能有发达的抽象思维
的,因而也就不会有大量 的概念产生。只是在与汉语接触后,汉语中众多的抽象名词
才进入日本原有的语言中。汉语中的种种具象名词,例如山、川、草、木、日、 月、
云、雾,等等,虽也传入日本,但日本人可按照自己原有的发音来读这些汉字,但像汉
语中的自然、道德、政治、经济、风流、文学这 类抽象名词,因日语中原本就没有相
应的词与之匹配,便只能模仿汉语的发音来读这些词。在大和民族与汉语相遇时,汉语
中的抽象名词, 在音、形、意三方面对他们都是陌生的。
而在近代,当日本与西方语言遭遇后,大量采用汉语抽象名词去译西方概念,
例如,用“经济”译“economy”,用“自 然”译“nature”,用“文学”释“
literaure”。作为中国人,我们应该知道这些被日本人用来译西方的词汇,原本是从
中国输入的,但我们更 应该知道,这些汉语词在传入日本后,其中不少意义都不同程
度地发生了变化。抽象名词从一个民族传入另一个民族,不可能始终保持原汁 原味,
即便在文化发展阶段相等的两个民族间,也可能发生误读和误解,何况当时的日本在文
化发展阶段上与中国如此悬殊。那一大批植根 于中国文化中的抽象名词被日本移植过
去后,要真正在日本文化中扎根生长,就必然要与汉语原意发生某种程序的分离。日本
现代学术界对 这些汉语词在古汉语中的原意以及传入日本后的意义变化,也多有考索
。例如“经济”一词,在古汉语中指“经世济俗”、“治国平天 下”,但传入日本后
,则意义变得狭窄起来,被专用来指财务经营、财政措施。再如“自然”这个词,在古
汉语中指不依赖人力,或人对之 无能为力的现象,但在传入日本后,却具有了“偶然
”、“万一”、“意外”这几种意思。
还有的词,在汉语中原本只被用于一种很具象的场合,并不具有明显的抽象意
义,但在传入日本后,词义则渐渐向抽象的方向发展。例 如,现代汉语中的“社会”
这个词,已是一个抽象名词, 是日语“外来语”中的一个。这是日本学人对西方“
society”的翻译。但“社 会”在古汉语中,基本上是一个具象名词,特指每年春秋两
季乡村学塾举行的祭祀土地神的集会。《辞海》上举《东京梦华录·秋社》中的一 段
话来说明这个词:“八月秋社……市学先生预敛诸生钱作社会,以致雇倩祗应、白席、
歌唱之人。归时各携花篮、果实、食物、社糕而 散。春社、重午、重九,亦是如此。
”但这个词传入日本后,渐渐别有所指。据日本学者铃木修次考证,在江户末期,日本
已将以教会为中 心的教团、教派称作“社会”,这就已经使这个词具有一定程度的抽
象意义。
三、
对日本近代学人用汉语词译西文概念的过程,我一直很感兴趣。在这个过程中
,一定有种种权衡、取舍,有迟迟找不到一个合适译语的 苦恼,也有绞尽脑汁后终于
“吟安”一个译话的欣喜,当然,也可能有不得不姑且用一个并不很合适的译语时的遗
憾。由于资料的限制,对 这个过程,我尚不能知道得很多。但可以断定的是,日本近
代学人在译西文概念时,大体有以下几种方式。
第一种方式,仍是向中国学习。从时序上说,中国接触西方文化远比日本早。
早在7世纪的时候,就有基督教僧侣来中国传教。此后,13 世纪的马可·波罗,16世纪
的利玛窦,是广为人知的西方文化在古代的使者。在利玛窦的时候,西方汉译的工作已
开始。徐光启与利玛窦合 作,翻译了欧几里德的《几何原本》,这是人所共知的。
1870年,新教传教士莫里逊来到中国。他把《新约》译成汉语,全版《新约》于 1814
年出版。更重要的是,他还编了一本汉英词典,词典第一卷于1817年印行,整部词典四
开本,共六卷,4595页,于1823年出齐。传教士 与中国合作者所从事的西方汉译的工
作,尤其是汉英词典的编纂,为近代日本学人翻译西文概念提供了借鉴。他们也许并没
有过多地袭用传 教士和中国合作者的译法,但他们无疑会从这类西文东译的先行者那
里得到不少启发。日本现代学者在论及本国近代的翻译工作时,往往不 忘提及利玛窦
、徐光启。莫里逊这些先行者所提供的参考。我们今天所使用的有些名词、术语,正是
当初在中国的传教士和中国的合作者共 同创造的译法。对这类译语进行全面的列举是
一件难事,但据日本学者考证,至少“数学”、“理论”、“银行”、“保险”、“批
评”、“电气”这数例,属日本近代学人对中国已有译法的袭用。在人们谈到现代汉
语中的日语“外来语”时,这些往往也被包括在内,这 是不正确的。
第二种方式,是对汉语词的原意加以改造,使之适合于作西文概念的译语。通
过这种方式产生的译语很多。例如革命、艺术、文化、文 明、文学、封建、阶级、国
家、演说、民主、自由、经济、社会,等等,都属这一类。上文说到,有些汉语词输入
日本后,意义已自然而然 地发生了变化,例如“经济”、“社会”等。日本学人在选
定这种汉语词来译“economy”、“society等相应的西文概念时,该不会有过多的 犹
豫。而更多的时候,日本学人必须对汉语词的原意进行有意识的加工,才能为某个西文
概念选定一个大体合适的译语。将汉语词的语意抽 象化,是日本学人改造汉语词意的
一种途径。例如“阶级”一词,汉语原意指台阶和官位俸给的等级,不具多少抽象的意
义,当日本学人 把“阶级”作为西文“class”的译语后,便将这个词大大抽象化 另
一种途径则是将汉语词的原意缩小,即取其原意中的一部分,来译西文概 念。例如“
文学”这个词,汉语原意十分宽泛,一切文字形态的书籍文献,都属“文学”之列,在
汉唐,“文学”还是一种官职。而当日本 学人用“文学”来译西文的“literature”
时,只取了其中的一部分含义。还有一种途径,便是对汉语词仅仅假其字而完全不取其
义,甚至赋予 一种与汉语原意完全相反的意义。例如“民主”这个词,汉语原意指“
庶民之主宰”,而当日本学人用以译西文的“democracy”时,便令其 表达了一种与汉
语原意截然对立的意义。
第三种方式,是新造汉语词。面对西文概念,在现有汉语词汇中实在找不到相
应的词可作译语时,日本学人便利用汉字组成新的词。以 这种方式产生的西文译语也
颇不少。在具象名词中,上文所说的“电话”便属这种类型。在抽象名词中,个人、民
族、宗教、科学、技术、 哲学、美学等等,都属日本学人生造的汉语词。例如“哲学
”一词,为在西文东译方面做出卓越贡献的西周所造,用以译西文 的“philosophy”
;“美学”则为有“东洋卢梭”之誉的中江兆民所造,用以译西文的“aesthetics”。
以上几种方式,日本现代学者都曾提到。但我还发现另一种情形,即被日本近
代学人从汉籍中选取用作西文译语的词,在汉语中原本并 不构成一个词。例如“主义
” 这个词,在古汉语中并不存在。日本现代学者在考证“主义”语源时,却说“主义
”一词原为汉籍中所有,并 举了《史记·太史公自序》中的“敢犯颜色以达主义”一
语为证,意谓日本近代学人仍是从汉籍中找到“主义”这个现存的同去译英文的词 尾
“ism”。但太史公这句话中的“主”指主上,也就是汉文帝,全句本意是说敢于犯颜
强谏,致皇上于义。所谓“达主义”,不是说自己要 坚持实现某种信念,而是说使主
上抵达义的境界。在这句话中,“主义”根本不构成一个独立的语言成分。有趣的是,
日本出版的《大汉和 词典》中,也举《太史公自序》中的这句话为“主义”一词的汉
文出典。日本近代学人有可能是将汉籍中的“主义”误读成一个词,并作了 望文生义
的理解,再以译西文的“ism”。不过,日本近代学人汉文程度都很高,也可能他们根
本没有误解汉文,“主义”不过是他们新造的 一个词,与“以达主义”这种汉文中的
“主义”无关。而误解误读的,只是后来的考证者。
值得一说的是,今天在中日两国被广泛使用的那些作为西文译语的名词、概念
,也并非一开始便在日本被普遍承认的。在日本近代开始 大量译介西方著作的时候,
往往同一个西文名词、概念,有数种译法,且在相当长的时期内,数种译法并存,而最
终站住了脚的那种译法, 也是在与其他译法的争斗中才存活下来的。例如,“
literature”这个西文词,一开始在日本至少有“文章学”和“文学”两种译法,最后
“文 章学”被淘汰,“文学”被普遍认可。但直到本世纪30年代,日本学者冈崎义惠
还对“文学”这一译名表示疑义,他认为“文学”这一概念 包含着诗文和诗文之学两
种意思,词义暧昧不明,建议将“文学”这一说法废弃,分别用“文艺”来指称诗文,
用“文艺学” 来指称诗文之 学。当然,这种疑义大概已不可能动摇“文学”这个概念
的地位再如“art”这个概念,一开始有“艺术”、“美术”、“文学技艺”等数种 译
语并行,直到本世纪初年,“艺术”才最终战胜其他译法而取得牢固地位。有的译语的
产生、定型,所经历的过程十分艰难曲折。例 如“个人”这个概念,今天在中日两国
被使用的频率都很高。这是西文“individual”的译语。汉语中原没有“个人”这个词
,据日本现代学者 考证,“个人”这个译语的选取,本是对汉语“一个人”的省略。
在一开始,也曾直接用“一个人”来译“individual”,而且在很长时期内, 这个西
文概念在日本有多种译法并存,“各殊之人身”、“独一者”、“人”、“独一个人”
、“私人”等译语都曾被使用,“个人”这种 译法并不是最早出现的,但却最终获胜

四 、
1898年秋,戊戌变法失败后的梁启超,潜入日本军舰大岛号,亡命东瀛。海上
的时光是漫长而无聊的。为打发无聊,并不通日文的梁启 超借来了一本日本作家东海
散士所作的小说《佳人之奇遇》,翻开一看,除了一些日文格助词外,竟满纸都是汉字
,甚至颇多“之乎者 也”,令梁启超能看懂个大概,并且能看起兴趣来,同时也让梁
启超悟到,用小说启发民智,宣传变法维新思想,是一种极好的方式。想到 这一点,
梁启超一定很兴奋。在横滨住下后,他创办了面向国内读者的《清议报》,在创刊号上
他发表了《译印政治小说序》,在这篇宣言 式的文章后面,是《佳人之奇遇》的汉译
连载;《佳人之奇遇》连载完之后,紧接着又开始连载日本作家野龙溪的小说《经国美
谈》的汉译。——两部小说的译文,都出自并不通日文。
附:上海外国语大学教授陈生保1996年著文,指出「共产党、干部、指导、社
会主义、市场、经济」这句话完全是日语外来语组成的。文章中将日语外来语分为以下
几类:
一、修饰词+被修饰词
(1) 形容词+名词
例:人权、金库、特权、哲学、表象、美学、背景、化石、战线、环境、艺术
、医学、入场券、下水道、公证人、分类表、低能儿
(2) 副词+动词
例:互惠、独占、交流、高压、特许、否定、肯定、表决、欢送、仲裁、妄想
、见习、假释、假死、假设
二、同义词复合
例:解放、供给、说明、方法、共同、主义、阶级、公开、共和、希望、法律
、活动、命令、知识、综合、说教、教授、解剖、斗争
三、动词+宾语
例:断交、脱党、动员、失踪、投票、休战、作战、投资、投机、抗议、规范
、动议、处刑
四、由上述单词组成的复合词
例:社会主义、自由主义、治外法权、土木工程、工艺美术、自然科学、自然
淘汰、攻守同盟、防空演习、政治经济学、唯物史观、动脉硬化、神经衰弱、财团法人
、国际公法、最后通牒、经济恐慌
其他还有:
[动词]
服从、复习、支持、分配、克服、支配、配给
[自然科学和社会科学的基本概念]
哲学、心理学、论理学、民族学、经济学、财政学、物理学、卫生学、解剖学
、病理学、下水工学、土木工学、河川工学、电气通信学、建筑学、机械学、簿记、冶
金、园艺、和声学、工艺美术
[结尾词]
(1) 化:一元化、多元化、一般化、自动化、现代化等
(2) 式:流动式、简易式、方程式、日本式、新式等
(3) 炎:肺炎、胃炎、关节炎、气管炎、皮肤炎等
(4) 力:生产力、原动力、想像力、劳动力、记忆力等
(5) 性:可能性、必然性、偶然性、周期性、习惯性等
(6) 的:大众的、民族的、科学的、绝对的、公开的等
(7) 界:文学界、艺术界、思想界、学术界、新闻界等
(8) 型:新型、大型、流线型、标准型、经验型等
(9) 感:美感、好感、优越感、敏感、读后感等
(10) 点:重点、要点、焦点、观点、出发点、盲点等
(11) 观:主观、客观、悲观、乐观、人生观、世界观、宏观、微观等
(12) 线:直线、曲线、抛物线、生命线、战线、警戒线等
(13) 率:效率、生产率、增长率、利率、频率等
(14) 法:辨证法、归纳法、演绎法、分析法、方法、宪法、民法、刑法等
(15) 度:进度、深度、广度、强度、力度等
(16) 品:作品、食品、艺术品、成品、展品、废品、纪念品等
(17) 者:作者、读者、译者、劳动者、缔造者、先进工作者等
(18) 作用:同化作用、异化作用、光合作用、心理作用、副作用等
(19) 问题:人口问题、社会问题、民族问题、教育问题、国际问题等
(20) 时代:旧石器时代、新石器时代、新时代、旧时代等
(21) 社会:原始社会、奴隶社会、封建社会、资本主义社会、社会主义社会、
国际社会等
(22) 主义:人文主义、人道主义、浪慢主义、现实主义、帝国主义、排外主义等
(23) 阶级:地主阶级、资产阶级、中产阶级、无产阶级等
“现代汉语中的日语“外来语”,数量是很惊人的。据统计,我们今天使用的社会
和人文科学方面的名词、术语,有70%是从日本输入的,这些都是日本人对西方相应语
词的翻译,传入中国后,便在汉语中牢牢扎根。我们每天用以高谈阔论、冥思苦想和说
“东”道“西”时所用的概念,竟大都是日本人弄出来的,—想到这一层,我的头皮就
有些发麻。”
这个“据统计”的“70%”是否有水分,可以探讨。我们且在下面根据权威资料辑
录一些也许您并不陌生、又绝非冒牌的这70%及其以外的部分地道日语来 ,看看您是把
它推翻,还是也能一同“头皮发麻”。
现代汉语日本外来语摘要
B:、白夜、百日咳、版画、半径、半旗、饱和、保险、保障、备品、背景、必要、
编制、变压器、辩护士 标本、标高、表决、表象、病虫害、舶来品、博士、博物、不
动产、不景气 ……;
C:、财阀、采光、参观、参看、参照、策动、插话、茶道、长波、常备兵、常识、
场合、场所、衬衣、成分、成员、承认、乘客、乘务员、宠儿、抽象、出版、出版物、
出超、出发点、出口、出庭、初夜权、处女地、处女作、储藏、储蓄、触媒、传染病、
创作、催眠、催眠术、错觉 ……;
D:、大本营、大局、大气、代表、代言人、代议士、贷方、单纯、单利、单位、单
行本、但书、蛋白质、导火线、德育、登记、登载、等外、低调、低能、低能儿、低压
、敌视、抵抗、地上水、地下水、地质、动态、动议、动员、独裁、独占、读本、短波
……;
E:、二重奏 ……;
F:、发明、法律、法人、法庭、法则、番号、反动、反对、反感、反射、反响、反
应、泛神论、泛心论、范畴、方案、方程式、方程、方针、放射、分解、分配、分析、
分子、风琴、封建、封锁、否定、否决、否认、服务、服用、辐射、复式、复员、复制
、副食、副官、副手 ……;
G:、改编、改订、概括、概略、概念、概算、感性、干部、干事、干线、纲领、高
潮、高利贷、高炉、高射炮、高周波、歌剧、工业、攻守同盟、公报、公立、公民、公
判、公仆、公认 公诉、公营、公债、共产主义、共和、共鸣、古柯、固定、固体、故
障、关系、观测、观点、观度、观念、观照、光年、光线、广场、广告、广义、归纳、
规范、规则、国际、国教、国库、国立、国税、国体、过渡 ……;
H: 海拔、寒带、寒流、航空母舰、和服、黑死病、弧光、化石、化学、化妆品、
画廊、环境、幻灯、幻想曲、回收、会谈、会社、会谈、混凝土、活跃、火成岩 ……

J:、机关、机关枪、机械、积极、基地、基调、基督、基督教、基质、基准、集团
、集中、计划、记号、记录、技师、加农炮、假定、假分数、假名、假想敌、尖兵、尖
端、坚持、检波器、简单、见习、间接、间歇泉、间歇热、建筑、鉴定、讲师、讲坛、
讲习、讲演、讲座、交感神经、交换、交通、交响乐、脚本、脚光、教科书、教授、教
养、教育学、酵素、阶级、接吻、节约、结核、解放、解剖、介入、借方、金额、金刚
石、金婚式、金牌、金融、金丝雀、紧张、进度、进化、进化论、进展、经费、经济、
经济恐慌、经济学、经验、精神、景气、警察、警官、净化、静脉、竞技、就任、拘留
、巨匠、巨头、巨星、具体、俱乐部、剧场、决算、绝对、觉书、军部、军国主义、军
籍、军需品……;
K:、看护妇、看守、科目、科学、可决、客观、客体、课程、肯定、空间、坑木、
会计、扩散 ……;
L:、浪人、劳动、劳动者、 劳动组合、劳作、累减、类型、冷藏、冷藏车、冷战
、理论、理念、理事、理想、理性、理智、力学、立场、立宪、例会、量子、了解、列
车、淋巴、临床、领海、领空、领土、流感、流体、流行病、流行性感冒、伦理学、论
理学、论坛、论战、落选 ……;
M:、码、麦酒、脉动、漫笔、漫画、漫谈、盲从、媒质、美感、美化、美术、免许
、民法、民主、敏感、明确、明细表、命题、母体、母校、目标、目的…… ;
作者: 121.16.112.* 2007-9-23 14:21   回复此发言
------------------------------------------------------------------------
--------
3 现代汉语日本外来语的震撼与中国改革
N:、内服、内阁、内幕、内勤、内容、内在、能动、能力、能率、农作物、暖流
……;
O:、偶然、 ……;
P:、派遣、判决、陪审、陪审员、配电盘、配给、批评、片假名、平假名、平面、
评价、坪 ……;
Q:、旗手、骑士、企业、气氛、气密、气体、气质、气船、气笛、牵引车、铅笔、
前提、前卫、前线、强制、侵犯、侵略、勤务、清教徒、清算、情报、驱逐舰、取缔、
取消、权威、权限、权益、权利 ……;
R:、人格 人力车、人权、人文主义、人选、日程、溶体、肉弹、入场券、入超、
入口 ……;
S:、商法、商业、上水道、少将、少尉、社会、社会学、社会主义、社交、社团、
身分、神经、神经过敏、神经衰弱、审美、审判、审问、升华、生产、生产关系、生产
力、生理学、生命线、生态学、剩余价值、失效、时计、时间、时事、时效、实感、实
绩、实权、实业、使徒、世纪、世界观、市场、市长、事变、事态、事务员、手工业、
手榴弹、手续、受难、输出、输入、苏铁、水成岩、水密、水素、水准、私法、私立、
思潮、思想、死角、所得税、所有权、索引…… ;
T:、他律、塌塌米、台、台车、太阳灯、探海灯、探险、探照灯、特长、特务、誊
写版、体操、体育、天鹅绒、天主、条件、铁血、通货膨胀、通货收缩、同情、统计、
投机、投影、投资、图案、图书馆、退化、退役 ……;
W: 瓦、瓦斯、外分泌、外勤、外在、唯心论、唯物论、卫生、味之素、胃溃疡、
尉官、温床、温度、温室、文化、文库、文明、文学、无产阶级、无产者、舞台、物理
、物理学、物语、物质、悟性 ……;
X:喜剧、系列、系数、系统、细胞、下水道、纤维、现金、现实、现象、现役、
宪兵、宪法、相对、想象、象征、消防、消费、消化、消火拴、消极、小夜曲、小型、
校训、效果、协定、协会、心理学、新闻记者、信号、信托、信用、猩红热、刑法、形
而上学、性能、序幕、宣传、宣战、选举、旋盘、学府、学会、学历、学士、学位、血
色素、血栓、血吸虫、训话、训令、讯问 ……;
Y:压延、雅乐、演出、演说、演习、演绎、演奏、燕尾服、羊羹、阳极、业务、
液体、医学、遗传、义务、议决、议会、议员、议院、艺术、异物、意匠、意识、意义
、意译、阴极、音程、银行、银幕、引渡、印鉴、印象、营养、影象、优生学、游离、
游弋、右翼、语源学、预备役、预后、预算、元帅、元素、园艺、原动力、原理、愿意
、原则、原子、原罪、原作、远足、运动、运动场、运转手 ……;
Z:杂志、展览会、战线、哲学、真空管、阵容、政策、政党、支部、支配、支线
、知识、直观、直接、直径、直觉、直流、止扬、纸型、指标、指导、指数、制版、制
裁、制限、制御器、制约、质量、中将、终点、仲裁、仲裁人、重点、重工业、株式会
社、烛光、主笔、主动、主观、主人公、主食、主体、主义、注射、专卖、转炉、资本
、资本家、资料、紫外线、自律、自然淘汰、自由、自治领、宗教、综合、总动员、总
理、总领事、组成、组阁、组合、组织、最惠国、左翼、作品、作物、作者、座谈、坐
药……。
上面这些词语,是根据前人严谨可靠的相关研究文献,在二十多年前集录出来的,
不包括新近资料。这些来自日本的中国本土化了的现代汉语中的这种近代新兴外来语日
文词汇,是实实在在的存在客体,是我们从人家那里拿来的,就像当年大和民族从大汉
民族拿去汉字一样,不过位置颠倒了一下,我们拿来也丰富了我们近代捉襟见肘无能为
力的古老语言,接受、承载和推进了我们大中华的文明进步。意外吗?吃惊吗?都不必
。现实往往就是这样残酷。希望您看了之后,震撼之余,能有所反思与启迪,而不是简
单地骂娘,则幸甚。
s***k
发帖数: 2754
12
70%? lol

【在 B*********L 的大作中提到】
: 看看这篇,《汉语中70%词汇来自日语》:
: 当中国人初次接触日语时,会发现日语中有很多的汉语词,并因此油然产生一种自豪感
: ;但是,如果告诉你汉语中有许多的日语词时,你会作何感想呢。
: 中日之间的文化交流史上,有着许多有趣味也有意味的事。从大的方面说,有两个
: 时期的情形特别引人注目。一是在中国唐代,一是在 近代。在唐代,是日本贪婪地向
: 中国学习,甚至是在与中国文化接触后,大和民族才首次与文字遭遇,从此才学会了书
: 写。日语的“假 名”(字母)不过是汉字的变体。而在近代,则是中国拼命地向日本
: 学习。别的方面且不论,仅就语言文字方面说,在近代,倒是日本成了 汉语的输出国
: 。日本“汉语”,冲击着东亚各国的语言系统,当然也大量进入中国的汉语中,成为中
: 国人日常语言的重要组成部分。

w*********g
发帖数: 30882
13

原来中国人是从19世纪末才开始用汉语的?
把汉字的顺序变一变就宣称自己发明了70%的汉语?这个玩笑开大了。 那么之前中国人
说话都是没有词汇的么?

【在 B*********L 的大作中提到】
: 看看这篇,《汉语中70%词汇来自日语》:
: 当中国人初次接触日语时,会发现日语中有很多的汉语词,并因此油然产生一种自豪感
: ;但是,如果告诉你汉语中有许多的日语词时,你会作何感想呢。
: 中日之间的文化交流史上,有着许多有趣味也有意味的事。从大的方面说,有两个
: 时期的情形特别引人注目。一是在中国唐代,一是在 近代。在唐代,是日本贪婪地向
: 中国学习,甚至是在与中国文化接触后,大和民族才首次与文字遭遇,从此才学会了书
: 写。日语的“假 名”(字母)不过是汉字的变体。而在近代,则是中国拼命地向日本
: 学习。别的方面且不论,仅就语言文字方面说,在近代,倒是日本成了 汉语的输出国
: 。日本“汉语”,冲击着东亚各国的语言系统,当然也大量进入中国的汉语中,成为中
: 国人日常语言的重要组成部分。

t*m
发帖数: 1044
14
中文吸收日语外来词并没什么不好。因为中文将这些外来词整合的非常好,而且这些外
来词说到底也是同源,跟汉语词汇的基本结构类似。
但是日语吸收那些不伦不类的西方外来词,把本来就破的日语搞的更破了。
日语最大的不足在语法,然后是音素的缺乏(容易造成啰嗦和歧义,就是楼主说的信息
密度小)。

【在 B*********L 的大作中提到】
: 看看这篇,《汉语中70%词汇来自日语》:
: 当中国人初次接触日语时,会发现日语中有很多的汉语词,并因此油然产生一种自豪感
: ;但是,如果告诉你汉语中有许多的日语词时,你会作何感想呢。
: 中日之间的文化交流史上,有着许多有趣味也有意味的事。从大的方面说,有两个
: 时期的情形特别引人注目。一是在中国唐代,一是在 近代。在唐代,是日本贪婪地向
: 中国学习,甚至是在与中国文化接触后,大和民族才首次与文字遭遇,从此才学会了书
: 写。日语的“假 名”(字母)不过是汉字的变体。而在近代,则是中国拼命地向日本
: 学习。别的方面且不论,仅就语言文字方面说,在近代,倒是日本成了 汉语的输出国
: 。日本“汉语”,冲击着东亚各国的语言系统,当然也大量进入中国的汉语中,成为中
: 国人日常语言的重要组成部分。

u***r
发帖数: 7
15
好文章,受教了
w***g
发帖数: 5958
16
先进是先进,不过人家不用你能怎么样。中国在文言文时代确实文化很发达,但到现在
已经落后西方太多了。别说英文,中国当代的文化连日本都不如,光靠论证语言的先进
性有个P用。

【在 w*********g 的大作中提到】
: 为什么汉语是世界上最先进的语言
: 一、语言水平高低的评判准则
: 口语,实际上是一种通讯协议。就是说,语言实际上是把人的思想通过发音器官变
: 成一串频率不同、波形不同的声波,然后被另一个体的听觉器官和相关的脑部组织重新
: 转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于
: 传输的信号的规则
: 计算机上,通讯协议有两个基本评判标准:【传输效率】和【抗噪能力】
: 传输效率:在单位时间里,按照该通讯协议能够传输多少信息。
: 抗噪能力:这种通讯方式能够在多大的噪音下仍然保证绝大多数信息正确传输。
: 【传输效率】又分两个方面,编码效率和传输速度

J***1
发帖数: 307
17
什么叫文化先进?

【在 w***g 的大作中提到】
: 先进是先进,不过人家不用你能怎么样。中国在文言文时代确实文化很发达,但到现在
: 已经落后西方太多了。别说英文,中国当代的文化连日本都不如,光靠论证语言的先进
: 性有个P用。

p*s
发帖数: 71
18
晚清的中国学者的翻译被日本人译的汉语词取代的原因很复杂。政治上民国建立人们有
意无意地与过去拉开距离,而且民国建立者都是留日的,自然会使日译盛行。文字上,
晚清翻译多用文言文,白话文流行后,这些文言也被遗忘了。加上新文化运动的推波助
澜,其主要人物又是留日的。日译在中国流行就是必然了。
h*******e
发帖数: 155
19
中文借用日文的译法, 跟中日文借用外来语,如英文之类,本质是不同的。 日文的译
法是日本的汉学家翻译过来的。本来就对汉语理解非常深。日本“皇族”直接就用文言
文。原本就是一个圈子的。所以中国的译法和日本的译法从语言的角度看,如果没有人
仔细考证,根本就看不出到底是谁先翻译的,因为都翻译的很传神,很自然。所以只能
说日本的汉学家对现代汉语有一定贡献,不能简单说日语对现代汉语有贡献,让不了解
的底细的人听了还以为中文日本在汉语用法上有很大不同。而事实是,日语汉语的中文
翻译都力求达到汉语的原汁原味。这本身就说明中文的构词能力强大。日语自己发明假
名音译的computer看上去就很糟糕。如果中文用上那种音译,倒是可以说简单的说日本
对中文做了贡献了。
至于70%,呵呵,脚趾头想想也不可能吧。不要忘了,我们现在的白话文跟以前的口语
没什么大的区别。

【在 p*s 的大作中提到】
: 晚清的中国学者的翻译被日本人译的汉语词取代的原因很复杂。政治上民国建立人们有
: 意无意地与过去拉开距离,而且民国建立者都是留日的,自然会使日译盛行。文字上,
: 晚清翻译多用文言文,白话文流行后,这些文言也被遗忘了。加上新文化运动的推波助
: 澜,其主要人物又是留日的。日译在中国流行就是必然了。

b*****p
发帖数: 117
20
也说汉语的“词汇量”
长期以来,汉语不但以难学著称,而且还常常被指责为词汇欠缺、表达贫乏。生为汉人
,真可谓双倍之不幸——语言学习所需的时间本来就已经比别人多了好几倍,不料最终
学到的东西还不及人家几分之一。
毛喻原先生便为这种论点提供了具体数据:“我们知道,汉语一部普通的《新华字典》
所收单字(含繁体、异体)是一万一千一百个左右,清初所编的《康熙字典》所收汉字
是四万七千多个,最近出的《汉语大字典》所收汉字也才五万六千个。与英语相比,汉
语的词汇量是非常小的。即使一部欧美普通学生所用的字典所收单词也至少在十六至十
七万个以上。如著名的《牛津字典》所收单词是六十多万个。篇幅最大的《韦伯斯特大
词典》所收单词几乎达到一百万之多。仅从词汇量来比较,汉语和英语在这方面的差别
是非常巨大的。”
显然,毛先生“汉语词汇量非常小”这一结论,是用“科学方法”计算出来的,即:拿
英语单词总量减去汉字字数总量。显然,这么简单的题目,连小学生都难不倒,根本用
不着毛先生亲自动手。不过,小学生同时还知道,加减法的运算有一个先决条件,即“
单位”必须相等。例如,五匹马与四头牛就不好相加;七颗白菜减三根萝卜也不知该等
于啥。再举一个简单的例子:假如有人给你开工资,年薪一百万,你一定欣喜若狂,找
不着北;但万一他后面再补上一个“分”,呢?由此可见“单位”之重要。
于是我们现在要问,毛先生自编自算的这道数学题能不能成立?更确切地说,“五万六
千个字”与“十六万(或者六十万甚至一百万)个词”,二者的“单位”是否一致,相
互之间有没有可比性?
英语的单词由字母组合而成,但汉字同样也可以组合成词;如果说,英语26个字母组成
的词可达百万之巨,那么,五万六千个汉字相互搭配又能组成多少个“词”呢?
《现代汉语词典》前言写道:“这部《现代汉语词典》是以记录普通话语为主的中型词
典,供中等以上文化程度的读者使用。词典中所收条目,包括字、词、词组、熟语、成
语等,共约五万六千余条。”
不用说,区区“五万六千余条”与英语的上百万相比,只能算是小巫见大巫。问题在于
,我们应该如何定义汉语的“词”。
先来举个简单的例子。众所周知,英语一个星期中的七天,一年中的十二个月,个个都
是专名。不用说,它的词汇总量中必然包括这十九个单词。然而,翻遍全世界的《新华
字典》、《汉语辞海》,恐怕也找不到“星期一”、“二月”这样的词条。《现代汉语
词典》仅仅收录了“星期”,这也就是说,使用者只要自己在后面填上一个数字,便可
以表达任意一个具体的日子,因而完全没有必要把一星期的七天、一年的十二个月统统
列举出来。诚然,它的确收了“星期日”一词,但实际上也是可有可无。因为,没有一
个讲汉语的人是在查了词典以后才知道“星期日”的,也极少有人会为了“星期日”去
查词典。事实上,假如不是有意提醒,恐怕根本就不会有人想到词典里居然会收有“星
期日”这样一个词条。换句话说,编者即使不收,也绝不会有人指责“不全”;相反,
一部英语词典,若是少了Sunday,便堪称重大疏漏。当然,讲英语的人也是在“识字”
之前便早已知道了Sunday,但不同的是,他们还要学习如何书写,更难免因遗忘而核查
。反之,中国人只要记得“星”、“期”、“日”这几个汉字,就绝不存在“星期日”
如何写的问题。词典不收的词,当然也就意味着记忆中无需保留。讲英语的人,是否个
个提笔能写Sunday, January,我们没有真凭实据,不敢妄下结论;但至少中国人,即
使已经拿到四、六级证书,真要抓来测试一番的话,恐怕就有不少要当场“出丑”——
写不全这十九个普普通通的日用词汇。
我们且来设计一段对话。
甲:“就这么点活,星期一该干完了吧?”
乙:“星期一?星期八也干不完!”
日历上当然没有“星期八”这样的日子,而乙之所以这么说,无非是为了发泄或者抱怨
,以表示事情之不可能。对方自然立刻也能明白他的意思——至于相不相信那是另一回
事。那么试问:这“星期八”算不算一个“词”呢?有人可能要争辩说,既然现实中找
不到对应物,那当然就不能算。但神话故事中的人物都没有现实对应物,我们又该如何
解释凤凰麒麟、雷公电母呢?照此而论,岂不是连上帝魔鬼、天堂地狱都要废除吗?假
设父母给小孩讲故事,编一个童话王国,里面的荒唐国王偏要以八天为一周,把星期八
定为星期日,谁又能说不行呢?倘若承认了“星期八”,岂不也可以有“星期九”、“
星期十”、“星期十一”乃至“星期一万三千五百七十九”?这样的“词”,可以说要
多少有多少,永无止境。
再如,英语有pork(猪肉)、beef(牛肉)、mutton(羊肉)、venison(鹿肉),《
现代汉语词典》却一概查不到。如果说,这就证明了英语词汇丰富,那我们则要进一步
追问:为什么没有“狗肉、猫肉、虎肉、龙肉、凤凰肉、麒麟肉、金丝猴肉、长臂猿肉
”呢?为每一种动物发明一个表示其肉的词,词汇量岂不是又将大大地丰富吗?
汉语词典不收“星期一”、“二月”、“猪肉”、“牛肉”,并不能否认这些“单词”
的存在,更不能由此而认为汉语民族没有这样的概念。唯一能够证明的,就是汉语完全
用不着像英语那样,把它们当成正儿八经、需要认真学习、刻意记忆的单词。事实上,
它们只是借助于“一”、“二”、“星”、“期”、“月”、“肉”等普通汉字,若有
若无、隐隐约约地“寄存”在大脑某个不起眼的角落里,召之即来,临时凑合,用毕解
散,各归原处。简言之,讲汉语的人是“记字不记词”。这种独一无二的特点赋予了汉
语许多方便,限于篇幅,这里就不一一介绍了。
于是,问题便归结为,一种语言的“词汇量”究竟是如何统计出来的?假如完全根据词
典而定的话,英语显然就捡了个大便宜,而汉语便颇有些“傻帽”——谁让你不收呢?
然而,这样的比较能说公平合理吗?
且来打个比方:年终评优,张三列出十条优点,李四却多达上百。表面上看,“先进”
非后者莫属。不料,听他一一报来,竟然是:下馆子必付款,上公园定买票;没病不请
假,有屁夹着放;饭前便后勤洗手,左邻右舍不骚扰;迄今未进劳改所,半夜不怕公安
局;知书达礼,从不抢老年人的座位,品行端庄,绝不掀女同事的裙子……
英语词汇之所以如此“丰富”,戳穿了,主要就是靠李四这类“先进事迹”给撑起来的。
反过来说,汉语如果也能效仿李四这套“搞笑”,其“词汇量”同样繁若群星,多如牛
毛。值得一提的是,毛先生在这方面实际上已经开了先河,树了榜样。
请看其标题:《论汉语的险境和诡谬》。
何谓“诡谬”?查《现代汉语词典》,“诡”字下列有“诡辩”、“诡怪”、“诡计”
、“诡谲”、“诡秘”、“诡异”、“诡诈”。而“谬”大约总与“谬论”、“谬误”
、“荒谬”等有关。“诡”者,自然难免其“谬”也,但即便逻辑思维中可以作这种推
理,语言结构上恐怕也不能如此搭配。这个口子一开,后患可谓无穷。譬如:“工习”
——工作学习;“成业”——成家立业;“吃觉”——吃饭睡觉;“拉屁”——拉屎放
屁。
这类“强行婚配”在毛先生的大作中真可谓三步一岗,五步一哨,比当年日本鬼子的封
锁线还要密集。例如:“传通”、“断逗”、“欠然”、“亮敝自然”、“语义脱臼”
,个个让人耳目一新,大长见识。最令人拍案叫绝叹为观止的恐怕要属“钝挫”与“挫
钝”。真可谓:翻来覆去都是戏,前移后挪皆成词。
说到这里,突然想到一个类似的“洋戏法”。刘易斯·卡罗尔在《爱丽丝镜中游记》中
,编了一首名为《废话》的诗:
“’Twas brillig, and the slithy toves
Did gyre and gimble in the wabe;
All mimsy were the borogoves,
And the mome raths outgrabe.”
时值昏烤,厮头灵奸
且旋且锥,远坪之间。
全部迷塞,悲弱不堪。
没路无途,吼啸阿嚏。(石心莹译)
其中许多词,均为作者斩首去尾,各取一半而成。例如,“slithy”(灵奸)就是“
lithe” (灵巧)与“slimy”(奸诈)二词的“优化组合”。至于“吼啸阿嚏”,则
是“介于吼叫与呼啸之间的声音,其中夹杂着喷嚏声。”这就难怪爱丽丝读得稀里糊涂
,一头雾水;即使是给她作解释的矮胖子Humpty Dumpty自己很多也说不清,道不明。
由于该书的流行,惹得不少人也心动手痒,依法泡制,例如,由smoke(烟)和fog(雾
)组成smog,由motor与hotel组成motel(汽车旅馆),由breakfast与lunch合成
brunch——将早饭与中饭合为一餐的饭。近来还出现了一个kidult,由kid(小孩)与
adult(成人)合并而成,专指年纪18-25岁,不能自立,依赖父母,老也长不大的年轻
人。不过,这种把戏毕竟没有成为构词的“正道”,玩玩也就不时兴了,真正流传下来
的并不多。
毛先生是否师从“老刘”,继承遗志,我们不得而知。不过,正所谓:西方不亮东方亮
,洋风不起土风起。毛先生若屈尊去当小学教师,我堂堂华夏民族必将辈出“造词大师
”;毛先生若降贵去编词典,汉语必将一洗“词汇量非常小”之耻辱。像“诡谬”、“
断逗”、“欠然”、“钝挫”、“挫纯”等等,肯定一个不漏,统统收入。倘若赏脸再
加上本人独创的“星期N”、“某某肉”,乃至“工习”、“成业”、“吃觉”、“拉
屁”,不要说区区“十六万”,恐怕就是一百六十万、一千六百万都打不住。这么说吧
,即使按最保守的估计,以五万六千个汉字为原料,采用毛氏构词法,编一部收词一亿
六千万的《汉语大词典》,也不过是小菜一碟,唾手可得。
聪明的读者想必早已从这一番“正话反说”中看出问题的症结所在了。毛先生以及其他
“拼音文字至上论者”之所以会得出“汉语词汇贫乏”这种谬论,关键就在于他们忽略
了,或者说根本就不明白一个极其简单的基本事实,即汉语中根本就没有“词汇量”这
样的说法,因此也就根本不可能统计出“词汇量”的大小。汉语民族衡量文化水平,用
的是“字数”,而不是“词数”。一个人只要掌握了一定数量的汉字,就可以像玩积木
一样,随心所欲地组合出无数个词来,尤其是碰上毛先生这样的组词大师,其“词汇量
”简直近乎于天文数字。
汉语的“字”与英语的“词”,其区别简直就有如白菜萝卜,鲤鱼麻雀,单位迥异,二
者之间根本就不具备可比性。不过,如果换个角度,比如,选择某个特定的“文化程度
”如小学或中学为基准,分别审查双方各自所能达到的水平,以及这一水平所能发挥的
作用,则也不妨用来充当一种比较标准。
毛先生实际上也谈到了这个问题:“据说初习汉字的人,只要掌握了最常用的二千个左
右的汉字,就可读懂百分之九十五的流行于社会的一般文本,而且丝毫不会感到有任何
阅读方面的困难。这在西方语言的文字里是无论如何也办不到的。相比之下,在西语世
界(比如说欧美),即使你拥有五千个左右的词汇量,你也难以应付通行于社会的一般
文本。此词汇量用于日常的口语交谈还可以,但要用于学理探讨和文本阐释显然万万不
能。”
按照现行的教学要求,小学识字量为2400,九年制义务教育的识字量为3800。这也就是
说,中国人小学还没毕业,就已经“丝毫不会感到有任何阅读方面的困难了”。那么反
过来,英语民族要想“读懂百分之九十的流行于社会的一般文本”,究竟需要多大的词
汇量,这样的词汇量究竟又要上到“几年级”才能掌握呢?
我们这里不打算列举具体数据,且看一个“间接”的例子:纽约市立大学唐德刚教授说
,该校十万学生,其中有一半看不懂《纽约时报》。
《纽约时报》肯定不是专业刊物,面向的是一般读者,其难度最多大概也就相当于我们
的《光明日报》、《羊城晚报》、《南方周末》吧。一个讲汉语的人,如果上了大学,
竟然还看不懂《南方周末》,简直可以誉为“世界第九大奇迹”。然而,这样的“环球
奇观”,在英语国家却实属正常,见怪不怪。为了让读者有一个切身体会,我们不妨从
比《纽约时报》简单得多的《二十一世纪报》中选择一个句子:
Smoking and drinking alcohol are the main causes of mouth and throat cancer.
That includes tumours of the oral cavity, throat, tongue, gums, and larynx.
第一句很简单——烟酒致癌,第二句则是一一举例。然而,您能讲得出具体名称吗?诚
然,该文是登载于“科学版”,但充其量也不过是“科普”,为何“非医界”就读不懂
或者至少读不爽,非得求助于词典呢?中国人读报,有查字典的吗?退一步讲,即使“
科学版”仍嫌高深,“娱乐版”总该是雅俗共赏、老少咸宜吧?那么试问,谈论歌唱家
的文章,您敢读吗?先别夸口,比如,“女高音”、“男低音”,您知道相应的英语单
词吗?最后,请您猜猜,将《纽约时报》通读一遍,需要多少单词?告诉您,千万别吓
着——五万!顺便再说一句,莎士比亚的词汇量据说为三万。
辜正坤教授指出:“词法、语法的严谨形式虽然有助于西方人陶冶他们在思维方式上的
严谨性,但是由于要掌握这种语言的繁琐形式必须花很大的功夫,因此从学习成本方面
来看待这个问题的时候,会发现它的这一优点又在一定程度上被抵消了。我们以幼儿学
习一门语文所需要花费的经历和时间来看这个问题。中国儿童记住2000---3000个汉字
,就可以阅读《人民日报》而不会有多少生词。印欧语系的儿童即使记住了8000左右的
单词,在阅读《华盛顿邮报》时仍然会有很多生词。举例来说,当人民日报出现‘水仙
花’这个单词时,中国儿童尽管也许不知道这究竟是什么花,但是他不需查字典就知道
这是一种花。‘水仙’两个字也是常用字,可以帮助儿童判断这种花至少不是菊花、桃
花、牡丹花及许多儿童已经知道的种种花卉。也就是说,他即使不知道究竟是什么具体
的花,他也已经知道1)这是一种花;2)这不是别的所有那些他已经知道的花。知道什
么是一种知识,知道什么东西不是什么,也是一种知识。因此,如果将这个词中所含的
信息量规定为3,则中国儿童已经不教而知其2!可是,对于一个印欧语系的儿童来说,
恐怕就不是这样。如果将这个词所含的信息量照样规定为3,则西方儿童所能获得的有
效信息量只能是0!以英语为例,水仙花叫narcissus,如果该儿童不知道这个单词,他
就无法根据这个词本身的组成部分推知它是什么意思。因为这个词的组成成分没有太多
的常用的可以令人一望而知是什么东西的那种成分。narc有‘缉毒探员’的意思,
narco有‘麻醉、昏睡’的意思。但它们一方面不属于最常用的词类,另一方面也不能
暗示这个词本身是一种花。而且儿童还未必能把narc单独分离成一个词。因此,印欧语
系儿童面临的是一个完全的生词,不知道就不知道,必须作为一个完全的生词来记住。
当中国儿童看到‘水仙花’这个生词的地方的时候,他可能略一停顿,根据自己的理解
便继续读下去,而印欧语系的儿童却会因为这个生词而完全给卡住了,因为他如果压根
儿就不知道这个生词是什么意思,他就难于决定究竟它是一个具有关键意思的词呢还是
可以跳过不管的词。在这种情况下,印欧语系儿童对于这个生词的信息吸收量几乎等于
0.2大于0。因此使用汉语的中国儿童比使用英语的西方儿童的平均吸收阅读信息要大2
倍!当然,应该考虑到,英语中也有许多孪生词的前缀、后缀等词法形式可帮助印欧语
系儿童分析所阅读的词类大概是属于哪一类的词类及词义。但是,要知道这种作用是有
限的,因为事先记住这种抽象的没有任何图画性特点的成百上千的前缀、后缀本身对人
的记忆来就是一个挑战。让儿童先去记住这些东西是不现实的,很可能让他们厌烦这种
语言学习。所以,就总体而言,记住2000~3000个汉字的儿童可以比较容易地阅读《人
民日报》,而记住3000个英语单词的印欧系儿童阅读同等程度的英语版《人民日报》时
,却会困难重重。这里边有一个非常重要的东西,这就是:汉字的每一个字本身就具有
意义自我阐释的作用。因为它的根底来源于图画文字。图画就是外部世界事物的缩影。
一个字就是表达的含义从它的书写本身就已经显示出来了。这等于说每个汉字就是自身
的含义小词典。如果有两个、三个、四个字组成的汉字词组,则各个单字便等于可以相
互阐释,互证互释互彰。上面的‘水仙花’三字词就是一个例证。由汉字组成的文章是
一个词义互释文本。这就是为什么掌握汉字的儿童只需要相对来说较少的词汇量就能阅
读文章的关键原因。”(着重号为作者本人所加)
毛先生根据英汉“词汇”的对比,得出了一个重大发现,即:汉语“小词量——大文本
”。这一点我们从上面的论述以及个人的亲身经验中早已深切体会到了。但万分遗憾的
是,他却没有顺藤摸瓜顺水推舟顺理成章地得出英语“大词量——小文本”的结论,以
至于让本人白白地捡了一个便宜。以毛先生的渊博学识及思维能力,不会连这样的小问
题都联想不到吧。原因看来只有一个,即这样的结论实在是有损英语的“光辉形象”。
不幸的是,毛先生有意回避,却拦不住别人无心推测,甚至“别有用心”的质疑:既然
小词量便足以应付大文本,要那么大的词汇量干什么——莫非吃饱了撑的?
我们不妨来打几个比方。一道题目张三只要十分钟便能解出,李四却要花五个小时,二
者的智力显然就不可同日而语。一项工程明明一百万便能完成,偏要投入一个亿,其中
肯定就有不可见人的勾当。一座山头部队甲仅需一个连就能拿下,部队乙却要动用一个
团甚至一个师,前者便堪称精兵强将,后者不过一群乌合之众。
然而,日常生活中无数这类以少胜多,以小制大的事例,一旦拿到汉英语比较上来却统
统都行不通了,所有的思路都要反过来推理,所有的结论都要反过来解释。例如,毛先
生又发宏论了:“关于汉语的小词汇量能够对付大文本的这一现象,我们还可作进一步
的分析。有人认为这是由于汉字的单位信息含量大,所以,用少量的词就可表达很多内
容。这似乎为‘小词量——大文本’的关系提供了某种解释。但我们认为事实并非如此
,之所以有这一现象发生,是由于:一、也许汉字对事物的分理层次不够缜密,不够精
细,即对事物的诸种存在,及诸种可能的存在,汉语中没有产生出相应的词来与之对应
。也就是说,汉语在表达事物之丰富存在时,其语汇总是显得欠然和阙如;二、也许是
文本本身的内容就非常简单和有限,即汉人愿意去表达的东西仅仅是属于大千世界的一
个有限局域,其丰富性和可能性打了折扣。汉人的心智其兴趣不在世界的全体,而是某
一个部分。正是基于这两点,所以才会有‘小词量——大文本’关系的产生。”
大话颠来倒去,最后还是归结到“语汇欠然”的老话题上来。我们也就不再纠缠。至于
说到“汉人心智兴趣”,则明显涉及另一个问题,即语言词语如何反映世界,需要专门
的篇幅讨论,这里也就不予深究。不过,若将这段话与毛先生前面的说法作个比较,却
不难看出他的自相矛盾。一方面,他说:“与英语相比,汉语的词汇量是非常小的”;
另一方面,他又说汉语是“小词量——大文本”。试问,按照正常规律进行逻辑思维的
人,究竟应该从中得出怎样的结论呢?前者无疑是“褒英贬汉”,但后者难道不是恰恰
相反,“褒汉贬英”吗?毛先生当然是坚定的“拼音文字至上论者”,但万一有人偏偏
要断章取义,以其矛攻其盾呢?
总而言之,毛先生拿“汉字”与“英词”进行对比,是犯了一个连小学生都不该犯的极
其低劣的错误,自然也就只能得出“诡谬”的结论,从而把自己逼入一个相互矛盾,无
法圆说的困境。当然,他到底真的是缺乏普通常识,还是为了“褒英贬汉”的特定目的
而故意“搅混水”,那就只能是“天知地知”了。
相关主题
请教各位将军一个语言学问题英语的一个好处就是定语后置
公元前300年发生的事嘉绒语和藏语用s-前缀表使动
为什么阿尔泰语系日韩通古斯语族跟汉藏语系差那么多?汉语 - 世界上最漂亮,伟大的语言
进入Military版参与讨论
d*******r
发帖数: 3299
21
绳结抽象上就是一堆无意义的点,不能因为绳结是个3维物体,它就是3维文字 ... ...
这几天看了你们这些挺英文反汉语的帖子,发觉有一个共同特点,就是表述的逻辑基本
都是错乱或偏颇的

【在 B*********L 的大作中提到】
: 绳结是3维文字,编码效率比汉语更高,信息密度更大。请LZ把这篇传世之作用结绳记
: 事的方式表达出来,否则就是对不起祖宗的祖宗。

d*******r
发帖数: 3299
22
这篇充分证明了汉字构词法的合理性,即使是中国的学生日本拿去用了,造完词拿回来
,一样可以合理地第融回汉语体系。注意,汉语基本不吸收日本那些有着过重拉丁语言
基因的片假碎语。
退一步讲,即使没有这些日本造的词又如何?最多很多现在汉语词稍有不同,不过一样
可以合理地存在于汉语体系中。举个例子,很多台湾词就跟大陆词不一样,比如他们叫
“软件”叫“软体”,有啥影响,大家不是一样理解得很好。所以,日本这些新词也不
是必须的。当然,有这些日本造的词,逻辑上完全不影响汉语系统的优秀性。
另外,70% 这个数字肯定是夸大了的。看这篇文章,一股子浓浓的自恨味道。看自己学
生用自己语言用得好,不是好事儿吗,咋也能整出自恨味道来。"自恨” 确实是一种很
有意思的情结。而且“自恨” 也是本版赋予特殊意义的新造词语,直接实践了汉语构
词法的优越性。 :D

【在 B*********L 的大作中提到】
: 看看这篇,《汉语中70%词汇来自日语》:
: 当中国人初次接触日语时,会发现日语中有很多的汉语词,并因此油然产生一种自豪感
: ;但是,如果告诉你汉语中有许多的日语词时,你会作何感想呢。
: 中日之间的文化交流史上,有着许多有趣味也有意味的事。从大的方面说,有两个
: 时期的情形特别引人注目。一是在中国唐代,一是在 近代。在唐代,是日本贪婪地向
: 中国学习,甚至是在与中国文化接触后,大和民族才首次与文字遭遇,从此才学会了书
: 写。日语的“假 名”(字母)不过是汉字的变体。而在近代,则是中国拼命地向日本
: 学习。别的方面且不论,仅就语言文字方面说,在近代,倒是日本成了 汉语的输出国
: 。日本“汉语”,冲击着东亚各国的语言系统,当然也大量进入中国的汉语中,成为中
: 国人日常语言的重要组成部分。

P*******L
发帖数: 2637
23
这个讲得不错
汉语的词汇量跟英语的不是一回事,汉语的构词能力太强了

【在 b*****p 的大作中提到】
: 也说汉语的“词汇量”
: 长期以来,汉语不但以难学著称,而且还常常被指责为词汇欠缺、表达贫乏。生为汉人
: ,真可谓双倍之不幸——语言学习所需的时间本来就已经比别人多了好几倍,不料最终
: 学到的东西还不及人家几分之一。
: 毛喻原先生便为这种论点提供了具体数据:“我们知道,汉语一部普通的《新华字典》
: 所收单字(含繁体、异体)是一万一千一百个左右,清初所编的《康熙字典》所收汉字
: 是四万七千多个,最近出的《汉语大字典》所收汉字也才五万六千个。与英语相比,汉
: 语的词汇量是非常小的。即使一部欧美普通学生所用的字典所收单词也至少在十六至十
: 七万个以上。如著名的《牛津字典》所收单词是六十多万个。篇幅最大的《韦伯斯特大
: 词典》所收单词几乎达到一百万之多。仅从词汇量来比较,汉语和英语在这方面的差别

h****y
发帖数: 77
24
第一,语言和记录语言的文字(writing system)是两回事,牛和马的关系。怎么解释
?语言最大的特征1,是对于音位的快速自动切分和再组合,把它想象成电报机吧,但
是别小看这个加工能力,音位和音位之间的差异很复杂,不是一两个声学特征决定的,
要不然语音识别技术早几十年就该出来了。语音切分后还需要组合成意义单位,然后按
照语法规则,主要是词序,理解完整语句的意思。2,语法,最简单的说是决定了词序
,也就是字词如何排列才有意义。3语义,就是意义的最小单位以及进一步的组合。至
于文字,就是一个记录口头语言的工具,可以有多种形式。语言是大脑进化过程中的
milestone,文字不是。
第二,表音文字的巨大优势是看文字即可知道发音,也就知道了它的意思,如果已经在
口语中使用该词汇的话。英语属于对应不好的语言,语言学上叫不透明文字(这个区分
主要是在表音文字之间的区分,汉字要算进去轻松作不透明的老大),透明文字比如德
语,土耳其语等一一对应,小孩子不需要正式的教育,偶然的家庭指点,即可以自己阅
读。聪明的小孩三岁即可以开始大量阅读,三岁小孩的语言已经很丰富了,也能理解很
多事情,不过中国小孩有几个能三岁开始独立阅读的?拼命的提前教育大概能让一些聪
明的在8-9岁的时候独立阅读不复杂的文章,碰到不认识的还得查字典。掌握常用的汉
字的书写和阅读需要5-6年的学校正式教育。对着已有的汉字一遍一遍的抄写几乎是中
国唯一的现象,而研究发现要熟练掌握汉字书写,这样的做法几乎不可避免。每个人在
他的人生阶段花费这么时间学习书写,而并不比其他语言产生什么明显的优势,相反,
因为和其他表音语言的巨大差异,导致学习其他语言特别困难,这是多大的浪费?大家
回忆一下小学时候每天的抄写作业,呵呵,我还记得每天在那个方格子上一笔一画的写
,每天都要写。花了那么多年学习汉字,用几年计算机打字后又发现提笔忘字了,悲剧。
韩国为自己的文字发明非常自豪,认为韩文是世界上最先进的文字,因为它结合了汉字
的二维加工和表音文字的一一对应的好处。文字的二维加工是指不仅仅左右扫描获得信
息,上下扫描也获得信息。比如汉字你要看上半部,下半部,而字母则是一个一个从左
到右的排列。韩国人之前也必须年复一年的学习书写汉字,现在看见文字就能读出来,
多好。老年人仍然有不少以会书写汉字自豪,因为以前能书写汉字就属于受到好教育的
人,不过年轻人没几个愿意学的,不需要学也可以阅读韩文,谁愿意天天抄写汉字抄几
年阿。坦率的说我觉得他们有理由自豪。
也许有人会提象形字可以帮助理解,说实话这个是骗骗不了解汉字的老外或者自己用来
提高自豪感而已。有几个汉字你看现在的书写可以联想到它的意义的?几乎一个都找不
出来。你需要把书写演变过程都了解一遍才能看出是怎么象形的。即使如此,可以找出
象形或者会意的也是很少的一部分。它最多能在初期增加学习汉字的趣味性。我们自己
的小学教育就不这么教,可见它不是什么优势。
第三,以上是关于书写系统,在说语言本身。以承载意义的效率来评价语言的优劣我有
些不敢苟同,文言文应该是最好的了,为什么摒弃,为什么口语中无法使用文言文?因
为那不是大脑工作的方式。文言文的意义是对于思维意义的巨大压缩产生的,在日常语
言中几乎就是无法适用。这个就如同打开文件时的解压缩一样,压缩比越高,解压缩的
计算需求就越大。语言能和大脑的工作方式最大的契合才会在说话的时候最准确,最轻
松的表达出来。为什么世界上的多数语言都有屈折变化?因为大脑思维就包含所有这些
信息,它不可能是思维中不存在而在产生语言过程中人为添加的。比如大多数时候大脑
产生一个深层意义,它通常包含了这个事件的时间信息,也就是是过去发生的,还是将
来发生的,也包含了主语,宾语和动词的对应关系,这种对应关系把事件的时间关系,
从属关系,对应关系,思维的逻辑关系,以及情感关系都包含在了里面。我们学习英语
会发现时间信息很难丢掉,有时候需要通过时间信息去进一步判断一句话的准确意义,
因为思维转化成语言时如果丢掉了时间信息,转换过程就会在动词对应时态的地方中断
了,得要再回头去确定是什么时间发生的。英语是屈折不丰富的语言,这一点还不明显
,屈折变化丰富的语言在句尾仍然呼应句首的一些信息,比如时间,从属关系等。它让
你的思维毫无丢失的表达出来,不会在加工过程抛弃一些信息。我们觉得这些屈折变化
和呼应的关系如此复杂,只是因为我们在我们的语言关键期没有学习这样的自动加工。
从小学习这些屈折丰富的语言的小孩子没有任何问题,毫不费力并觉得自然而然的事情
,不过过了语言关键期则难以实现屈折变化的自动加工,死记硬背的添加词汇量倒是可
以。这一点大家用英语也有体会,我们后天学习英语的人再熟练也会在快速交流的时候
犯时态的错误,而如果是那些主语和宾语以及动词时时刻刻呼应的语言,后天基本上就
学习不了了吧我觉得。印象中深刻的是土耳其语,据说把所有屈折变化都算成单独动词
的话土耳其语动词的有上百万,或许我听到的是夸张了,不过你可以想象它的变化有多
丰富。这么多语言都有屈折变化,并且只能在语言关键期学习和掌握说明了什么?说明
这些屈折变化是反映大脑加工语言以及把底层思维转换成语言的特征的,这些屈折表现
让思维过程涉及到的信息处理更准确的被语言所记录,导致的结果是思维到语言的转换
和语言到思维的加工都更容易。我忘了在哪里看到类似的论点了,大概还不是一个理论
,不过我觉得我很能接受这个观点。
第四,关于语音短时记忆,尤其是数字短时记忆,汉语却是有优势,这是因为语音短时
记忆依赖于语音长度,虽然不是和音节数量一一对应,我们每次能复述的最多语音单位
就是决定了语音短时记忆。汉语的每个音节承载的语义单位要多,可以让相同语音单位
数量下承载更多意义。但是如果考虑语言和思维的互换的容易度,这个优势是否值得还
是值得商榷。
第五,汉语难学习吗?你是说汉字难学习吧?中国人学习汉字也不容易。老外学习汉语
比中国人学习英语或者其他语言容易多了。那些说老外学习汉语难,拿几个容易混淆意
义的句子来说汉语有多难的人都是假想派。你经常可以看到成年后老外学习几年汉语基
本上就可以开口对话了。老中试试?原因很简单,英语带着一点点屈折变化而汉语没有
,没有这个基础的人后天去学习新的屈折变化当然比有这个基础的人去学一个不需要这
个能力的语言难。另一个原因我猜测是表音语言基本上比汉语对于语音加工的准确性和
速度要求要高,这个又是只能语言关键期掌握的能力。这一点不全是猜测,我看过文章
提到阅读时汉字阅读要求更多的语义联想而英文需要更多的语音加工。
第六,说说文字的进化顺序,几乎所有的语言最初都出现了象形表意的符号,后来又统
统抛弃了象形表意的符号而转成有优先的符号表音来记录复杂的语言。汉语是唯一仍然
坚持表意(说表意部准确)的成熟文字。要按发展的说法,汉字很落后哦,估计很多人
不同意吧,恩,我也不同意,我觉得下结论还早。
语言现象复杂着呢,和高等猿猴动物相比,语言基本上是唯一一个显著的差异。当然,
作为神经科学家,更标准说法是额叶皮层尤其是前额叶的巨大进步,人和猿类的最大神
经解剖差异就在额叶皮层。前额皮层负责工作记忆,做决定,做判断,抑制冲动,以及
抽象思维。现在的研究还不算深,离揭开语言的本质还远着的呢,比如猿猴不能学习语
言是因为大脑还没有进化出加工语言的能力还是因为他们的发音器官无法完成丰富的音
节控制都不知道。
下结论说汉语更优秀或者其他语言更优秀都还过早,不过班上几篇类似的文章下来好像
大家都已经开始为汉语的先进性欢呼雀跃了,我持保留态度。以前计算机打字刚出现时
候的认为汉字落后没有象表音文字发展的言论也是简单结论。
d*******r
发帖数: 3299
25
这个还算是反汉语帖子里有点内容的了,至少没有逻辑错乱
在harway 看来,在语言系统上,语音子系统最重要,重要性远高于文字,词汇子系统
等等
推断结果,居然是韩文是全世界最先进的语言 ??
难道语言进化路线不是:
黏着语(e.g.日韩土耳其语) --> 屈折语/综合语(e.g.英) --> 分析语/孤立语(e.g.汉)
??
harway 论证也很有意思,从小被迫接受黏着语那种复杂的派生词法,居然是有益锻炼?
语言就是学习交流用的,要专门锻炼思维,可以辩论或者做数学题目,不用在学语言时
候做这些吧。
说汉语书写是弱项,我非常同意,我觉得这个是汉字最弱项了,不然也不会有简化字。
至于说现在大家提笔忘字,要怪拼音输入太过流行了,注意这个里面其实有很大的历史
原因,主要还是拼音语言是计算机的原生语言,英语键盘是计算机原生键盘。历史的作
用是非常巨大的,现在的英语键盘就打英文都不是最优的,但是就没被替代,其他的汉
字输入法都得想办法兼容这个,所以一上来就不容易学,就是后妈养的一样,难学难推
广。

【在 h****y 的大作中提到】
: 第一,语言和记录语言的文字(writing system)是两回事,牛和马的关系。怎么解释
: ?语言最大的特征1,是对于音位的快速自动切分和再组合,把它想象成电报机吧,但
: 是别小看这个加工能力,音位和音位之间的差异很复杂,不是一两个声学特征决定的,
: 要不然语音识别技术早几十年就该出来了。语音切分后还需要组合成意义单位,然后按
: 照语法规则,主要是词序,理解完整语句的意思。2,语法,最简单的说是决定了词序
: ,也就是字词如何排列才有意义。3语义,就是意义的最小单位以及进一步的组合。至
: 于文字,就是一个记录口头语言的工具,可以有多种形式。语言是大脑进化过程中的
: milestone,文字不是。
: 第二,表音文字的巨大优势是看文字即可知道发音,也就知道了它的意思,如果已经在
: 口语中使用该词汇的话。英语属于对应不好的语言,语言学上叫不透明文字(这个区分

d*******r
发帖数: 3299
26
看了一下韩语,还真是觉得设计得一般。
韩语那种比英语还麻烦的语法。还有拼音语言那种词汇泛滥,特别是外来词泛滥的问题。
我觉得词汇泛滥基本是拼音语言的死穴。
像汉语这种坚持语意为主,有庞大合理的词根(核心汉字)集合的语言,也真算是个奇迹
了。

【在 h****y 的大作中提到】
: 第一,语言和记录语言的文字(writing system)是两回事,牛和马的关系。怎么解释
: ?语言最大的特征1,是对于音位的快速自动切分和再组合,把它想象成电报机吧,但
: 是别小看这个加工能力,音位和音位之间的差异很复杂,不是一两个声学特征决定的,
: 要不然语音识别技术早几十年就该出来了。语音切分后还需要组合成意义单位,然后按
: 照语法规则,主要是词序,理解完整语句的意思。2,语法,最简单的说是决定了词序
: ,也就是字词如何排列才有意义。3语义,就是意义的最小单位以及进一步的组合。至
: 于文字,就是一个记录口头语言的工具,可以有多种形式。语言是大脑进化过程中的
: milestone,文字不是。
: 第二,表音文字的巨大优势是看文字即可知道发音,也就知道了它的意思,如果已经在
: 口语中使用该词汇的话。英语属于对应不好的语言,语言学上叫不透明文字(这个区分

h****y
发帖数: 77
27
不是说韩文最好,是说他们自豪还是有些理由的,他们发明韩文的时候现代语言学已经
研究了不少了,文字的一些缺点有点都知道了。不过还是我前面说的,全面看有多好还
不知道呢,但是他们自己自豪下还是有理由的。
从小学习复杂的屈折语言,不是锻炼,语言学习的都是自然而然的过程。要说我自己的
观点,那就是过了那个关键期,你就再也学不会自动加工屈折关系了。但是这些关系是
思维的一部分,反应了大脑底层思维的特点,是思维转换成语言的过程中保留下来的信
息,应该看作是更加贴近思维的语言。
人和动物一样,很多技能必须在某个关键期得到学习锻炼,过了那个阶段就无法再学习
了。举例子来说,研究发现新生儿对所有音位都敏感,他们能区分世界上所有音位的差
异,但是随着暴露在母语环境里时间延长,他们对于母语中使用的音位越来越敏感,并
能很好的区分,而对于母语不使用,其他语言使用的音位反应越来越不敏感,最终区分
不清楚。成年人再学一个新的语言就会有这样的问题,新语言里的音位总是和原来的混
淆,无法准确的抓住一个新的音位的特征。
要说我的观点,我觉得现在还是无法下结论那个语言好那个语言更差。
1 (共1页)
进入Military版参与讨论
相关主题
嘉绒语和藏语用s-前缀表使动汉语是高度发展的孤立语,决定了它的优势地位
汉语 - 世界上最漂亮,伟大的语言自由远比字母更重要万倍
说句掏心窝子的话,英语比汉语先进科学汉语是一种落后的语言
汉语为什么是单音节的?西方社会注重沟通,是因为表音文字沟通困难 zz
为什么汉语是世界上最先进的语言之一学了几句鸟语,简直就是汉语的一个方言
印第安语是不是劣质汉语?两个例子说明英语的落后性
语言比较的基本点人有三逼:牛逼、吊逼、苦逼,话有三语:汉语、英语、西班牙语
汉语的拼音化是汉语的巨大倒退 (转载)请教各位将军一个语言学问题
相关话题的讨论汇总
话题: 汉语话题: 语言话题: 英语话题: 汉字话题: 日本