用户名: 密码:
会员中心 在线投稿
| 网站首页 | 中国历史 | 世界历史 | 历史名人 | 教案试题 | 历史故事 | 考古发现 | 历史图片 | 文化 | 社会
相关文章    
您现在的位置: 历史千年 >> 文化 >> 文化研究 >> 正文
由“贪”字想到的
“六爻的四个层次理论”…
谈论办公室风水学
御河观景台的“U”字风…
论“灰姑娘”故事里的性…
有关古文论“失语”、“…
试论“战国策派”的文化…
“ ”字所從聲旁“ ”試…
《仲弓》的“ ”字考释
《昔者君老》簡4“受”…
最新热门    
 
谈论“字本位”思想的理论和应用

时间:2009-8-8 16:38:17  来源:不详

  论文关键词:字 本位 汉语
  
  论文摘要:徐通锵先生在上个世纪末提出了“字”本位理论,认为“字”是语言中有理据的最小结构单位,是汉语的基本结构单位。此理论对汉语研究、计算语言学研究和对外汉语研究都有重大影响。

  梁代刘勰言:“夫人之立言,因字而生句,积句而成章,积章而成篇。”“字”一直是汉语的基本单位。直至清代,《马氏文通》依然以“字”作为汉语语法的基本单位。章锡琛在为《马氏文通校注》(1954年 中华书局出版)作注释时说道:“本书分别词性,皆以‘字’为本位。”虽然《马氏文通》的“字”,事实上是以词为本位,但马建忠的观点在受到西方现代语言学的影响的同时,仍然承袭了古代语言学的一贯传统。因此,《马氏文通》可以看作是汉语语法研究由传统“字本位”思想向西方“词本位”思想的一种过渡。随后,现代汉语研究都以“词本位”为主导,认为语法研究的主要对象是词。
  受西方语言学理论,尤其是结构主义的影响,20世纪60年代后期,丁声树、吕叔湘、朱德熙等人引进了新的语法单位,如词素、语素、短语等语法单位,并进入研究视野。20世纪70年代,朱德熙提出了“词组本位”,黎锦熙提出了“句本位”。对于词组或短语是否能看作一个语法单位,目前仍有争论。到90年代末,徐通锵先生在《语言论》(1997年)中正式提出了“字本位”的观点,这一理论在重新回到传统汉语语言学观点的同时,又有许多创新。
  
  一、字本位理论的核心概要
  
  汉语语言学一直受到西方语言学理论的影响。但是西方语言学理论,大都是建立在印欧语言的基础上,这就使得我们在研究汉语时习惯用印欧语的思维、眼光和分析方法来看待汉语。印欧语是以词为本位,然而汉语与印欧语是两个截然不同的语系,汉语有其独特的特点,如果依然沿袭西方语言学的思路,在现今现代汉语语法分析及其应用时,就会越来越显示出它的局限性。
  吕叔湘先生后来曾对汉语中的“词本位”产生过怀疑,他在《语文常谈》中认为,对于印欧语来说,词为基本语法单位是非常明显的,“汉语恰恰相反,现成的是‘字’,语言学家的课题是研究哪些字群是词,哪些字群是词组。汉语里的‘词’之所以不容易归纳出一个令人满意的定义,就是因为本来没有这样一种现成的东西。其实啊,讲汉语语法也不一定非有‘词’不可。”[1]接着,著名语言学家赵元任1975年指出:“汉语是不计词的,至少直到最近还是如此。在中国人的观念中,‘字’是中心主题。‘字’这个名称将和word 这个词在英语中的角色相当。也就是说,说英语的人谈到word的大多数场合,说汉语的人说到的是字。”[2]这一观点和徐通锵先生“字本位”的理论相契合。徐先生认为:“字不同于词,汉语是不计词的,字是汉人观念中的中心主题。”[3]
  徐通锵先生给“字”下的定义是:“字”是“语言中有理据的最小结构单位。”“理据性”是指音义的结合是有理据的,不是任意的。印欧语中的基本语法单位word在汉语中,并没有可以与之相对应的语法单位,因此,“字”是汉语的基本结构单位,“字本位”理论是一种基于汉语本身的语言观和语法理论系统。徐先生强调,字本位中的“字”,与单位语素又是不相等同的。印欧语结构特点非常明显,属于语法型语言。而汉语中这一特征就相对较弱,但是语义的特征却很突出,属于语义型语言。索绪尔在定义语素时认为,语素即相当于传统语法中的词素和根词。而汉语是孤立语,“字”在汉语中,作为一种音义结合体,强调的中心是语义。而语素在印欧语中,强调的中心是一种最小的结构上的单位。而从语言的编码机制来说,字相当于印欧语的词,而不是语素。汉语是单音节语,音节是自足的编码单位,一个音节表达一个概念。印欧语是多音节语,音节不是自足的编码单位。字和语素从表面看都是音义结合的最小单位,而实质上,语素既不是音义关联的基础,无法与概念相联系,也没有语言基本结构单位所必须具备的几个特征。因此,字和语素是不同体系里的两种不同语言现象,无法作直接的类比。而字本位中的“字”显然不能看作是语素。
  既然汉语属于语义型语言,其在句法生成机制上就采用语义语法,以意合来造句,没有语言的形态变化。汉语的语法结构框架是“话题-说明”,印欧语系语言的语法结构框架是“主语-谓语”。汉语的这一语法结构框架是句法语义结构,直接体现语义。而印欧语言的语法结构层次就浅于汉语语法结构框架,其深层结构还隐含在表层结构之下。徐通锵先生认为,印欧语的这个框架,是以“句”为本位,以词为基本语法结构单位的。一个句子必须有一个主语、一个谓语,而且也只能允许有一个主语、一个谓语,相互之间由一致关系联系着。句法结构就是通过这种“1个句子=1个主语×1个谓语”的“1=1×1”的结构关联而层层控制着句子以下的各层结构规则。主语、谓语和它们之间的联系,三者构成了一种封闭性的句法结构,尽管词可以发生各种不同的形态变化,但它必须接受此三者的制约,因而没有脱离句法规则的控制。[4]
  因此,这一语法体系的结构单位主要是句子和词两级。而汉语则不同,“话题-说明”这种语法结构与印欧语要求的一致性没有关系,它是一种开放性的语法框架结构,话题之下,句子可以一个接一个地产生。也就是说,汉语中,话题是肯定的,而主语却是无定的。话题与说明之间的联系非常松散,不像主语与谓语之间由一致关系紧密联系着,所以一些不合法的句子,在汉语中却是合法的。如赵元任曾举例:“你(的鞋)也破了。”“我(的铅笔)比你(的)尖。”这种在印欧语中是不合法的无主语句,之所以能够在汉语交际中通行,是因为语境的提示和补充。也就是说在汉语中,是话题、说明和语境三者构成一个开放式的句法结构。其格局框架是“一个字·一个音节·一个概念(意义单位)”,即一个以“1”为基础的“1×1=1”的结构层级体系。[5]在这其中, “字”就是明确的最小语法结构单位。
  西方语言学认为,句子的层级语法结构是:语素—词—词组一句子—句群。徐氏的字本位理论认为,汉语的语法结构层次是:字—字组—字块—形句—意句。而“字组”又称为“辞”,以方便和英语中word(词)相区别,而形句则相当于古代传统上的“读(dou)”。所以,这一层次又可以写作:字—词—块—读—句,五个层级。这一层次表述,也体现了刘勰汉语“因字而生句”的观点。徐通锵先生阐述这种分法时认为,字在最基础一层,表达概念的字形成字组,实现最初的语法化。此为“因字而生句”的台阶一。接着,不同的概念,即不同的字组,由特定的标记联系起来,形成字块。而到字块这一层,才是造句的一个结构单位。此为台阶二。而“读”则由特定的语气词表现出来,最终形成句子。此为台阶三。字在每一个台阶中的语法化都有自己的特点,徐通锵将这一过程称为“三阶说”:初阶、次阶、末阶。印欧语中,词有明显的形态变化,以此来表示语法关系,而汉语作为孤立语,其基本语法单位“字”,不体现任何语法关系。所以汉语句子中的语法关系就是由字组和字块来体现。
  
  二、字本位理论的应用
  
  (一)在计算语言学中的应用
  从20世纪50年代到60年代中期,计算语言学的研究中心一直就是机器翻译。机器翻译的开创者美国洛克菲勒基金会副总裁韦弗(W.WEAVER),曾在1949年发表了一份名为《翻译》的备忘录,正式提出了机器翻译的问题。他在备忘录中认为“翻译类似于解读密码”。受到韦弗这种认识的影响,同时也由于计算机和语言处理知识的条件限制,当时的机器翻译采用的主要是“词对词”的策略,而翻译效果非常不理想。目前,机器翻译进入了繁荣期,但是依然困难重重。1966年美国ALPAC报告指出的机器翻译遇到过的“语义障碍”至今仍然没有得到很好的解决,机器翻译技术还是没有取得突破性的进展。而对于中国的计算语言学来说,这样的困难就显得更大。汉语属于语义型的语言,其意义的理解对语境、篇章的依赖性很强。而汉语语言学对“字”与“词”两者的定义不明,使得汉语在处理上出现了一个西方不存在的难点,就是自动分词的问题。

  西方的文字基本属于字母文字,词与词之间有明显的间隔,如“a word”,就是两个词。因此要识别出词来并不困难。但是汉语并非如此。汉语在实际书写时,是以字作为基础单位。从中文信息处理的角度看,汉语在计算机信息输入过程中,也是以字输入为基点,即是以“字”为中转过渡的。但是汉语中字与字之间有明显的间隔,而词与词之间并没有明显的间隔。而且一个字与一个词之间并不对应。一个字有时可以是一个字,有时也可以是一个词。这就给计算机处理汉语进行自动分词时,带来很大的障碍。例如:歧义切分问题无法回避,且数量巨大,新词不断出现,增长速度不断提高,外来借用词不能也无法全部纳入词典中等。而“字本位”的理论思想,则给现实操作带来便利。
  徐氏的字本位理论认为,汉语中的大多数字,既可以单用,也可以与其它字组合获得编码能力。一个字能否与其它字组合,能与多少字组合,其数量代表了此字的生成能力。以这个字作为参考的基准点,来考察此字和其它字组合的生成能力,那么此字便被称为“核心字”。以核心字为基础,即可进行语汇研究。而字的特点是语义核心,单个字的语义抽象并且概括,这给字与字组合形成具体形象的意义,提供了可能。也就是说,字义与字义构成词义,词义与词义构成句义,即字义才是最基本的单位。“从抽象、宽泛、模糊的字义到具体的句义是通过字义的组合实现的。单字的抽象、宽泛、模糊的意义犹如一个独特的语义场,浮现着很多语义因子,借助于这些因子的触角去勾联其他语义场的语义因子,相互组合,使若隐若现的语义因子具体化为语义特性。”[6]
  《一种基于字同现频率的汉语文本主题抽取方法》一文即是沿用这一思路。其实际数据证明,以字作为基本处理单位,“该方法速度快,适应多种文体类型的文本,并完全避开了分词和抽词过程,可以广泛应用在主题句,主题段落等主题抽取的多个层面,而且同样适用于英语等拼音语言以及多语言文本。”[7]
  
  (二)在对外汉语教学中的应用
  徐通锵先生认为,“字的性质是形、音、义三位一体,听觉单位、书写单位、结构单位三位一体”, 但是在印欧语中听觉单位是音节,书写单位是字母,基本结构单位是词。[8]“字”作为汉语中的基本结构单位,拥有突出的表意性,是汉语词汇衍生机制的基础和核心。核心字与其它字组合,构成众多字组。核心字即是考察字组的参考平面,也是字组生成的联想参照点。核心字构成字组之后,可以分成很多类别,如果以核心字所处位置来分,大致可以分为两类,一类是核心字在字组内处于前面,另一类是核心字在字组内处于后面。例如两组词
  (1)白水、踩水、缸水、开水、口水、死水……
  (2)水表、水兵、水车、水道、水花、水路……
  这是以“水”为核心字的字组系族。在这里核心字“水”既可以放在前,也可以放在后,前后位置的不同显示出字与字在选择、组合时所隐含的不同语义功能。徐先生把类似第一组的字组称为向心字组。在向心字组中,核心字代表了一个如语义场的义类,它大致框定了这个字组意义的范畴或所属,而与其组合的前字,则在核心字义的基础上具体、细化字组的语义特征,就如对处在后面的核心字的注释。如“白水、开水、踩水……”其意义的重点都是在“水”字上。区别只是水性质的不同或以“水”为行为目标的对象的不同。第二组则被称为离心字组。徐先生认为在语汇性的语义结构中,意义重点都是偏重在字组的后字上,因此当核心字处在字组前面时,其作用是去限制后字所代表的各个义类的语义范围,突出它支配其它义类的语义功能。如第二组中“水表”,其意义的重点即在“表”上,“水”则限制“表”的意义种类。“字组前后字的语义关系我们可以用一个公式来表示:‘字组的意义=语义特性×义类’。语汇性的意义和语法性的意义都可以以

[1] [2] 下一页

 
  | 设为首页 | 加入收藏 | 联系我们 | 友情链接 | 版权申明 |  
Copyright 2006-2009 © www.lsqn.cn All rights reserved
历史千年 版权所有