首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    中华读书报 2012年08月01日 星期三

    “现汉”是怎样炼成的

    《 中华读书报 》( 2012年08月01日   06 版)

        近日,第6版《现代汉语词典》正式发行。新版词典共收单字13000多个,收录条目增加至69000多条,在第5版基础上新增收词语3000多条,将“给力”、“雷人”、“宅男”等热词收入其中。

        新版“现汉”发行后,不出意料的是社会上出现了两种声音,一些人认为第6版收录新词“酷词”说明词典编写者注意日常生活中汉语语言的新发展,是“与时俱进”;另一些人则质疑“现汉”收录新词过于急进,认为有些词汇注定只能是昙花一现。还有一些人认为,第6版“现汉”所面临的争议是其纸质词典的身份所带来的,“现汉”和所有词典一样,其未来发展趋势都将是走上网络平台,走入电脑、平板电脑和手机之中,那时的“现汉”,编辑人员可以随时更改词条,而不需要有几年修订一次所带来的“隆重的烦恼”。

        《现代汉语词典》第6版编写单位、中国社会科学院语言研究所词典编辑室主任谭景春说:“语言是随着社会发展而变化的,社会发展越快,人们思想的变化越快,新词必然也出现得更快,这是因为人们需要新的词汇来表达新的事物。同时,人们也有求新求异的心理,往往觉得旧词在形容新事物的时候不够吸引人。而当今社会信息传播的高速度,也让新词汇传得更广更快。”他承认,越来越多的新词,给词典编写带来了挑战,但他相信,“现汉”第6版延续了之前版本的权威性和准确性。谭景春引用著名语言学家胡明扬教授的话,“《现代汉语词典》之所以是开创一代词典编纂范例的著作,就是因为:首先,其开创了汉语词典编写的崭新的科学体例;其次,参与编写人员的语言学的素质和修养都比较高,编纂组织和实施科学有效。”此次“现汉”的修订,就有一支多年龄段学者组成的“豪华团队”。

        开门编词典

        人们想象中的词典编写场景可能是这样的:几名老专家戴着厚厚的眼镜,在台灯下伏案工作……但商务印书馆汉语出版中心主任助理余桂林告诉记者,此次参与修订“现汉”的团队中,老、中、青三代都有。主持人是社科院原副院长江蓝生,还有“现汉”第5版修订的主持人晁继周、韩敬体等老先生坐镇;而一些中生代专家和刚毕业不久的博士也加入了这个团队。谭景春说:“此次修订队伍中拥有正高职称的就有15位,年龄最大的韩敬体先生参加过现汉第一版前的‘试用本’的编纂,主持人江蓝生更是社科院学部委员。”余桂林也表示:“这个团队中有在学术上‘镇得住’的学者,也有能够带着新视野考察新词汇的年轻人。”

        据谭景春介绍,“现汉”第6版修订,署名的参加人员有28位。但实际上,“现汉”的修订是一项复杂的工程,“词典修订后期需要社科院语言所内专家和全国大专院校的老师和教授审读,所内专家和所外专家各30多人,因此,参与了‘现汉’第6版修订工作的实际上接近百人。”参与人数之所以达到这样的规模,是因为此次修订延续了词典编辑室“开门编词典”的传统,谭景春说:“词典修订后期的专家审读还不足以说明我们‘开门编词典’。其实在修订前,我们就已经广泛收集读者对第5版‘现汉’的意见,收集报刊杂志上关于‘现汉’的论文和评论,予以参考吸收。而在六版修订开始的时候,社科院语言所就确立了十几个研究专题,从修订组到所内研究人员,都承担了部分课题研究工作,为‘现汉’的此次修订做了学术上的准备。”

        修订人员的“豪华阵容”,保证了“现汉”的规范和权威性,却也使其修订周期很难缩短。余桂林就指出,《现代汉语词典》这样一部规模中等的语文词典,一般是五到七年修订一次,而像《辞海》这样的大型词典则是十年修订一次。“‘现汉’第3版是1996年出版,第4版是2002年出版,实际上第4版只是在第三版的基础上进行了增补,算是‘小修’。2005年的第5版则是‘大修’。”余桂林说,即使在网络时代,网络词语更多进入生活,新词、新义出现更多,频率更快,但是,“词义的归纳和概括需要投入大量的人力。同时,《现代汉语词典》是规范的词典,需要有一定的稳定性,因此我认为词典的修订可能会比五到七年的周期稍微缩短,但不会有大的调整。”

        据余桂林介绍,对于词典编写团队来说,词典的一个新版本的出版,就预示着下一个版本的修订工作的开始。“比如现在第6版出版后,我们就要开始收集第7版的材料,开始关注报纸和网络上出现的新词语。不过从严格意义上说,第6版的修订工作从2007年底开始,历时五年。”

        五年间,中国经历了北京奥运会和上海世博会,公众关注了无数大大小小的新闻事件,媒体发表了无数长长短短的稿件,网络词汇在五年间蜂拥而至,“现汉”如何取舍?

        从“语料库”说起

        语料,在《现代汉语词典》中的定义是:语言材料,是编写字典、词典和进行语言研究的依据。通俗来讲,语料就是词汇出现的上下文(语言实例),有了语料,语言学者才有了分析词义和词汇用法的依据。

        “现汉”从初编到后来的每一次修订,搜集语料都是工作中的重头戏,谭景春把语料形容为词典编写的砖瓦,修订者的食粮。“五十年代,《现代汉语词典》初编的时候,老先生们是把典范的白话文著作搜集起来,阅读并摘录成卡片。摘录范围包括老舍等文学家的著作,也包括《毛泽东选集》。”谭景春说:“当时勾选了一万多个词语,摘录了超过一百万张卡片,这就是当年的词典编写的基本材料。”

        而现在,谭景春也承认,再投入如此的人力、物力和时间成本去进行大量的阅读和摘录几乎是不可能的,因为现代汉语的文本已经极为丰富。好在,有了计算机技术的帮助。如今,中国社科院语言所新词收集课题组的计算机程序24小时不间断地在互联网上检索新词汇。工作人员把‘现汉’已经收录的词汇输入这个程序中,这样,凡是‘现汉’没有的词汇在互联网上出现,程序都会自动列出来。“不过这个检索的范围非常宽,包括一些专有名词、地名、人名等。所以我们得到这个检索后会进行人为干预,首先选出其中检索到的出现频率较高的词,然后过滤出适合收入现汉的作为修订词典的后备。”谭景春介绍道。

        计算机技术为语料的丰富打下了坚实的基础。另外,语言所也在努力建设自己的古代和现代汉语语料库,谭景春说:“之前提到的一百多万张卡片已经有数字版本,而网络也给我们搜集新词的资料提供了更快捷的平台,遇到新词汇后我们也会通过主流媒体的网站进行搜索,看词汇的使用频率如何,以及上下文和实际词义。在‘现汉’的修订过程中,搜集语料是综合几种方法的工作。”

        不过,谭景春也指出,语料库是必须的,但也不能完全依赖语料库。“由于现代汉语发展的需求,语料库不能完全满足词典编写的需求。需要有语言学修养比较高的人对语料进行辨别,材料和人的专业智慧进行互动,才能有好的效果。”

        新词收录三标准

        余桂林说:“修订词典的主要工作主要集中在收集资料、收集新词、概括词义等方面。社科院词典编辑室的成员需要时时刻刻都注意是否出现了新词汇,而更难的是一些新词义。”余桂林以“宅”字为例,“这个字并不陌生,但近年来,它出现了与过去完全不同的新义,有了动词属性。还有‘山寨’也是一个例子。在‘老词新义’的情况下,收集资料的难度更大,这不但要求修订人员平时多读多看多留意,还要求他们有发现词汇新义的意识。”

        除了社科院语言所的语料库外,国家语言文字工作委员会每年都会发布的“语言生活状况报告”是“现汉”修订组的重要参考,它有调查数据,包括了网络词语和新词语,对于词典编写有一定价值。当然,修订人员在日常阅读中经常遇到的新词汇,更容易引起他们的关注。谭景春说:“修订人员都是以汉语为母语,生活在社会现实中的人,由于专业的关系,当然会对新词汇特别敏感。但是,‘现汉’吸收新词有一个严格的程序。”

        据谭景春介绍,在计算机程序和人工收集来的新词中,修订人员认为可以收录入新版词典的,就会由小组长先行审定词条的编写质量,只有词条过关,才会递交给修订工作主持人,由其确定词条收录。“最后我们还要把这些词汇发给专家去挑选,几位专家把认为应该收录的词都勾选出来。这些专家中,可能有些人对于新词汇比较宽容,有些则比较保守,综合他们的意见,有助于客观反映现代汉语的面貌。”而新版词典修订完毕,还要再让专家审读,方可以发行上市。

        那么,既然“现汉”的新词汇收集有计算机自动检索的帮助,是否可以说在网络上出现频率较高的词汇,就会更有可能被收入现汉呢?余桂林给出了否定的答案,他说:“使用频率并不是考虑词语能否进入新版现汉的唯一因素,还得考虑这个词使用的覆盖面和持续时间的长短,因为有些词汇可能在某一段时间内使用频率非常高,而之后就不会再经常使用,这样的词汇也不会被收入新词典。”

        而谭景春则给出了现汉收录新词的三个“硬标准”:通用度、生命力和规范。他说:“此次‘现汉’第6版修订收入新词、新义三千余条,但实际上,计算机自动检索出的新词汇大大超过这个数字。现在网络上新出现的词汇太多,最初我们可能面临几万个新词,但这些词汇我们都要用通用度、生命力和规范这三个准绳去综合考察,结果,大部分新词都会被淘汰。”

        词汇的所谓“通用度”,通俗来讲就是词汇使用频率的高低和使用范围的宽窄,“现汉”收录的新词不应该仅仅局限于某个行业或某个年龄段,它必须进入了普通人的生活而并非专业的词汇。而“规范”则是指该词汇符合构词法,词义也比较清晰。“生命力”是指这个词汇的稳定性好,能够在现代汉语中流传下来,谭景春指出,词汇的生命力最难判断,“比如‘现汉’中已经收录的‘给力’一词,近期使用的频率就有所下降。词汇能否‘立得住’,这要靠我们的经验去分析。”

        在通用度、生命力和规范这三方面都符合要求的新词汇,入选新版‘现汉’的可能性较大。但是,“现汉”作为汉语规范词典的地位让其对新词的选择总会遇到这样那样的质疑。谭景春说,在这种时候,修订组会参照主要媒体对新词的使用来作出决定。“比如‘二奶’,第五版‘现汉’就收录了,当时就有人说这个词比较消极,”他说:“但我们认为既然在比较正式的文件中都出现了这个词,说明其使用度高,而且范围广,‘现汉’应该包含这个词。”另外,由于《现代汉语词典》的使用者中很大一部分是中学生,修订组在收集新词的时候也会考虑到出现在中学教科书中的词汇,包括物理、数学、化学,最主要是语文、历史和政治课本中的词汇。

        收新词并非“一言堂”

        对于新词的收录与否,年轻的修编人员是否会和老专家意见不一致呢?对于这个问题,谭景春指出:“不单单是我们修订人员内部,在全社会,大家都会对新词的收录有不同的意见。如果是年轻人,接触网络比较多,或者思想比较超前,他们就会认为一些新词该收,会觉得我们添加三千个新词新义还不够。比如‘巨’字,很多人认为它应该有新义,表示‘很、非常’的意思。但我们认为既然汉语中本来就有‘很、非常’可用,‘巨’的新义并没有丰富我们的语言,而且它只流行在年轻人中。当然这个用法非常广泛,也有可能以后会收入。而一些较为保守的读者,可能还会觉得我们收入新词太多。”对于谭景春和修订小组来说,基本的原则是积极收集新词新义,但是在收入词典的时候则要稳妥,既不能太激进,也不能落后于时代,“太超前的网络词语我们一般都不会马上收录。”

        也许,“现汉”对于收录新词汇的选择本就是“仁者见仁,智者见智”的事情,并没有标准答案。而谭景春也表明,在修订组内部,没有所谓的“一言堂”。“如‘菜鸟’这个词,最初我们已经决定不收录了,可是一些修订人员在主流媒体网站上搜索,发现这个词的使用频率非常高,并且已经超出网络使用的范围,在日常生活中也经常出现。因此后来我们决定将‘菜鸟’收入新版现汉。”他认为,这表明“现汉”收录新词的过程并不是由一个或几个权威专家说了算,而是要经过大家反复讨论,“一开始决定收入的新词可能会在后来被淘汰,而开始被淘汰的词汇也可能会最终收入词典。”

        面对搜索,背靠品牌

        过去,《新华字典》和《现代汉语词典》在市场上几乎是没有对手的,但如今,他们面临着一个前所未有的强敌:网络搜索。在人们掏出手机就能在维基百科上搜索几百万词条的时候,纸质词典的未来是什么?

        面对搜索,余桂林一开始也感到压力重重,“从我们了解的情况来看,纸质图书的销售确实在走下坡路。”但出人意料的是,《现代汉语词典》和《新华字典》的销量不但没有出现下滑,而且还略有上升。他说:“我认为主要是因为品牌的影响力,这说明在电子书和网络搜索的冲击下,更能凸显出品牌图书在市场上的地位。在网络时代,大家获取信息的途径越来越多,但得到的信息却良莠不齐,‘现汉’作为品牌图书,读者对其质量信得过,觉得这是让人信得过的辞书,在考试和起草正式文件的工作中,是离不开的工具。‘现汉’的权威性是吸引读者的关键。”在余桂林看来,“现汉”的权威性是得天独厚的,“在编纂修订的时候,我们就是把社会责任放在首位。而且,‘现汉’的学术含量很高,依靠社科院语言所的学术资源,参与修订的学者在字形、字音、字义方面做了十多项的专题研究,看似简单的词条,其实蕴含了许多研究成果。而我们只有保证现汉的学术质量,读者才会持续的为这个品牌买单。”余桂林说:“这样的品牌图书,是经得起考验的,在于网络搜索的竞争中,‘现汉’胜在权威性、规范性、科学性、准确性。”

        当然,余桂林也承认,即使是“现汉”这样的品牌工具书,依然需要宣传和推广。“有些人还在用老版现汉,出了新版他们却并不知道。如今是市场经济、信息爆炸的时代,新品推出后必然需要营销和推广。‘酒香不怕巷子深’的时代已经过去了。”商务印书馆也开通了微博,在余桂林看来,这种新的营销方式最大的好处是其双向性,“当我们宣传现汉第六版的时候,有些读者就会直接提出一些问题,我们就能马上回答;读者在微博上给我们提出各方面的意见,我们也会进行解释。而传统媒体是单向的,我们无法和读者交流。”

        谭景春认为,词典数字化的方向肯定是大趋势,《大不列颠百科全书》停止出版纸质版就是一个例子。他说:“作为编写者,我们当然愿意出版数字版的‘现汉’,因为无论是检索还是编辑,数字版都会比纸质版方便得多。”但他同时忧虑国内的盗版状况,“我国的辞书数字出版滞后,很重要的原因是盗版猖獗,这还要通过司法部门加大打击力度来解决,同时还要呼吁读者拒绝盗版、拒绝抄袭,只有尊重词典制作者的劳动,才能更早看到电子版的‘现汉’。”

        本报记者 宋平

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有