首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 养生
  • 女人
  • 文娱
  • 电视
  • 图片
  • 游戏
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    光明日报 2013年05月27日 星期一

    从字频看《三国》

    作者:桑 哲 《光明日报》( 2013年05月27日 15版)

        明人庸愚子在《三国志通俗演义序》中所言“文不甚深,言不甚俗”,是对《三国演义》语言风格的准确而形象的概括。《三国演义》取文言的简明精粹,舍其深奥板滞;学白话的生动浅显,而弃其粗俗低劣。这种言语风格的形成,熔铸了从史家著述、讲史话本到文人创作几个阶段的语言运用成果,具有重要的研究价值。本文试图从字频的角度对《三国演义》的“文不甚深”进行探讨。

        本文选用了人民文学出版社出版120回本《三国演义》。根据这个版本,我们制作了《三国演义》文本的数据库,并提取了一些重要数据。

        (1)全书使用最多的字是“曰”,共使用了8752次,覆盖了《三国演义》全书1.8011%的内容。(2)全书只用过一次的字有526个字种,这些字称为“一用字”或“独用字”。全部一用字覆盖全书0.1082%。(3)频次在1000以上的共有102字,这102个字一共用了205738次,覆盖了全书42.3383%的内容,在《三国演义》的3928个单字中,这102个字,是频次最高的一群。(4)上述102个字对于小学生而言已不算生疏,“一二三上中下天人出入有无来去山云”等多在启蒙教育中就已经熟练掌握;“曹操刘关张公”这些姓名用字等,一般小学低年级学生也基本能熟练掌握。(5)按照字频顺序,第1—1369号字累积出现461664次,占全书34.8523%的单字覆盖了全书95.0047%的内容。这也可以说掌握了这1369个字种的汉字,理论上能读懂《三国演义》全书95.0047%的内容。(6)第1—2347号字累积出现481084次,这2347个字占全书所用单字的59.7505%,却覆盖了全书99.0011%的内容。(7)余下的1581个字,频次在9—1之间。其中有526个一用字。这1581个字占全书用字的40.2495%,仅覆盖了全书0.9989%的内容。

        《现代汉语常用字表》是根据庞大的语料库统计字频后语言学家研制出来、由国家进行推广应用的。我们可以把这个表作为“标尺”来衡量《三国演义》字频表中字种的常用情况,从用字角度验证《三国演义》的“文不甚深”。

        《三国演义》字频表中的936个高频字(包括核心字和高频字)覆盖全书90%的内容,这些字有837个在《常用字表》中的“2500”个一级常用字种中,《三国演义》高频字有占所有高频字的89.42%;有49个在“次常用字表”的“1000”个字种中,这也就是说有占全部高频字94.66%的886个高频字在《常用字表》中,理论上已经能够读懂《三国演义》文本。

        在《三国演义》中频区段的1410个汉字字种中,有1152个81.7021%的字种包括在《常用字表》中的,仅有258个字种的汉字不包括在《常用字表》中,中频字区就有字种包括在了《常用字表》中。这258个汉字除非一些由于语料特色原因导致的频次相对偏高外,如一些姓氏、人名用字和其它一些时代特色的名物用字等,它们在《三国演义》字频表中的位置也多相对靠后,频次不高。

        (作者单位:曲阜师范大学文学院)

    光明日报
    光明日报(1985.01 - 2009.12)
    中华读书报
    中华读书报(1998.01 - 2010.08)
    文摘报
    文摘报(1998.01 - 2010.08)
    出版社
    考试
    博览群书
    博览群书(1998.01-2009.08)
    书摘
    书摘(1998.01-2009.08)

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有