明人庸愚子在《三国志通俗演义序》中所言“文不甚深,言不甚俗”,是对《三国演义》语言风格的准确而形象的概括。《三国演义》取文言的简明精粹,舍其深奥板滞;学白话的生动浅显,而弃其粗俗低劣。这种言语风格的形成,熔铸了从史家著述、讲史话本到文人创作几个阶段的语言运用成果,具有重要的研究价值。本文试图从字频的角度对《三国演义》的“文不甚深”进行探讨。
本文选用了人民文学出版社出版120回本《三国演义》。根据这个版本,我们制作了《三国演义》文本的数据库,并提取了一些重要数据。
(1)全书使用最多的字是“曰”,共使用了8752次,覆盖了《三国演义》全书1.8011%的内容。(2)全书只用过一次的字有526个字种,这些字称为“一用字”或“独用字”。全部一用字覆盖全书0.1082%。(3)频次在1000以上的共有102字,这102个字一共用了205738次,覆盖了全书42.3383%的内容,在《三国演义》的3928个单字中,这102个字,是频次最高的一群。(4)上述102个字对于小学生而言已不算生疏,“一二三上中下天人出入有无来去山云”等多在启蒙教育中就已经熟练掌握;“曹操刘关张公”这些姓名用字等,一般小学低年级学生也基本能熟练掌握。(5)按照字频顺序,第1—1369号字累积出现461664次,占全书34.8523%的单字覆盖了全书95.0047%的内容。这也可以说掌握了这1369个字种的汉字,理论上能读懂《三国演义》全书95.0047%的内容。(6)第1—2347号字累积出现481084次,这2347个字占全书所用单字的59.7505%,却覆盖了全书99.0011%的内容。(7)余下的1581个字,频次在9—1之间。其中有526个一用字。这1581个字占全书用字的40.2495%,仅覆盖了全书0.9989%的内容。
《现代汉语常用字表》是根据庞大的语料库统计字频后语言学家研制出来、由国家进行推广应用的。我们可以把这个表作为“标尺”来衡量《三国演义》字频表中字种的常用情况,从用字角度验证《三国演义》的“文不甚深”。
《三国演义》字频表中的936个高频字(包括核心字和高频字)覆盖全书90%的内容,这些字有837个在《常用字表》中的“2500”个一级常用字种中,《三国演义》高频字有占所有高频字的89.42%;有49个在“次常用字表”的“1000”个字种中,这也就是说有占全部高频字94.66%的886个高频字在《常用字表》中,理论上已经能够读懂《三国演义》文本。
在《三国演义》中频区段的1410个汉字字种中,有1152个81.7021%的字种包括在《常用字表》中的,仅有258个字种的汉字不包括在《常用字表》中,中频字区就有字种包括在了《常用字表》中。这258个汉字除非一些由于语料特色原因导致的频次相对偏高外,如一些姓氏、人名用字和其它一些时代特色的名物用字等,它们在《三国演义》字频表中的位置也多相对靠后,频次不高。
(作者单位:曲阜师范大学文学院)