编者按
为贯彻落实中央有关精神,适应当代学术发展潮流,去年以来,国家社科基金设立一批重大招标项目,对跨学科研究进行专项资助。为进一步推介学界跨学科研究成果,本专刊自即日起开辟“跨学科研究”专栏,以飨读者。
长久以来,语言研究的科学化一直是现代语言学家的一个主要努力方向与重要目标。
现代自然科学成功的原因主要是:可验证的结论、精准的预测能力以及丰富的实际应用。而这一切都需要通过各种实验方法与恰当的模型来获得。因此,测量方法与实验手段的改进是自然科学理论发展的基本保证,其中计量与测量又是其基本操作。然而,在人文社科领域,除心理学、经济学、社会学等学科外,计量手段却用得很少。如果计量手段是一门学科科学化的有效方法,那么,在语言学中引入计量方法可能是语言学科学化的必要途径。
1935年,美国语言学家齐普夫有关语言统计的著作出版。这标志着一个新的语言学分支学科和一种新的语言研究方法的诞生。齐普夫认为利用统计方法可以定量研究语言中的各种现象,这样语言学便可成为一门精确的科学。齐普夫这本书的标题“语言的心理生物学”表达了结合人类的经验与功能来研究语言的愿望,书的副标题“动态语文学”则强调了这种方法与其他方法的主要区别在于研究采用的是真实的语言样本。齐普夫所倡导的这种用精确的方法来研究语言结构与发展规律的学科,今天称之为“计量语言学”。大量真实的语言行为数据可以反映语言结构及其相互关系遵循着某些普遍的规律,这些规律正如那些众所周知的自然科学规律一样,可以用严格的数学形式来表达。计量语言学的目的就是揭示这些语言现象之间的关系,系统地描述并用公式化的定律来解释这些现象。
20世纪70年代之后,有不少语言学家开始使用数学方法来进行语言规律的探索,计量语言学在德国和东欧得到了快速的发展。目前这一领域的主要代表人物大多来自德国、奥地利及东欧国家,其中最著名的是德国波鸿大学的阿尔特曼教授。他在计量语言学的诸多领域均有重要贡献,是齐普夫之后最重要的计量语言学家,被誉为现代计量语言学的奠基人之一。另外一位重量级人物是特里尔大学的科勒教授,现任国际计量语言学学会会长与会刊《计量语言学学刊》主编。
然而,计量语言学研究不只是以上国家和地区的一个局部现象,其研究方法正被许多国家的学者用来精确地探求人类语言的普遍规律。国外语言学家已对多种语言进行了多层次、全方位的计量研究,发现了许多语言系统的结构与演化规律。这些研究不仅有助于人类对语言系统的精确认识,加深了对人的认知机理的理解,也极大地提升了语言学研究的科学价值。
从学科的特点和地位来看,计量语言学不同于一般的采用代数、集合、逻辑等方法对语言的结构特征进行(静态)定性描述的形式语言学,也不同于通过语料库来研究语言结构与使用的语料库语言学。计量语言学关注的是语言的定量特征以及这些特征之间的协同关系。因此,计量语言学与其他语言学分支的差别主要是方法上的差别。采用从真实文本中抽象出的数量关系,描述与理解语言系统及其组成成分的发展与运作规律是计量语言学的根本任务。“精确、真实、动态”是计量语言学研究的三大特点。计量语言学认为,语言是一种生物—认知现象,也是一种心理—社会现象。语言系统是一个自组织、自适应的动态系统,是一个复杂系统。计量语言学研究涉及语言学、数学、统计学、社会学、心理学、物理学、系统科学和计算机科学等多个学科领域,是一个典型的文理交叉学科,具有鲜明的跨学科研究特质。这些特点使计量语言学成为语言学诸多分支中最具现代科学特点的一个研究领域,而它所发现的语言规律也有助于更精确地描写与解释相应的语言现象。
经过几十年的努力,各国计量语言学学者已经发现了不少具有普适性的计量语言学定律。这些定律可以分为三类:分布定律、函数定律、演化定律。齐普夫定律、门策拉—阿尔特曼定律、皮奥特洛夫斯基—阿尔特曼定律分别是这三类定律的代表。
(1)齐普夫定律:20世纪20年代,哈佛大学的语言学家齐普夫在研究人类语言的真实文本时,发现词出现的频数与其频数序之间存在反比例关系,这一关系后来被称为齐普夫定律。齐普夫定律是计量语言学最早提出的统计规律之一,也是一个在计量语言学中具有核心地位、与诸多语言性质和语言过程密切相关的语言规律。
(2)门策拉—阿尔特曼定律:1928年,德国心理学家、语音学家门策拉在研究词和音节的长度关系时发现,随着一个词所含音节数的增加,这些音节的平均长度会减小。他把此种现象概括为“整体越大,其组成部分就越小”。为了用数学公式建立语言学单位间的这种部分与整体的关系,阿尔特曼于1980年对其进行了数学描述,将其精确为“一种语言结构越长,则构成它的成分越短”,即:部件长度是结构长度的函数。
(3)皮奥特洛夫斯基—阿尔特曼定律:如何用数学手段来描述语言中的变化是计量语言学家所关心的问题之一。1974年,苏联语言学家皮奥特洛夫斯基等人提出用反正切函数来描述语言的演化规律。1983年,阿尔特曼等人在皮奥特洛夫斯基发现的基础上,结合拉波夫等人的研究成果,提出了语言演化规律的三种变体。这一定律认为“所有语言变化都是新老形式交互作用的结果”。
观察现有计量语言学研究成果,不难发现,目前计量语言学研究采用的语料大多来自欧洲语言。这种过于注重欧洲语言的现状,对计量语言学的进一步发展是不利的。我们需要用更多类型的语言来验证语言定律的普适性,否则很难把某个定律视为人类语言的普遍规律。扩大计量语言学所研究语种的数量与类型不仅有益于发现普适性的定律,也有助于发现每种语言的特殊性。在中国开展计量语言学研究,不但可以更精确地了解汉语的结构特征,而且也可以通过与其他语言的比较,更深入地理解汉语所具有的特殊性与普遍性。更为重要的是,此类研究是真正从系统科学的角度来全面理解汉语系统的基础,对于建立科学哲学基础之上的汉语语言学理论具有极大的意义。
总的说来,开展多层次的汉语计量语言学研究不仅是对国际计量语言学的补充与发展,也有助于提高中国语言学的国际化与语言学的科学化,是一个值得更多语言学家参与的领域。
(作者为国家社科基金重大项目“现代汉语计量语言学研究”首席专家、浙江大学教授)