首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    光明日报 2011年11月09日 星期三

    用数字化“激活”出土古文献宝藏

    作者:刘志基 《光明日报》( 2011年11月09日 14版)

        数字化是人类最先进的文字处理手段;中国的出土古文献,是人类最古老的文字材料之一。用数字化去完成出土古文献的整理研究,可谓最新现代技术与最古老文化遗产的“亲密接触”,其摩擦出的火花将“激活”出土古文献中蕴含的极其丰富、极其绚烂的人类文化宝藏。这项研究正是我主持的国家社科基金重大招标项目“出土古文献语料库建设研究”试图完成的任务。

        甲骨文、金文等中国出土古文字与古埃及的圣书体文字、西亚两河流域苏美尔人所创的楔形文字,并称为人类历史上最早出现的三种文字。由于出土古文字所传载的出土古文献以其相对年代更早且更真实地保存了文献的原始面貌,因而在浩如烟海的中国传统文献材料中成为最具历史厚度的部分,在上古语言文字、历史文化乃至早期人类文明的方方面面,出土古文献都具有无可替代的认识价值。然而,正是这样一种极其珍贵的中华文化典藏,长期以来却未得到与其价值相匹配的公众认知度,除了极少数专业研究者,出土古文字对大多数人而言都是难得一见且极难读懂的“天书”,可敬而不可近,更难古为今用,这无疑是一种文化资源的极大浪费。

        追究这种局面的成因,并非中国人厚今薄古,不“待见”老古董,汉字传输系统对古文字一贯的排斥,才是“罪魁祸首”。汉字传输手段大体上经历了手写传抄、雕版印刷、活字印刷、数字传输(电脑输入)等阶段。从活字印刷术开始,到为人类长期倚重的铅字印刷技术以及迄今的电脑排版印刷技术,以古文字为载体的出土古文献从未被主导的汉字印刷排版系统所接纳,抄书成为其基本的传播方式。直至今日,古文字书籍还不乏手抄后照相排版印刷者。传输手段落后所带来的负面影响不光是数量的短缺,更有查检的障碍,“为找一书,寻遍天下”、“为查一字,翻遍全书”的实际状况长期延续,将出土古文献置于越积越厚的历史尘封之下,而与社会公众渐行渐远。

        出土古文献语料库的建设,旨在面向全球创建一个出土古文献资料网络传播平台,在这个平台上,任何一个计算机终端上的读者,都可以轻点鼠标而在瞬间获得所需的且被多角度解读的出土古文献材料,这无疑将大大拉近出土古文献与社会公众的距离,“激活”这笔宝贵文化遗产所蕴涵的人类精神财富。当然,出土古文献能被渐成主流的网络传播平台所接纳,也有助于这笔极其宝贵的中华文化遗产在数字化时代获得一个前所未有的发扬光大的机遇,进而提升国家语言文化的软实力。

        毫无疑问,本项目既然定位于语料库建设,其意义就不会局限于一般意义的出土古文献知识传播,服务于出土古文献专业研究,推动这一具有极其悠久历史的研究门类与时俱进地获得数字化的研究利器,乃是项目研究的终极目标。随着计算机技术的发展与普及,语料库在语言文字研究中的地位被形象地比喻为“农业时代的耕地和工业时代的工厂”。在现代汉语领域,语料库推动科学研究的作用已得到充分证明,而在出土古文献研究领域,基于语料库的研究尚属空白,因而数理统计、计算机自动分析等现代研究手段尚无用武之地,这对于出土古文献研究而言,无疑是一种巨大缺失。

        根据服务专业研究的目标规定,本项目所设定的最终成果,在体量和层次上都大大超越既有的同类成果:材料范围,需穷尽已公布的相关原始文献资料和研究资料。而材料的整理加工标注,则需贯彻语料库的标准,并充分兼顾出土古文献的特点而形成多维度的模式。鉴于传载出土古文献语料的古文字本身的释读及其结构功能问题对语料的认识理解会产生巨大影响,课题研究除了按照语料库建设的惯例,对出土古文献材料进行词汇、语法等方面的属性标注外,还将以字为对象关联相关考释研究信息,并进行各个层次的文字属性的标注。另外,由于出土古文献的文献类型与语料特点的关联性颇为巨大,课题还将根据文献内容进行事类标注。因此,课题试图建设的语料库,将完成以语言属性为核心的复合型内容标注,使语料库除了能够提供先秦文献语言信息外,还在汉字的早期发展、先秦社会文化等方面提供无可替代的信息。其最终成果将兼具电子类书、出土古文字字料库、电子诂林等多种功能。

        毋庸讳言,出土古文献语料库的建设绝非轻而易举之事,困难重重,障碍多多,是项目研究目前所面临的客观现实。为最古老的出土文献材料的研究传播注入最新现代信息技术的活力,是课题研究的最大特点,而困难也由此产生。由于目前中文信息化平台尚不能支持出土古文献的数字化处理,完成语料库的建设首先需要将海量的出土古文献材料从传统载体形式转换为能够为数字化所处理的载体形式,这中间所包含的文字整理、字符集确定、逐个造字等工作堪称海量,仅造字就需以六位数来计数,由此可见一斑。另外,为保证最终成果的学术质量,课题必须在全面吸收迄今相关研究成果的基础上完成收录所有出土古文献的释文的审订,而形成反映学界最新研究水平的出土古文献释文,这本身又是一项巨大工程。

        (作者为国家社科基金重大项目“出土古文献语料库建设研究”首席专家、华东师范大学教授)

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有