笔者十余年前提出,当下是图书馆生死抉择的重要时间节点,如果不积极投入新媒体时代知识管理领域,尤其是数字人文领域的探索和实践,未来则必将被社会降级或者淘汰。
为什么会有如是之说?从传统社会中知识生产的一个循环过程可知:作者著文立说,出版社编辑出版,出版物被图书馆收藏并提供给相应的研究者,读者阅读图书,积蓄知识、酝酿思想成长为作者,再不断著写。在这一图书生产的过程中,作者占据知识生产的最上游,下面就是出版社和图书馆。如今观察到的事实则是:作者写作、出版社加工图书普遍使用电子文档,网络传播距离空前缩短,大量精准的电子影像版图书由出版社和数据服务商直接提供给读者,而精准智能的知识服务也越来越丰富。2014年,中华书局开发的中华经典古籍库上线,2016年又联合多家重要古籍出版社,将已经出版的古籍文本资源经过统一标准加工,注入中华经典古籍库之中,提供给公众使用。这个数据库将真正经过精密校勘整理的高质量古籍文本转化成的数据,而且里面有上佳的专有名词的标引,当读者检索人名时,并非在全部数据文本中搜索,仅在人名的范畴内查找,地名同法,亦只在地名的范围内查找,提高效率,防止冗余,规避差错。这是一个庞大的优质古籍数据库,极大提高了文本准确率以及专有名词的查全率、查准率。所以笔者在中华经典古籍库发布会上预言,将来回顾历史,必将认定2014年为中国古籍文本数字化的元年。以往的古籍数字化产品,差错率远高于纸本出版物,学者们无法相信,也不敢使用,与严谨的学问背道而驰。而这一数据库,真正在人文学者中建立起信任感。
还有一类数据库也引人注目。如北京大学中国古代史研究中心、“中央研究院历史语言研究所”和哈佛大学燕京学社在燕京大学旧地实施的“中国历代人物资料数据库”项目(简称CBDB)。这个数据库不同于一般意义上的古籍资料库,不仅提供人物传记资料索引,还提供中国历史人物与人物、人物与地名、人物与书籍、人物与制度等多方面联系的知识系统,一定意义上将此前检索工具书进行了统合,构成了网状的知识管理体系。
这些新技术与图书馆存亡有什么关系?新技术介入之后,图书在进入出版社这一环节时就已经转化为电子文献,在学术研究机构中完成知识标引和提取,并经过结构化、智能化处理,直接面向读者提供精准的文献服务。如此,处于知识生产环节下游的图书馆除了保存纸本文献之外,在知识服务领域已然无事可做了。
然而,这就是图书馆的命运吗?须知,图书馆自身拥有文献保护保存、知识管理和社会服务三大功能,既要提供资源也要分享知识。分享知识不同于提供资源,不是把书借给读者这个过程就完成了,而是要把书里相关的知识汇总,并有序地构结在一起,传达给读者。
回溯中国图书馆的发展史,可以看到,最早的公共图书馆是由藏书楼转化而来,在知识管理和服务方面具有先天缺陷。而今若因为技术的更新,又蜕变回藏书楼,岂非悲剧!目前的形势,向图书馆提出了更高的要求,图书馆只能回应并积极参与,才有一线生机。
除了知识生产程序上的问题,传统图书馆的技术系统亦存有缺憾。人文学术研究之所以需要图书馆,不仅依赖它保存文献,更需要它承担起管理知识和分享知识的职能。管理知识第一要义就是有组织体系。图书馆传统的知识组织体系,例如分类目录、主题词表等等,无论多么高明,都是树状体系,最终会遇到一个末端结点。但知识本身并不是树状分布,而是如同一张互相联结的神经网络。只有更新知识组织体系,建立起一个多维度、互相联结、没有最终结点的网络,才能最大限度发挥馆内数据库的作用,为人文学术研究服务。为此正需要发挥“第五媒体”的作用。
如果我们说人类的语言是第一媒体,后面依次是书写媒体、广播媒体、电视媒体,新兴的计算机及其网络则是第五媒体,而第五媒体的特性就是建构起没有最终结点的知识网络,实现跨媒体的知识管理,将人类的经验、知识和智慧统合起来,方便分享和传播。这次媒体变革意义远远超过图书分类法转变的意义,管理知识体系从树状结构改变为网络结构,带来的是精准的细粒度的知识分享和全方位的知识统合。这必将改变人类的认识方式、学习方式,对于学术研究方式更有重大影响。
对于图书馆而言,像CBDB这样类型的知识库,不是图书馆选用的众多普通古籍资源数据库中的一个,亦不像期刊网、基本古籍库、方志库、敦煌文献库、金石文献库当中的任何一种,CBDB对于传统数据库绝对不在同一级别上。如果按照目前的思路走下去,CBDB就是“网络基础设施”的一部分,它所具有的本体是可以覆盖一切的知识,也是一切知识的基底,是最基础的知识库。网络基础设施与专题数据库之间的关系,请参考笔者的《索引与知识发现》和《古籍数字资源的知识库建设解析》两篇文章中的论述。当图书馆采用CBDB这样的网络基础设施之后,我们可以回归到文本的最基础的本体上面,所有都要从构成完整意义的词语和它们的相互关系开始,然后遇到任何新文献都能通过最原始的前期的积累对之进行扫描、知识提取再放入系统中。这样就避免图书馆重复建设或购买各项专题、各种学科的数据库而无法整合在一个体系中。
最初我们可能觉得网络基础设施的建设比较缓慢,功能设计上也有各种缺陷,专家会提出这种设施的知识范围不够广阔,缺少纵深,未为可信,但只要有足够的人力和资金投入,由网络基础设施构建的知识库可以很快超过任何一位顶级专家的所知所能,统领一切的经验、知识,甚至发展具有人工智能的人文科学研究者。最终,我们节省了很多资金和时间,一劳永逸地解决专题数据库的各自为政,互为抵牾的问题。这种意义不仅针对当下,应该更具长远性,对整个人类知识和文明加以归纳重组,成为创新的厚积薄发。
综上所述,我们可以明白,数字人文研究发展的趋势不是对应某些专业领域,处理一部分资料信息,制作一系列的专业数据库,而是制作“网络基础设施”。同时,这也是图书馆在数字媒体时代必须承担起来的任务,也是唯一的求生之道。
(作者单位:史睿,北京大学中国古代史研究中心;王楠,中国社会科学院文学研究所)