首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    中华读书报 2022年05月18日 星期三

    数字让人文更新

    刘石 孙茂松 《 中华读书报 》( 2022年05月18日   06 版)

        日前,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,共五个方面18条,内容全面,要求明确,指导性强,鼓舞人心。对于我们来说,其中的第12条:“推进古籍数字化。建立健全国家古籍数字化工作指导协调机制,统筹实施国家古籍数字化工程。积极对接国家文化大数据体系,加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共享。支持古籍数字化重点单位做强做优,加强古籍数字化资源管理和开放共享。统筹古籍数字化版本资源建设与服务,推进古籍专业数据库开发与利用。积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级。”特别让人感到振奋。

        计算机科学的发展使得大数据时代不期然而至。中国大陆古籍数字化已有30年左右的历史,但相对于20万种现存中国古籍来说,得到数字化的古籍尚属很小一部分,这项工作在今后相当长时间内仍当是亟待加强的工作。《意见》提出的“建立健全国家古籍数字化工作指导协调机制,统筹实施国家古籍数字化工程”,正当其时,非常重要,希望有关部门能够以此为契机,抓紧落实。

        技术的发展,倒逼我们提出更高和更激荡人心的目标。随着计算机深度学习能力、文本挖掘等大数据技术和人工智能的快速发展,我们应该在继续推进古籍数字化的同时,呼吁古籍由数字化向知识化转变。这也正是上引第12条最后两句“积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级”所表达的内容。它充分体现了《意见》对于古籍数字化领域发展前沿的深刻把握,对于利用现代科技手段促进古籍整理与研究的高度关切,具有极为重要的前瞻性和方向性,值得我们重视。

        数字化和知识化的最大区别,就是前者仅可提供简单的字词检索,后者则是基于现存所有存世古籍的关系性、结构化、知识再生型的超大数据库。几年以来,我们已在构想建立“中国古典知识库”。所谓“中国古典知识库”,简单地说,就是运用计算语言学和自然语言处理前沿技术,开发适合不同古籍类型的文本分析模型和工具,实现针对古籍文本的词汇抽取、分词和关联分析;使用人工智能、大数据、自然语言处理等相应的技术工具和手段,借助过往一切古典学的研究成果,周密地设定主题词表,专业地提取各种实体,如年代、地名、人名、书名、篇名、职官、社团、思潮、事件以及各类语言和文化要素,多维度地构建不同实体间的关系,并通过这些实体及相互关系,在保障古籍文献内容完整性及内部逻辑性的基础上突破文献原有结构,对文献进行深层组织和知识管理,构建为体系化的“中国古典知 识 库”(Chinese Classics Knowledge Base,简称CCKB)。

        “中国古典知识库”是关乎中国古典知识整体的宏大构想。它的建设,有望给与古代文化研究相关的众多学科带来决定性变化。这些变化,《意见》表述为“古籍整理利用转型升级”,可谓言简意赅。首先是古籍整理的转型升级。大数据技术引发了传统文献生产的创革、文本形态的新变和文献获取方式的拓展;其次是古籍利用的转型升级。碎片化、标准化、结构化、关系化与可视化的古典知识库,可以知识结点为单位组织信息,以链接方式表达特定联系,随时根据需要组成非线性网状结构的各种文本集、数据库等“宏文本”或“超文本”,最大程度地促进了文献的关联与知识的再发现。网络分析、文献计量、主题模型等文本信息技术的应用提升了人文学术的整体性、实证性、求是性与科学性,从根本上促进了传统文献学的现代转型。

        现在国外的某些名校已经在开展局部的中国古典知识库的工作了(比如哈佛大学“中国历代人物传记资料库,简称CBDB”)。因之,它的建设不仅关乎古籍整理和中国传统文化研究的推进,也关乎我国的信息安全和文化自信,我们应该意识到这件工作的重要性和紧迫性。

        数字让人文更新。这一宏大构想不是一个机构或少量人员在短时间能够完成,它需要国家将之真正上升到文化发展战略高度,相关职能部门高度重视,给予规划和指导;需要专业力量和技术力量的通力合作,需要多个高校或科研机构、企业合作完成。现在,我们十分高兴地看到《意见》就此提出了明确的期望和要求,相信此项工作能够尽早提上议事日程。

        (刘石为清华大学人文学院教授,孙茂松为清华大学计算机科学与技术系教授)

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有