首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    光明日报 2019年12月14日 星期六

    新时代的易学古籍数据库建设

    作者:张涛 尹小林 《光明日报》( 2019年12月14日 11版)

    《周易注疏》 资料图片

        《周易》是中国最古老的文化经典,随着其思想体系的不断拓展、社会价值的不断发掘,逐渐形成了博大深邃的易学文化。而在我国不同历史时期涌现出来的卷帙浩繁、汗牛充栋的易学古籍,成为中华优秀传统文化演进、发展的重要载体,也成为中华民族精神和智慧的集中体现。目前,国学发展已经进入“大数据时代”,如何把传统易学古籍与现代信息技术结合起来,开展好易学古籍数据库建设,将是我们面临的一个重大学术课题。

    收集整理易学典籍,夯实数据库基础

        作为一项浩大的文化工程,易学古籍数据库建设应当以易学古籍的收集、整理和编纂为前提和重要基础。

        我国历代学人非常重视对卷帙浩繁的易学文献进行整理、编纂,从最早的官修书目《别录》《七略》,到《汉书·艺文志》《隋书·经籍志》等史志目录等,从中都体现了易学文献整理、编纂的重要成果。及至清代,乾隆年间开四库馆,编纂《四库全书》,易学典籍作为群经之首,位列开篇,而且数量也是所有分类中最多的。阮元主持编纂《清经解》,进一步总结了清代易学的研究成果。王先谦编纂《清经解续编》,续收清代学者经学著作209种,涉及胡渭、惠栋、张惠言、俞樾等十数家易说,完整地展现出清代易学研究的全貌。20世纪20至40年代推出的《续修四库全书总目提要》是现存规模最大的文献解题目录,亦涉及大量易学典籍。

        近年来,随着文化事业的发展,新的易学古籍整理和编纂工程不断涌现。北京师范大学中国易学文化研究院分别于2013年、2018年推出的《中国易学文献集成》68册和《中国易学文献集成续编》70册,共计138册,不仅网罗了各时期代表性的易学著作,而且首选善本为底本,为易学古籍的整理、编纂起到了重要的示范作用。与此同时,北京师范大学中国易学文化研究院又与国学网、首都师范大学电子文献研究所联合承担《中华易学全书》项目,以文渊阁《四库全书》经部易类典籍为基础,整理易学典籍183种、1839卷,共3500余万字,并制作2000余幅矢量易图,被已故著名学者余敦康先生誉为“《易藏》”。同一时期,在学术研究机构和专门技术公司的共同推动下,我国陆续出现的各类古籍数据库,均不同程度地收录有易学古籍,传统易学古籍与现代信息技术相结合的趋势开始出现并获得初步发展。

        虽然近年来易学古籍的整理、编纂工作不断取得新成就,但还存在许多有待改进之处。一方面,以往的易学古籍整理大多属于传统类型的典籍汇编,缺乏与现代信息技术的紧密结合。另一方面,现有各类古籍数据库所收录的易学古籍,由于受到分类法的限制尚未实现优化整合。比如雕龙古籍数据库有《四部丛刊》《四部备要》《雕龙四库全书》等子库,却没有单独的“易学”分类。同时,各数据库收录的古籍版本相对比较单一,对各种版本尤其是海外珍本鲜少涉及,包括日本足利学校所藏南宋初年刊本《周易注疏》等。整体而言,现有古籍数据库尚存在资料不够完备、零散不成系统、内容未能精细化、文本未能精准化等问题。因此在新时代,易学古籍数据库建设是一项亟须开展的学术课题和文化工程。

    确立数据库主体框架,推动易学数字化

        易学古籍数据库是顺应信息化技术发展需要、服务于易学研究及中华优秀传统文化研究的重要平台,主要目标是开发通用的统一查询、辅助分析易学文献的综合管理和应用系统,以便快捷地进行数据和文献资料的查询、下载等工作。在我们看来,易学古籍数据库的建设应当以“古籍系统化+数字化”的学术理念为推手,从传统文献学和数字文献学相互融合、相得益彰的角度展开,需要收集、整理易学古籍文献,运用先进技术将其转化为数字化资源,逐步建设数据库,最后还要校对数据库文本的精确性,完成数据库的检查和验收工作。具体来说,其主体框架可以概括为一条主线、两大环节和三个要点。

        一条主线是以“易学古籍数据库”为中心,系统收集整理易学古籍,并采用先进的数据信息技术,将之转化为数字化资源,建立科学、全面、准确的易学古籍数据库。

        两个环节是指建设易学古籍“录入文本”和“影像文本”,录入文本是由人工输入计算机的易学古籍全文,影像文本则是采用现代技术工具真实呈现的易学古籍原貌。

        三个要点是指数据库技术系统的三大方面,即数据存储系统、数据分析系统和平台管理系统。

        数据存储系统作为数据库的上层系统、数据分析共享的支撑系统,是整个数据库的核心组成部分。能够满足对结构化数据、非结构化数据和半结构化数据统一存储和查询的需求,便于实现查询的高效性和存储的安全性。

        数据分析系统利用分布式存储和并行计算框架,结合多种分布式计算引擎,对各类结构化、半结构化及非结构化的信息资源进行快速的分布式计算,并提供基于关联、聚类、分类、预测等类算法库以及可视化组件、拖拽式的数据挖掘分析开发工具包,既可提供易学古籍查阅与研究的深度挖掘和分析服务,也可提供数据资源管理、目录管理、组织人员管理、用户权限、数据接入和共享服务运行监控及平台运维等功能。

        平台管理系统是围绕文本、PDF、图片、音视频等多种格式资源的持久化存储数据库,设计相关分类及元数据结构,以便为系统地查询检索、在线使用以及持续扩展等业务提供基础支持。这些都是非常重要的。

    整合易学书目版本,系统构建子数据库

        关于易学古籍数据库建设的具体内容和步骤、方法,不同学者或许会有不同看法,见仁见智。我们认为,这一数据库至少应该包括易学古籍书目数据库、易学古籍全文数据库、易学古籍版本数据库,作为三个二级子目录即子数据库,统一于易学古籍数据库这一母数据库中。

        易学古籍书目数据库是收录历史上出现的所有易学著作和篇章的数据库。具体的建设步骤应该分为两个方面:一是对易学古籍的编目,需要对历代相关史志目录和官修、私修目录以及近数十年来整理出版的出土易学文献和国内外馆藏易学古籍资料,进行全面收集、系统编目,注明版本、馆藏,编纂出高水平、高质量的易学古籍书目,并撰成《历代易学古籍书目》;二是充分借鉴吸收中外建设数据库的成功案例和优秀经验,运用先进的数据库技术将其转化为数字、文字、图形、图像、声音等数据形式,并存储于计算机内,成为由计算机操控、能够有效共享的数字化资源,推进易学研究的现代化。

        易学古籍全文数据库是著录易学古籍全文内容的数据库。建设的重点是需要以现存易学古籍的文本为对象,参考著名学者的校释、研究成果,对已有标点的古籍文本进行重检,对无标点的古籍文本则运用先进的数据信息处理技术自动标点,再辅之以人工重检,纠正误差,最后产生古籍点校本,统一由人工输入计算机形成数据库,以供使用者进行检索、阅览。考虑到全文数据库应用的广泛性,该数据库还应当具备丰富的检索方式,包括标题检索、全文检索、分类检索、专书检索、高级检索等。全文检索数据库需要在书目检索数据库的元数据基础上添加古籍内容及其与古籍的对应关系,能够让使用者对检索结果进行准确定位或对比,直接了解古籍内容。

        易学古籍版本数据库是囊括现存易学古籍各种不同版本的数据库。版本学是以各类古籍的抄本、批校本、稿本和印本等为研究对象的学科,易学著作的不同版本有着不同的历史和价值,对修缮古籍、考辨真伪具有重要作用。建设易学古籍版本数据库需要尽可能全面地收集整理现存易学古籍的所有版本,包括国内外高校、图书馆、博物馆等单位以及科研机构收藏的传世易学古籍,以及载录于甲骨、金石、简帛等不同载体的易学出土文献,并转化为数字化资源,为使用者提供包括封面、序跋、插图、版本、版式、藏书印、批校题跋等古籍版本信息,真实呈现易学古籍原貌,满足读者和研究者不同的阅读体验和学术需求。

    打破时空限制,深化易学研究与保护

        新时代的易学古籍数据库,将建成最具综合性、系统性的易学古籍总汇,建成最具专业性、权威性的一流数据库,其学术价值和现实意义尤为突出。

        数据库对易学古籍的系统梳理和完整呈现,尤其是数据库所具有的共享性,为学者提供了便捷的检索和阅览服务,打破了获取资源的时空限制,即便在不同地区和不同单位,都能够便捷地获取分布于全球的易学古籍资源,有效地提高工作效率,最大限度地推动易学研究的深化和拓展。同时,易学古籍数据库的建设既需要易学古籍整理领域与数据库建设领域的通力合作,也需要积极整合学术界多学科、多方面的资源和力量。随着中华文化的广泛传播,易学古籍数据库的建设有助于在当代易学研究中树立和把握全球意识、国际视野,从而在与国外学术界互学、互鉴、互动的过程中促进易学研究的进一步发展和传播,推动中华文化更好地走出去。

        随着信息技术的不断革新、发展,建设中文古籍类数据库的技术已经在自动比对、自动标点、自动排版等方面取得突破性进展,但如何实现“影像文本”向“录入文本”的精准、高效转化,实现列表视图和提要视图的随时切换,实现从研读批注到下载打印的一站式完成,凡此种种,依然是有待攻克的重大难题。而且考虑到易学古籍文献会由于文物出土等因素而不断丰富,已完成的古籍数字化体系在吸纳现有数字对象的基础上,还需要不断补充新的研究资讯和成果,即该体系应是动态的、可灵活扩展的。如何在技术层面有效地实现这一点,也是我们应该思考的重要问题。易学古籍数据库建设为这些新技术的探索和研发提供了契机和平台,有助于实现数据库建设技术的新突破,确立数据库的典型范例。

        古籍是人类智慧的结晶,却屡因战乱、火烧水浸、虫蛀鼠咬等破坏而残缺、亡佚。古人采取的对策是抄写备份、分开保存,其中《四库全书》被分藏于全国七座藏书阁就是一例。相比之下,古籍数字化在保护古籍方面无疑具有得天独厚的优越性。利用现代信息技术对古籍文献进行加工处理,使古籍转化为电子数据形式,通过网络、光盘等介质传播,使其彻底免于各种灾厄而永续保存,可谓功在当代,利在千秋。在这一方面,易学古籍数据库建设将会是一个成功案例。

        总之,在新时代,在易学研究更加综合、更具全球视野、更注重现代转化和创新发展的当下,易学古籍数据库不仅是对以往易学文化成果所作的一次系统、全面的总结和梳理,而且也会在研究思路、学科布局、研究方法、基本框架、主要内容等方面有所创获。我们相信,以此为契机和平台,今后易学研究的开展将获得更加坚实的文献资料基础,并获得人工智能、互联网、大数据等现代信息技术手段的支持和支撑,而这将有助于相关的学科建设和学术发展,有助于中华优秀传统文化的进一步传承、弘扬和发展。

        (作者:张涛,系北京师范大学中国易学文化研究院院长;尹小林,系首都师范大学电子文献研究所所长)

    光明日报
    中华读书报
    文摘报
    出版社
    考试
    博览群书
    书摘

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有