由首都师范大学电子文献研究所、中国诗歌研究中心共同主办的“第六届中国古籍数字化国际学术研讨会”近日在北京召开。本次会议以“人工智能时代的古籍数字化”为主题。来自海内外50余名专家学者,重点探讨了人工智能对中文古籍数字化的影响、移动终端古籍数据库的研究与设计、中文古籍版本识别、中文古籍非常规字形识别(诸如手抄、印章、书法等)、中文古籍图形数据库建设、基于自动比对和自动排版的古籍大规模整理出版等前沿性课题,希望为中国古籍数字化探索出一条可持续发展的创新之路。
左东岭教授认为,电子文献是划时代的产物,对古籍数字化的未来寄予宏愿,希望古籍数字化能在精度、广度、深度上更上层楼,争取做到更大、更快、更好,并提倡加强古籍数字化行业的内部合作,实现资料共享,尊重相互权利和生产方式。胡晓明教授认为,古籍数字化给学术研究所带来的便利是毋庸置疑的,比如年谱的整理就受益极大。百年以来,由于“五四”新文化运动的引领,中国学术界受西方思想影响颇深,大量的学术观念来自西方,学术史写作也充满西方话语,如何通过古籍数字化手段突破这种陈陈相因的积习,构建我们自己的数字人文,需要大家认真思考。人工智能作为古籍数字化的未来趋势,必将给人文学科带来极大冲击,在运用它推动进步的同时,也要警惕它可能产生的负面影响。葛怀东教授认为,古籍数字化是一项系统化工程,不仅涉及传统古籍整理的知识和技能,诸如版本、目录、校勘等,而且还涵盖当前最成熟的信息技术,包括古籍专用OCR自动识别技术、汉字字符集编码、古籍数字化图像处理、元数据标准、数据挖掘、GIS等。古籍数字化课程群应包括中国古典文献学、目录学、文献数据库设计、数字文本处理、古籍数字化、文献复制技术、图文设计与制作、古籍信息系统开发、编辑出版实务与技能、文化市场营销等。
与会专家学者们还展示了各自的研究成果。周文业教授讲解了中国传统文化数字化研究中心研发的“中国文学地理学信息平台”和“古代小说版本数字化研究平台”。“中国文学地理学信息平台”是利用GIS和数据库所构建的应用平台,平台根据用户的研究需要,创建一个以时间、地点、人物三维的立体时空数据库。用户将相关数据按照时间、地点和人物等,逐一输入数据库,系统即可自动进行检索、统计,并自动生成各种专题历史地图。“古代小说版本数字化研究平台”利用计算机可完成小说各种版本的自动比对,包括文字比对和插图比对两种。中南民族大学代表讲解了王兆鹏团队研发的“唐宋文学编年地图”。通过这张集人物、作品、时间、地点、事件五要素于一体的多维地图,可以一眼看尽某作家一生的“行踪”,某时段所有“在场”作家的活动,某地方所有“相关”作家的活动,从而跳脱出限知视角,转换成全知视角。
首师大电子文献研究所尹小林所长展望未来,认为古籍数字化将有可能取得四大突破:一是突破语言限制,实现文言文和白话文之间的自动翻译;二是突破时空限制,实现历史场景的虚拟重现,以及历史人物和事件在虚拟时空中的自动联系;三是突破专业限制,实现古籍的自动点校;四是突破思维限制,实现对重大学术课题自动进行数据挖掘和逻辑分析。在人工智能时代,古籍数字化必将大有可为,跨入一个全新的境界。
(张林)