本报讯(记者陈菁霞)记者日前从“商务印书馆《东方杂志》全文检索数据库”专家评审会上获悉,数据加工质量优异、检索功能强大的民国期刊数据库———《东方杂志》全文检索数据库即将面世。
《东方杂志》是商务的标志性刊物,紧跟时代脉搏,忠实地记录了我国近现代发展的历史轨迹,被称为“中国近现代史的资料库”,是研究民国史不可或缺的第一手资料。随着民国热的逐渐升温和互联网技术的发展,包括《东方杂志》在内的民国文献资源的电子出版物日渐增多,但市面上一些以民国文献资源为主的电子出版物,存在着不同程度的缺陷,包括内容缺失、系统功能单一、页面设计简陋、文字错误率高等问题,不能满足用户日益增长的查检研究需求,有可能误导学者的研究工作。为此,商务决定在已有的《东方杂志》期刊图像数据库的基础上,研发《东方杂志》期刊全文检索数据库。
据商务数字出版中心主任孙述学介绍,此次,《东方杂志》期刊全文检索数据库的建设,前后历时两年多,期间克服诸多困难,最终达到预期设计目标。该数据库系统的建设主要分为前期的数据加工阶段和后期的系统平台开发阶段。其中,数据加工工作面临着因民国期刊的自身特点所形成的诸多难点,如原文件缺失、图片中的文字质量差、版式凌乱、著录信息不全等,商务采用边摸索边实践的方式,逐渐总结整理出针对民国文献资源进行数字加工的解决方案,最终完成了约30000多篇文章、12000多幅图画、14000多则广告的文字识别和标引工作,并将《东方杂志》期刊的数据加工质量差错率控制在万分之一以下,为后期的系统平台开发奠定了坚实的基础。
据悉,9月份“商务印书馆《东方杂志》全文检索数据库”将正式投入市场。此后,商务还将基于当前的系统平台,陆续推出《小说月报》等民国期刊的全文检索数据库版本。