【一线讲述】
讲述人:中华书局古联(北京)数字传媒科技有限公司总经理 洪涛
古籍大数据对中国传统文化领域有着独特的价值和作用。近年来,我们建立了百亿级的古籍大数据中心,可以满足不同类型的用户和研究需求。
数据作为生产要素,其质量的优劣直接影响着生产结果。因此,我们建立了严格的数据加工流程和审核机制,确保将高质量数据产品投入市场。同时,还将古籍图书的线性文本内容进行结构化处理,使隐藏在古籍文本中的知识更加突显,甚至打通不同学科之间的知识壁垒,建立知识关联,持续发掘、提升数据价值。
在古籍大数据的开放共享方面,我们积极携手各大研究机构、图书馆和高校,共同推动古籍数字资源的广泛共享与高效利用。我们研制了图像采集、文字整理、知识组织等20多项古籍数字化规范标准,确保数据在不同平台间无缝流通和共享。同时,我们采取先进技术手段,严密保护数据安全与隐私,严防数据泄露与滥用。
在交易流通方面,我们积极探索市场化运作机制,推动古籍数字资源的商业化利用。我们与20多家出版机构和科研团队合作,制定了公平交易规则和价格体系,通过国家级古籍整理与数字化综合服务平台——籍合网这个统一的线上发布平台,实现了古籍数字资源的流通和传播。在交易过程中,我们注重保护知识产权和原作者的权益,建立完善的版权保护机制,确保每一份数字资源交易合法合规。同时,我们也积极推广数字版权保护技术,提高用户的版权意识,共同维护良好的数据市场秩序。
近期,我们正尝试利用古籍大数据进行大模型研发,在自动摘要、文白翻译、自动构建古籍知识图谱等具体应用方面进行探索,不断挖掘和强化数据作为生产要素这一属性的重要价值,推动古籍大数据资源发挥更加显著的作用。
(项目团队:本报记者 方曲韵、杜倩、苏雁、陈雪 本报通讯员 李梦、金永成)