首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    中华读书报 2023年05月10日 星期三

    当下国人有着怎样的知识需求?

    ——从聚典的9亿次知识查检服务看

    《 中华读书报 》( 2023年05月10日   06 版)

        聚典知识搜索榜

        ■本报记者 王洪波

        4月21日,基于“聚典数据开放平台”用户知识查检行为大数据统计分析的“聚典知识搜索榜”首次发布。

        聚典数据开放平台(下称“聚典”)是由上海世纪出版集团规划设计、上海辞书出版社建设运营的一款互联网知识服务产品。聚典以《汉语大词典》《现代汉语大词典》为汉语字词基础,以《辞海》《大辞海》为百科基础,并逐步拓展到《哲学大辞典》《心理学大辞典》《教育大辞典》等专科辞典和《英汉大词典》《汉英大词典》等双语词典领域,形成了学科覆盖较为全面、入库近200种工具书、总计400多万词条的工具书数据仓库。这样大的数据量,使聚典能够满足用户绝大多数的知识查检需求。

        但聚典并不是一个App,而是一个数据开放平台。聚典通过SDK包的方式将数据授权给数字阅读、在线教育、新闻资讯等应用开发商,人们在使用这些内嵌了聚典SDK包的App时,遇到需要查询的字词,只需在当前界面选中并发出查询请求,该App即实时调用聚典数据响应用户的查询需求,非常方便、快捷。目前该平台已在微信读书、掌阅、得到、QQ阅读等众多应用上线。

        自2020年8月上线以来,聚典已为4000多万互联网用户提供了9亿次知识查检服务。

        “聚典知识搜索榜”即是对用户知识查检行为大数据进行统计分析而推出的。榜单分汉语单字、词语、中国人物、外国人物、中国作品、外国作品等六类,每类选取查检频次最高的前30名,一定程度上反映了当下国人有着怎样的知识需求。

        其一,高频查检字集中在二级字。

        统计分析“聚典”后台查询数据可以发现,汉语字词是一般读者知识查询的主要方面,占比达70%左右。针对汉字的查询,覆盖一、二、三级字,但前100位高频查检字都集中在二级字。排名前30位的汉字查询量基本都在20万次以上,全部属于二级字。国务院发布的《通用规范汉字表》一级字表为常用字集,收字3500个,主要满足基础教育和文化普及的基本用字需求。二级字表收字3000个,使用度仅次于一级字。三级字表收字1605个。聚典团队认为,统计结果表明,一般读者对一级字表3500个常用汉字的掌握情况整体较好,故相应的查检需求并不显著,而次常用的二级汉字查检需求则非常突出。这应该与基础教育的普及和全民文化水平的提升有密切关系,同时也说明,二级字表所收的次常用字,在当今日常语文生活的触达率也较高。

        其二,高频查检词语多为文言词。

        统计显示,查检频次最高的30个词语,查询量基本都在10万次以上,全部是双音节词。这30个词语中,除晚近来自方言的“拥趸”外,其余都是历史悠久、一直沿用的文言词。比如:“不啻”一词最早出现于《尚书》,在清华大学藏战国竹简《摄命》篇中也可见该词;“葳蕤”一词出自《楚辞》;“觊觎”一词在《左传》已见;《孟子》里就有“桎梏”一词……这些使用了两千多年的词语,给人典雅古奥的感觉,在比较正式的场合和书面表达中还经常被使用。由此可见汉语文化绵绵不绝,中华文脉渊源有自。

        其三,搜索的中国人物集中于思想文化和文学艺术领域。

        搜索排行前30的中国人物,多数为不同历史时期的古人,孔子、李白、苏轼分居前三位。从年代来看,春秋战国有5人,两汉三国晋有5人,唐宋最多,占17人。从领域来看,这些人物多为思想文化领域的巨擘,或者文学艺术领域的名人,他们共同参与构筑起中华民族的文明大厦、文化长廊和精神家园,今天仍是我们汲取精神文化滋养的重要来源。

        其四,外国人物覆盖领域更为广泛。

        相对中国人物,排行前30的外国人物的构成更为广泛。从年代来看,包括两千多年前的苏格拉底、柏拉图,一直到现当代的弗洛伊德、爱因斯坦。从领域来看,覆盖哲学思想、文学艺术、科学技术、政治军事等领域,他们来自于不同的国度,共同谱写了人类文明灿烂辉煌的历史。聚典团队认为,这说明读者在日常阅读和知识检索方面,对于自己的先贤,更聚焦于精神方面的体认和传承,而对于外国的人物,更着重于对不同领域成就卓著人物的了解和把握。

        其五,中国作品榜单是传统文化热的反映。

        排行前30的中国作品,仅有《三体》《活着》属于现当代,分别排在第10、第18位。其他皆为古代作品:“十三经”有《诗经》《尚书》《易经》《礼记》《春秋》《论语》《孟子》入选,史部有《史记》《资治通鉴》《明实录》《明史》等,子部有《道德经》《孙子兵法》等,集部有《离骚》《牡丹亭》等,四大名著《红楼梦》《三国演义》《西游记》《水浒传》全部在列,大众比较关注的中医著作有《黄帝内经》《伤寒论》《本草纲目》等。结合中国人物的搜索排行榜,可见目下国人对传统文化的热情,这也为已绵延多年的传统文化热做一生动注脚。

        其六,外国作品集中于近代和现当代。

        排行前30的外国作品,古代仅有《理想国》《荷马史诗》等少数几部在列,文艺复兴以来的近代以及现当代作品占比更大。从内容来看,思想文化和文学艺术各占半壁江山。思想文化著作如《理想国》《国富论》《资本论》《共产党宣言》《查拉图斯特拉如是说》《寂静的春天》等作为影响人类文明进程的经典,历来是国内外各类阅读榜上的常客,对大众读者来说,对它们有所了解也是一种普遍的需求。文学艺术方面,《荷马史诗》《神曲》《失乐园》《唐吉诃德》《战争与和平》《追忆似水年华》《麦田里的守望者》《百年孤独》等经典中的经典拥有广大拥趸,即使大部分人可能无法通读全书,却也始终代表着阅读选择的标杆。

        总的来说,“聚典知识搜索榜”显示了国人在汉语字词方面的学习需求,也反映了大众阅读的一些特点和趋向。虽然“聚典”用户未必能作为全体国民的一个科学取样,但这份榜单还是为我们了解当代国人的知识需求打开了一扇窗。聚典运营方上海辞书出版社社长秦志华告诉媒体,该平台今后将不断根据用户知识查询大数据的统计分析,定期发布知识查检、数字阅读方面的各类榜单,总结阅读规律,分析知识需求,以更好地服务全民阅读、建设书香社会。

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有