算力、算法和数据是人工智能的三大要素。如果说科技公司在算力、算法方面具有优势,那么,文化机构在数据方面所拥有的优势是天然的、不可替代的。人工智能是文化和科技深度融合的产物。要加快把中华民族积淀了数千年的文化资源转化为具有文化内涵的数据,构建文化基础大模型。各个文化机构可以在基础模型的基础上开发自己的行业场景模型,共同推动实现中华文化的全景呈现和中华文化数字化成果的全民共享。
实施国家文化数字化战略的首要任务,就是统筹利用文化领域已建或在建数字化工程和数据库所形成的成果,全面梳理中华文化资源,按照物理分布、逻辑关联原则,汇集文物、古籍、美术、地方戏曲剧种、民族民间文艺、农耕文明遗址等数据资源,贯通已建或在建文化专题数据库,推动文化资源科学分类和规范标识。按照统一标准关联零散的文化资源数据,关联思想理论、文化旅游、文物、新闻出版、电影、广播电视、网络文化文艺等不同领域和文字、音频、视频等不同形态的文化资源数据,关联文化数据源和文化实体,形成中华文化数据库。
文化资源数据是真正意义上的生产要素,其来源于中华民族积淀了数千年的文化资源,具有深刻的文化内涵。从中提取具有历史传承价值的中华文化元素、符号和标识,聚焦中华优秀传统文化、革命文化、社会主义先进文化,可以丰富中华民族文化基因的当代表达,其战略意义十分重要。
将蕴含中华民族文化基因的数据,转化为人工智能大模型的训练语料,就可以涵养具有深厚历史文化底蕴的基础大模型、行业大模型。在此基础上,各个文化机构运用专业数据建设自己的场景模型,开发生成式人工智能产品,推动人工智能这一重要领域的产业发展、技术进步与安全保障,做到趋利避害、安全使用,在人工智能时代掌握主导权、主动权。
(《前线》2024年第11期 高书生)