如何应对人类数据库“污染”新挑战

《文摘报》（ 2024年03月16日 01 版）

某网络平台“国足捧起大力神杯”的AI图

随着越来越多AIGC（生成式人工智能）工具陆续诞生及应用，全社会对人工智能给予了空前的关注和期待。

然而，狂欢过后，问题随之而来。由AIGC生成的图片、新闻、问答等开始蔓延到网络世界的各个角落，随着技术不断升级，将它们与真实世界区分开的难度亦越来越大。

AIGC引发的人类数据库“污染”问题，已摆上台面。如何面对这一全新挑战，人类无法回避。

以假乱真

一张国足捧起大力神杯的图片，在网上广为流传。如果不是因为图片内容与公众的认知存在过大反差，仅就图片而言，人物表情、动作、背景，完全能达到以假乱真的地步。

如此“逼真”的图片，据网络发布者称，是由AI（人工智能）生成。看似无厘头搞笑，但带来的风险却是实实在在的——它传递的错误信息很可能会被大众认定是真实的，导致谣言大范围传播。

这并非杞人忧天。

黄灿灿晶莹剔透的葡萄、嫩粉色娇艳欲滴的海棠花、被阳光穿透斑驳的云彩……这些网络上的图片，尽管视觉效果惊艳，但都被证明由AIGC合成。不少网民担心，诸如此类照片大量充斥在网上，不但混淆着人们的认知，长此以往技术迭代进步后，AIGC生成图片恐怕将变得愈发真假难辨，从而将人类的数据库“污染”。

担心并非多余。现实生活中，在美国科罗拉多州举办的一场艺术博览会上，一幅名为《太空歌剧院》的画作获得数字艺术类别冠军。但是，该作品先由AI制图工具生成，再经Photoshop软件润色而来。事件在网络上引发讨论，不少艺术家指控AI作品参赛是作弊。

图片可以“作假”，以客观为本的新闻更是可以“生成”。

跟踪错误信息的调查机构“新闻守卫”（NewsGuard）研究发现，由AIGC生成的虚假新闻和信息已开始爆发性增加，正成为当前互联网时代的一项全新挑战。

“新闻守卫”报告称，生成虚假文章的网站数量自2023年5月以来激增了1000%以上，从49个增至600多个，涉及15种语言。这些网站每天生产大量文章，内容涉及政治、社会等多个领域。背后的动机各异，包括动摇信仰制造破坏，或者依靠两极分化的内容吸引点击量，获取广告收入。

新的信息战

AIGC技术的进步让几乎任何人都能轻松创建看似合法的新闻网站，生产的内容往往与真实新闻难以区分。

AIGC新闻造假看似遥远，其实已经发生在我们身边。2023年12月28日，重庆市奉节县警方发现，网民王某成在某资讯平台利用AI写作软件，编造发布了一条“某地一煤矿发生事故已致12人遇难”的帖文，引发网民关注，造成不良社会影响。经警方调查，王某成这么做的目的是为了博人眼球、吸引流量。他本人也受到了应有的处罚。

与AIGC生成虚假新闻类似的是，在一些短视频平台，利用AIGC制作视频传播虚假信息的情况也越来越普遍。

记者在某短视频平台上发现，这类视频往往以AIGC创作出来的智慧老者、小和尚等“数字人”形象出现，他们“讲话”的声音、字幕也是由AIGC生成。对操作熟练的人来说，一个小时制作多段这类视频不在话下。而视频传播的所谓养生知识、人生哲理、生活理念，要么观点偏激、要么夹带广告“私货”，对老年人和儿童具有很强的欺骗性。

美国加利福尼亚大学伯克利分校数字取证学教授汉尼·法里德认为，AI技术的进步让诈骗者能轻易地根据简短的音频样本来复制声音。

“两年前，你可能需要大量音频来克隆一个人的声音。但现在，只要你在社交平台上发一段超过30秒的音频，复制声音就可以迅速实现。”汉尼·法里德说。

现阶段，多数人对AIGC生成的内容持平和与宽容的态度，是因为很多内容“一眼假”。但当技术跃升到难以分辨时，再敲响警钟恐怕为时已晚。

中国信通院云计算与大数据研究所人工智能部主任曹峰认为，生成式人工智能借助预训练学习、微调学习、提示学习和强化学习等技术手段，再不断通过人类反馈，实现了更强的自我学习能力。这正是其强大和可取之处。

AIGC经过反复专业训练和数据积累，生成答复内容的准确性、个性化将逐步提升，届时再分辨将难上加难。因此，由AIGC引发的人类数据库“污染”问题是渐进式的，隐蔽性强，危害性不易被察觉。

技术越是进步，其生成内容的真假就愈发难分辨，对传统世界形成“吞噬”。仅从技术角度而言，这将是一个难以阻挡的趋势。

很难想象，未来人们检索的图片、数据、问答，比如动物的外貌、植物的外形、书画的内容等，有相当一部分是经过AIGC修饰的。将这些“生成”的内容与真实世界对比的时候，人们又会以怎样的心态来看待这个世界，做出怎样的判断。

设立“禁区”

科技的发展最终要服务于人类的幸福美好生活。当大量虚幻甚至错误的信息使人类的知识空间变得不再纯粹时，及时纠偏就很有必要。特别是在当下AIGC发展初期，放眼长远果断采取措施迫在眉睫。

现在，越来越多平台开始要求AIGC生成的内容必须明确标注，以帮助人们作出正确理解。为AIGC设置“禁区”已很有必要，新闻领域就是其中之一。

北京航空航天大学法学院副教授赵精武表示，国家互联网信息办公室、工业和信息化部、公安部在2022年底制定了《互联网信息服务深度合成管理规定》，明确了深度合成服务提供者的法定义务，例如应当采取技术或人工方式对深度合成服务使用者的输入数据和合成结果进行审核。

“除了政府监管，科技公司、媒体、教育机构以及大众都应在其中扮演重要角色。”赵精武认为，这不仅是一个技术问题，更是涉及社会治理、公众教育和国际合作的广泛问题。

以技术之力治理技术之乱，已提上日程。

“随着技术的进步，社会的适应和应对机制需要更新。比如新闻机构和社交媒体平台需要开发更高效的工具和方法，来识别和过滤AIGC生成的虚假内容。”新火科技控股有限公司区块链专家王阳平认为，区块链技术有助于破解AIGC诱发的数据及知识造假难题。

他表示，新闻摄影、物种照片、公共知识等均可被记录在区块链上，且全程可溯源、内容透明不可篡改、永久记录，可有效辅助人们提高认知和辨别能力，减少网络虚假知识及谣言的产生。

（《瞭望东方周刊》2024年第3期毛振华）

返回目录放大

缩小

全文复制下一篇