首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    文摘报 2025年08月23日 星期六

    大模型如何“焕新”老照片

    《 文摘报 》( 2025年08月23日   06 版)

        人的大脑擅长识别画面里的人脸、物体等大轮廓,却不擅长还原毛发的纤细纹理、皮肤的细腻质感这些细节,而图像复原技术恰好能填补这个空白。在图像复原领域,人工智能可以比人完成得更为出色。无论是模糊不清的低分辨率图像还是布满瑕疵的老照片,人工智能都可以通过“神奇魔法”让其变成高清图像。

        图像复原技术的发展就像一场不断升级的接力赛:2014年的深度卷积网络技术,让图像有了清晰的轮廓;2017年的对抗生成网络技术,让画面观感更自然;2023年的扩散生成模型技术,为图像增添了逼真的细节。到了2025年,对抗生成网络和扩散生成模型这两项技术的融合,诞生了全新的智能复原大模型HYPIR,图像复原领域有了新成果。

        这个智能复原大模型主要有3个亮点。第一,它集对抗生成网络和扩散生成模型的优点于一身,处理速度比第三代技术快了十几倍,修复效果更出色,稳定性也更强。第二,它搭上了文生图大模型的“快车”,能生成8K级别的超高清细节,还能根据用户输入的提示词进行个性化智能修复。第三,它适应性强,能轻松应对多种场景和不同损坏类型的图像。

        那么,大模型是如何施展“修复魔法”的呢?

        第一步,先给图像“大扫除”,去除图像拍摄时的抖动、模糊,图像压缩留下的痕迹等“小毛病”,这样才能保留图像的真实信息,避免其他干扰。科研人员设计了一个专门的深度学习编码器,让它“吃进”有瑕疵的图像,“吐出”没有缺憾的图像;还通过人为制造各种图像瑕疵的方式,构建了几亿组“瑕疵-完好”的图像对来训练这个编码器。经过多轮训练,编码器就能熟练掌握去除图像瑕疵的技能。

        这时的图像已经干净了,但看起来会比较平滑,缺乏自然的细节。所以第二步就是给图像“添细节”。这里就要用到文生图大模型了,它能根据文字描述生成自然图像。这一步需要输入两个信息:一个是已经去除瑕疵的图像,另一个是对图像的内容描述。此时,多模态大模型就派上用场了,它能“看懂”图像内容,并输出相应的文字描述,作为文生图大模型的“创作指南”。有了这两个大模型的配合,就能精准理解图像并生成丰富细节。

        最后一步,是训练这个模型,让它成为图像复原的“高手”。这需要用到一种名为“对抗生成训练”的方法:让文生图大模型扮演“生成器”,负责生成修复后的图像;再选一个图像分类网络当“判别器”,专门判断生成的图像是不是自然真实的。生成和判别这两个步骤交替进行,双方不断提升自己的能力——生成器让图像越来越逼真,判别器的判断越来越精准,直到两者达到平衡。

        如今,图像复原技术已逐渐融入手机摄影、电视播放、高清屏幕显示、历史影像修复、科学研究中的图像处理等领域,成为一项与生活密切相关的实用技术。期待随着科技迭代革新的不断推进,这项技术能更好地造福社会,让更多时光里的画面重焕光彩。

        (《人民日报》8.16 董超)

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有