首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    文摘报 2022年06月15日 星期三

    机器翻译仍取代不了人类

    《 文摘报 》( 2022年06月15日   06 版)

        为什么机器翻译仍然无法完全独立工作,以至于完全取代人类?这个问题有两个层次:一、人工智能自身的工作机制;二、翻译的本质。

        机器翻译是人工智能推动的,人工智能的工作机制则以“机器学习”为核心。机器语言有效利用数据,凭借强大的算力进行机器学习,有效转译并解答自然语言,已经成功在一个个领域攻城略地。比如围棋。围棋向来被认为是人工智能难以攻克的所在,但这个态势在阿尔法狗出现以后也有了很大改观。

        但在机器翻译这个领域,人工智能需要处理的数据量显然远远超过了一盘围棋的无数种可能。自然语言的庞大语料库首先就是对机器算力的挑战,它需要在浩如烟海的文献里爬梳整理;其次,自然语言与机器语言之间的转换,很难有围棋那样明确的规则。

        与其说人工智能在处理自然语言,倒不如说它要面对的是两种或者多种语言构成的全部公共知识,甚至还有一些不那么公共的知识。这是个浩大的工程,哪怕人工智能结合了多种机器学习的机制,如何向其投喂语料库数据也是个道阻且长的任务。

        不但如此,语言的演变速度非常非常快,热词往往在几年之间就已经不再流行,或者是意义全失,这一过程是机器无法或者难以理解的。不同语种的自然语言还衍生出了完全不同的公共知识,哪怕是同一句话,在语境不同或者说话人主体不同的情况下,意思可能就完全不同——这还是没有考虑到断句、语气等连自然语言也会产生歧义的情况。

        如果某个学科、某个词语需要实现两种语言/公共知识之间的第一次对译,甚至是在同一门语言里的提喻(metonymy),那么这项任务仍然需要仰赖人工翻译。这并不代表机器的算力有限,也不意味着机器的数据处理能力不强,而是机器还不能像人类大脑的神经网络一样理解自然语言的生发机制,自然语言也无法在自然科学以外的学科领域与机器语言一一对应。甚至,自然语言本身仍然拥有很大难以为机器语言理解的空间。

        (《南方周末》6.2 克之)

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有