9月17日深夜,今年1月引发全球轰动的开源AI大模型DeepSeek-R1,在经过8个多月严格的同行评审之后,登上国际顶尖学术期刊《自然》杂志封面,成为全球首个经过同行评审的大语言模型。
此前,主流大模型通常采用一套不同于学术界的成果发布方式:开直播,在预印本网站和官方技术博客上发布突破性成果,同时在测评榜上拿下高分,以证明各自的技术优势。年初,DeepSeek-R1的业界影响力也是由此而来。
近年来,人工智能,特别是大语言模型,正以惊人的速度和一种近乎“黑箱”的方式发展。此次DeepSeek团队在《自然》杂志上发表论文,无疑打破了行业惯例。对此,多位专家表示,此举意味着“野蛮生长”的大模型正在向更为透明、可复现的方向发展,同时也意味着人工智能正努力融入更广泛的科学社区,为AI与其他领域的融合打通更多壁垒。
这篇由DeepSeek创始人梁文锋担任通讯作者的论文披露了R1模型更多训练细节,包括29.4万美元的超低训练成本,并正面回应了模型发布之初的“知识蒸馏”质疑。
在浙江大学本科生院院长、人工智能研究所所长吴飞看来,尽管8个月的同行评审使论文更趋完善,但其最具创新性的方法并没有实质改变。吴飞注意到,这8个月间,在某些任务表现上,有些大模型已超越DeepSeek-R1,但《自然》并未选择发表那些成果,反而坚持发表这篇已在预印本平台上发表过的论文,“这是前所未见的”。
过去,AlphaGo、AlphaFold等论文登上《自然》都是首发,而这篇首秀在arXiv上的论文不仅登上顶刊《自然》封面,编辑部还为此配发社论,这让吴飞感觉到AI正在改变论文发表生态——未来全球影响力最高的20篇论文,可能最早发表于草根平台。
在众多业内人士看来,这次R1模型登上《自然》,除了肯定其学术价值,还标志着AI基础模型正从一个靠技术博客和“打榜”为主要评价标准的领域,迈向以方法论的科学性、可复现性和严谨验证为核心的成熟科学。
《自然》杂志在同步发表的社论中表示,当前,那些正迅速改变人类知识获取方式的主流大语言模型中,尚无任何一个经过研究期刊的独立同行评审。此次DeepSeek-R1打破行业惯例,让大模型朝着提升透明度的方向迈出了可喜一步。
(《文汇报》9.19 许琦敏)

上一版


缩小
全文复制
上一篇