首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    文摘报 2025年05月17日 星期六

    陈润生:“真没料到会成预言家”

    《 文摘报 》( 2025年05月17日   05 版)

        陈润生

        陈润生是我国非编码基因研究的拓荒者,也是20世纪末至21世纪初全球规模最大的生命科学工程——“人类基因组计划”的参与者。很多人认识陈润生是在一条热传的短视频上。当DeepSeek成功崛起,很多人找出了两年前他说的一句话,“堆积算力的尽头是沙漠,不能够一味地堆积芯片,而是应该开发底层创新。”有人说当全球陷入算力竞赛的时候,他成功预言了中国AI的破局之路,并不在芯片的数量,而在智算的密度。

        在他的努力下,中国成为全球第六个具备大规模基因组测序能力的国家

        1964年,陈润生毕业于中国科技大学生物物理系。20世纪80年代,正值中国改革开放之后首批大规模公派留学潮,他把目光投向了德国,因为那个时期德国在分子生物学和生物信息学上都处于国际的前沿。1985年,已经44岁的他前往德国纽伦堡大学从事量子生物学的研究。

        1990年,陈润生在《自然》杂志上看到关于人类基因组计划的论文后,敏锐地意识到基因组学将成为生命科学前沿的新课题。于是,他给基因组学的创导者詹姆斯·沃森写信,很快收到美国人类基因组计划办公室的回信,并获得了人类基因组工程第一个5年计划文本。

        当时,中国的生物信息学和基因组学研究正处于转型阶段。1992年,中国医学遗传学奠基人吴旻提交的《中国人类基因组计划重大项目建议书》获批,成为中国参与国际人类基因组计划的原点。陈润生得知消息后,立刻拜访吴旻院士,并希望承担两项关键任务:拼接测序片段和寻找重要功能基因。

        1999年,中国加入国际人类基因组计划,负责完成人类三号染色体短臂约3000万个碱基对的测序任务,占整个计划的1%。

        这看似只有1%的工作量,实际操作起来困难重重。测序片段的拼接就像没有模板的拼图,每段长度仅约一千个碱基对,离完整拼接差距巨大。

        面对这个难题,陈润生团队创新测序方法,最终提前两年高质量完成任务,中国成为全球第六个具备大规模基因组测序能力的国家。

        发现97%的基因暗藏致病玄机,向世界开源64万个非编码分子信息

        在研究过程中,陈润生发现人类基因组中用于编码蛋白质的序列仅占2%—3%,其余97%都是非编码序列,曾被认为是垃圾DNA,没有生物学功能。

        但陈润生坚信这些序列绝非无用,于是带领团队专注研究非编码区域。“我坚信那97%绝对有用,不可能进化几十亿年,最后进化出来97%是垃圾,这不合逻辑。”

        他们以食管鳞癌等多种肿瘤患者的组织为研究对象,发现部分患者编码蛋白质的基因正常,但非编码区域发生了变化,进而找到了许多与疾病相关的新位点。

        从1993年开始,团队建立超级档案库,整理、分类和存档全世界科学家发现的64万个非编码分子信息。陈润生选择开源这些信息,为全球科研人员提供研究基础。他说,“科学是一个人类集成的贡献,我们作为基础研究人员,能提供我们的贡献,这就足够了。”

        “不要简单把AI当成工具,而应把它视作创新中心”

        基因研究之外,陈润生也一直关注着大模型。早在20世纪80年代末,他就运用人工神经网络来预测遗传密码中的编码基因。对于生物信息学领域的研究者来说,各种方法都是相通且一脉相承的。他对DeepSeek等大模型发表看法,是长期在该领域深耕的必然结果。

        如今,陈润生团队在生物信息学与医学AI大模型方面积极探索,尝试将中医数据融合到模型中。

        在他看来,虽然中医和西医对疾病的认知存在差异,但大模型可以提供一个融合的平台,将这些不同的数据整合处理,更好地服务人类。

        对于未来AI的发展,陈润生期待AI能够“涌现”出更多创新火花,他提出将人工智能作为新的创新中心,“我们不要把AI当成简单的工具,而是把它作为人类新的创新中心,这样能有更多创新的可能性。”

        (央视新闻微信号 5.6)

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有