首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 养生
  • 女人
  • 文娱
  • 电视
  • 图片
  • 游戏
  • 光明报系
  • 更多>>
    •   人物
    报 纸
    杂 志
    留学 2021年10月05日 星期二

    孙茂松:培养真正对国家社会堪大用的人才

    记者_王湘蓉 王楠 设计_刘仕悦 《 留学 》( 2021年10月05日)

        人工智能发展至今一甲子有余,已经成为这个时代科技发展的代表之一,正深刻影响着我们的生产生活。人工智能产业发展势头正盛,但达到人类水平的、能够自适应地应对外界环境挑战的、具有自我意识的人工智能尚在起步阶段。人才是人工智能发展所需的战略资源,关于人工智能与创新人才培养,我们采访了欧洲科学院外籍院士、清华大学计算机系教授孙茂松。孙茂松长期从事自然语言处理、人工智能以及社会人文计算等方面的创新研究,同时,他致力于培养人工智能交叉学科创新人才。“基础理论突破是新一代人工智能发展的重中之重,基础科学领域顶尖人才培养的短板亟待补齐。”孙茂松说。

     智慧教育先从条件成熟的局部着手


        新基建是我国一项重要的国家发展战略,延伸到教育领域的教育新基建,是建构成高质量教育体系的“数字底座”。以技术创新为驱动的教育新基建,催生智慧教育生态的变革。何谓“智慧教育”?孙茂松从“智慧”一词谈起。他认为,智慧是智能的更高阶段,一方面智慧的“慧”渗透了中国人所谓的悟性,也是人类的智慧。另一方面,智慧代表“通”,打破数据孤岛从而实现万物互联。我国许多城市在推动新型智慧城市建设,孙茂松表示,这需要城市中各行各业的大数据融合在一起,触类旁通。当前,大量数据长期处于封闭状态,智慧建设技术尚未达到人类水平,因此智慧城市建设还有相当长的一段路要走。教育在城市发展中承载着重要的使命,构建新型智慧城市,回应人们对泛在灵活、个性化教育需求的智慧教育,旨在建立公共信息平台,在全国范围内打通个人学习空间,共享优质教育资源。前瞻智慧教育体系的构建,孙茂松给出了自己的判断:目前大规模的智慧教育体系建设仍停留在设计图纸上,也缺乏自上而下的宏观谋划,其实践路径更多的应是先从条件成熟的局部着手,一步一步地达成最终目标。
        应用于汽车、医疗、传统制造业等领域的人工智能,显著提升了生产效率,人机共融的应用愈加广泛。智慧教育的重点在课堂,展望人机协作的智慧教育,是否会出现机器人教师和人类教师同台授课的场景?孙茂松认为,人工智能技术需根据人类教师的教学内容进行变化,单纯依靠机器人产出教学的想法不现实。实际上,人们普遍对人工智能寄予了过高期望。2016年,人工智能机器人阿尔法狗击败围棋冠军,打破了人类称霸围棋领域的纪录。人机大战后,阿尔法狗的威力尽人皆知。纵观人工智能发展,这一代的人工智能令人惊叹,超乎我们的想象,但机器能在某个任务上“吊打”人类,其实是有一系列前提条件的。
        孙茂松进一步解释道,抛开算力和大数据等外在条件,从任务本身的角度出发,必须满足五个要素:任务是单一的、边界清楚,状态可预期,原则、元规则确定,信息完备,最重要的是结果可量化。然而现实情况下,全部满足要求的任务寥寥。比如语音识别,即使训练数据再多,机器语音转写方言的文字也免不了在很多场合下会像“胡言乱语”。又如无人驾驶汽车,一旦出现光照、强风、雨雪等恶劣天气……应对这些不可预测的突发状况,人工智能免不了“犯糊涂”。因此,人工智能与教师融合教学时,机器人教师仅能起到辅助课堂教学的作用,无法完全取代人类教师。

     培养0-1理论创新的天才


        重大开创性的原始创新成果,也就是0到1的基础研究,是国际科技竞争的制高点。孙茂松借用道家的经典哲学“道生一,一生二,二生三,三生万物”,对照钱学森先生将科学技术活动分为基础科学、技术科学、工程技术的观点,提炼总结了科技创新的四个层次。孙茂松认为,第一层是0-1的基础理论创新,属于基础科学范畴;第二层是1-2,在基础理论具备的条件下,完成具有高度不确定性、看似做不到的创新任务;第三层是2-3,这一层的创新工作带有科研性质,大量高校、科研院所在从事这个领域的研发。1-3统一归到技术科学。第四层是3+,在应用层面进行实践行为的创新,也即工程技术。我国成熟的3+类创新成果在世界范围内已有一些处于领先水平,引领产业潮流,2-3类的研究总体上做得也很不错,但0-1类的成果乏善可陈,即便是1-2类的成果也屈指可数。
        孙茂松认为,大学最应该做的是基础科学创新。“在科学领域真正引领国际,只有做出0-1的突破才能服众。”人工智能正迈向第三代,若想取得突破,关键在重大理论创新。孙茂松指出,人工智能第一代和第二代分别由小知识和大数据驱动,前者基本没有走出研究的“象牙塔”,后者则走到了技术和社会应用,很了不起,但其理论框架实源于学界过去几十年研究的厚积薄发。我们在研究上能够享受的“红利”已经释放得差不多了。然而基于大数据的人工智能,能发挥作用的应用范围会受到很大制约,人工智能亟需0-1理论创新。孙茂松认为,人工智能0-1理论创新的提出者需具备优秀的数学修养,能够深刻理解计算机,而这类人才的培养是中国教育亟待补齐的关键短板。
        0-1的理论创新是天才式人物的使命,天才在任何时代都是稀缺的。回顾那些成就震惊世界的天才,“年轻”是他们身上最醒目的标签。孙茂松画下了天才不同寻常的成长轨迹:从小萌生科学理想,一直牵引着他锲而不舍地向上攀登。大学期间或者博士阶段,接受一流的大学教育,有名师悉心点拨,痴迷钻研,30岁左右即做出引发学术界轰动的成果,足以凭借成果在世界上“立住”。年轻之外,有“尖”是天才的另一大特点,孙茂松认为,天才的“尖”使其在钻研学术时能够“攻其一点,不及其余”。为此,孙茂松建议,为拔尖创新人才开一个小出口,保证他们特殊的育人链条不间断。唯有如此,0-1理论创新的天才才能冒出来。
        加快建设科技强国,实现高水平科技自立自强,拥有一流创新人才,意味着在科技创新中牢牢占据优势地位。许多人认为,对“卡脖子”关键核心技术的攻关,人才是技术创新的决定性因素,孙茂松则认为,人才只是其中一个因素。大学教育授人以渔,大学生的学习能力不容小觑。孙茂松用“钓鱼”形容知识学以致用的过程。大学业已教会了学生钓鱼的一般原理和方法,通过当时掌握钓鱼技术能钓上来鲤鱼,即便没见过其他鱼类,但只要用心观察其生活习性,运用已经学到的本领,过个一年半载也能适应性地做好。在这个意义上说,我们突破“卡脖子”瓶颈的人才缺乏问题可能并没有那么严重,主要因素在于国家层面强有力的组织保障往前推进。
        2019年,清华大学成立自然语言处理与社会人文计算研究中心,孙茂松被聘为研究中心主任。自然语言处理被誉为“人工智能皇冠上的明珠”,其与社会科学及人文科学相结合,具有大跨度学科交叉的性质。同年,中央音乐学院首次招收“音乐人工智能与音乐信息科技”方向的博士生,着力培养音乐与理工科交叉融合的复合型拔尖创新人才,孙茂松是科技导师之一。交叉学科始终是孙茂松人才培养的重点方向。从基础教育乃至高等教育的育人全链条来看,孙茂松不赞成文理分科。他倡导全人教育,强调孩子从小在完成学业的同时,应该把更多一点的时间精力放在培养自己的乐趣、兴趣、志趣上。“孩子最好有会玩的东西,甭管玩啥,孩子得爱玩,玩出水准,玩到一定境界。”教育,要让孩子从小有趣味。孙茂松喜欢诗,学术讲座上的古诗词信手拈来、引经据典是孙茂松讲课的特色。谈自然语言处理的迷思和感悟,孙茂松说“透过喧嚣,坐看云起”。从机器翻译到古诗生成,被他形容为“运用之妙,存乎一心”。孙茂松认为,人文素养陶冶情操,渗透生命血脉中,逐渐与人的精神融为一体,这层底色会潜移默化地影响人的一生。
        有人邀请孙茂松为中小学生讲人工智能,通常会被他婉拒。“不能什么事都往前提到中小学”,孙茂松很严肃,“基础教育阶段开展以知识传授为目的的人工智能教育为时过早,大学的人工智能专业,首先通过数学、统计学、计算机编程等一系列专业课打下基础,再深入学习人工智能相关知识,这是比较顺畅的学习路径。面向中小学生的人工智能教育,引发学生对人工智能进行深入探究的兴趣是主要目的。”孙茂松坦言,这一代人工智能深度学习基本方法已经具有某种工具化的性质,中小学生把人工智能当成“工具”,找到感兴趣问题的数据,在老师的指导下学会训练模型,甚至自己动手标注一些数据,完成实验,实现自己的设想乃至得到超出设想的结果,或者用简单的编程发出指令来控制机器人,初步体验人工智能的奥妙,这些都是可行的。面向中小学的人工智能教育,需要精心设计相关课程,与其已有的知识结构相适应,“点到为止”,重在培养对科学的志趣。

     要有“一战功成天下知”的学术追求


        作为大学导师,谈到带学生,孙茂松沉吟良久。倘若育人仅止于让学生找到比较好的工作,在职场上能够充分发展,导师们都能驾轻就熟。孙茂松期望把目标定得更高:培养真正对国家社会堪大用的人才。他感到自己当学生时和现在的学生想法有很大不同。“言传身教”是孙茂松学生时代受教育的最大体会,老师以身作则,毋庸多言,学生就会向老师看齐。这一代学生见多识广、思维敏捷,但缺点也十分明显:用现实的眼光看待接受高等教育,满足于找个好工作,缺少远大的理想和学术抱负。孙茂松希望学生有更深的学术造诣。他们的学术水平不能仅仅满足于在世界学术舞台上“上台亮相”,而应该去做更有影响、更大的、更有意义的工作。“做科研好比上梁山,盲目追求论文数量永远‘坐不上前几把交椅’,想在学术界坐到主位,有话语权,靠做艰难的、别人尚未触及的科研,将工作做得系统深入。”孙茂松举起一只手朝我们比了比:“做学术、写科研论文不能‘打一枪换个地方’,不能总找软柿子捏,改一改参数再发一篇。最后,写了五六篇所谓‘顶级会议’的论文,学生借此找到了好工作,但对科研的系统性、深入程度却并不关切。如果定位在一流创新研究,可能最终只发了一两篇论文,但研究真正解决问题,引发全世界关注,产生‘一战功成天下知’的效果和快意。”
        孙茂松希望学生在科研领域做出真正有创新性的成果,身为清华大学计算机系自然语言处理与社会人文计算实验室的学科带头人,他想办法营造创新环境,鼓励学生大胆探索。当然,这样的选择比较冒险,类似阿尔法狗的创新研究会不会有结果,多久有结果都是未知数。“敢为天下先”需要有一定的判断力和勇气,阿尔法狗的成功给了孙茂松启发。
        在搜索栏中输入九歌,自动关联的词条除了诗人屈原,还有人工智能诗歌写作系统。“心有灵犀一点通,小楼昨夜又东风。无情不似多情苦,镜里空嗟两鬓蓬。”四年前的一档电视节目中,这首由九歌现场创作的作品,首战即惊艳众人,并顺利通过了图灵测试。九歌其名正是取自屈原的《楚辞》,团队为深度神经网络方法创生的AI赋予了计算机的诗意。着手开发人工智能写诗机器人颇具挑战性,虽有阿尔法狗这一机器学习的典范,但迁移到写诗场景中是否行得通还要打个问号。前人在人工智能诗歌写作上有过多番尝试,但效果不佳。研发写诗机器人看似“站在巨人的肩膀上”,但不能复刻阿尔法狗的研发模型。解决具体任务时,要让人工智能创作的诗句文从字顺,合乎语法逻辑,更深一步地,还要解决主题、意境一致性等难题。
        谈到研发九歌的初衷,孙茂松表示,希望借此唤起公众对诗歌的关注,回归诗意生活。2015年底,孙茂松实验室开展诗歌自动生成研究。结合多个为诗歌生成专门设计的模型,基于超过80万首人类诗人创作的诗歌进行训练学习,2017年9月中文诗歌自动生成系统九歌上线。九歌系统页面古色古香,支持多关键词、语句段落、图片等多模态输入,可以生成不同体裁的诗歌,同时提供多种风格选项,每一首诗都是“原创”。至今孙茂松团队还在不断完善九歌系统,现在已经迭代到2.0版本,今年年初还上新了“对对联”“集句诗”功能。九歌是AI技术和人文领域的结合,也是推动我国的人工智能向前发展非常有意义的创新成果。
        采访中,孙茂松始终以审慎的态度与我们探讨。他对于人工智能与教育的思考,理性严谨又饱含人文情怀。在通往新一代人工智能的道路上,困难和挑战不可避免。“道阻且长,行则将至。”孙茂松相信,一代又一代执着的科研工作者接续,必将人工智能发展的波澜推向更高。

     

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有