机器与人的思考风格并不一致,智力孰优孰劣并不好测,但一直以来,全球重要IT(信息技术)公司几乎都偏好用人机棋类博弈,来检验人工智能的进步。
棋类博弈自古被视为一种关乎智力的高级挑战。和其他智力测试相比,弈棋具有直接对抗的特点,紧张对局中,对手一手精妙棋招,更能让人感觉到一种智力上的刺激和挑战。弈棋随机和不可控因素更小,因此对局双方的决策能够更直接地控制整个局面的走势,进一步增强了智力的对抗性。
机器通过棋类挑战人类智力,最早可追溯到1958年至1959年,美国麻省理工学院率先在电脑中设计国际象棋程序,几年后,人与电脑下棋的新生事物就出现了。
1989年开始,IBM(国际商业机器公司)的超级电脑“深蓝”常常能击败国际象棋大师,人工智能的“脑力”优势凸显端倪。而1997年“深蓝”叫板国际象棋世界冠军卡斯帕罗夫并获胜,已经让人类感受到智力受到威胁。
随着电脑CPU(中央处理器)的功能越来越强大,2006年后,人类已无法战胜国际象棋高级人工智能程序。甚至有国际象棋选手在正式比赛期间作弊,偷着让电脑支招,结果被发现。
电脑在国际象棋上挑战人类成功之后,所有人的目光又聚焦在了围棋这项古老的东方棋类运动上。然而对电脑来说,围棋似乎是个比国际象棋更“难”的东西,也被一些人称为人类最后的智力骄傲。
不同于国际象棋,围棋每回合的可能性更多,共有250种可能,一盘棋可以长达150回合。同时,围棋局面多变,无法被算法穷举。更专业点说,围棋难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆,同时状态空间大,也没有全局的结构。这两点加起来,使以往能在国际象棋中从容胜出的人工智能无法应对。
此次“阿尔法围棋”程序敢叫板李世石,在于它突破了传统电脑的“固定”程序逻辑,融入了自学习,或者说是深度学习的能力。
阿尔法围棋的开发团队在程序中输入职业棋手的3000万种下法让其学习。通过这种经验学习,阿尔法围棋对人类走法的预测准确率能达到57%。在此基础上,阿尔法围棋进行“深度学习”,自己与自己对弈,目前它自我对弈已超过3000万局。在这个过程中,阿尔法围棋不断积累胜负经验,举一反三,这一方式十分接近于带着直觉和第六感作出判断的人类大脑功能。
这也就意味着“阿尔法围棋”技术架构采用的是模仿人类大脑神经模式,而不再单单依靠机器的蛮力“强记”,即使这样,也是经过了几千万次的机器自我围棋对弈与学习,才有了挑战人类的勇气。
(新华网 3.9 杨骏)