11月18日,有“中国诺贝尔奖”之誉的何梁何利基金2019年度颁奖大会在北京举行,来自人工智能领先企业旷视的孙剑获得“科学与技术创新奖”,成为AI产业界唯一获奖者。
获奖对他来说并不少见。10月末两年一度的国际计算机视觉大会ICCV在韩国首尔落幕,期间举行的COCO挑战赛是全球最权威的国际计算机视觉竞赛,孙剑及其团队一举拿下了物体检测、全景分割、人体关键点3项第一——这是其连续第三年获得多项冠军,也是COCO自2015年开赛以来“前无古人”的纪录。
“AI已经悄悄潜入日常生活,就拿这次在COCO挑战赛获得冠军的三个项目来说,此刻或者将来你一定用得上。”孙剑在接受中国青年报·中国青年网记者独家专访时说,参赛拿冠军并不是目的,重要的是用更强的、有差异化的产品来证明自己。
孙剑解释,计算机视觉领域中讲的“物体检测技术”就是要训练机器能够检测到图像里的特定内容,比如一张照片里的人或动物以及它们大概在什么位置,这项技术可以应用在自动驾驶领域,帮助汽车检测路上的行人、车辆、红绿灯状况,也可以应用到智能物流,帮助机械臂准确地抓取物体;“全景分割技术”则到了像素级别,机器知道照片里的人在哪儿还不够,还需要知道具体形状,人们在手机自拍的时候,这项技术就能把人的轮廓精确地分割出来,一键换照片背景;“人体关键点”与人密切相关,定义了头、肩、腿、膝等20多个关键点,定下这些点,机器就能知道人在做什么动作、是如何运动的,之前在网上流行的给一段视频中的人瘦身,就应用了这项技术。
那么,团队的水平到什么程度呢?以物体检测为例,如果满分是100,就意味着所有物体都被检测出来了,没有错漏;在五六年前,计算机只能得10分,经过人工智能的深度学习,现在孙剑团队的系统能得61分,“将来可能做到90分”。
从求学和科研道路看,孙剑是一个妥妥的“学霸”:1997年在西安交通大学自动控制专业获得学士,2000年和2003年西安交通大学人工智能与机器人研究所获得硕士和博士,毕业后加入微软亚洲研究院,后任首席研究员;2015年至2016年,孙剑在微软美国研究院任合伙人级研究主管。
2016年,他加入旷视,任旷视研究院院长,因为他觉得“创业公司最接近前线,能最快把技术应用到实践”。
上大学时,老师讲过“既要做鬼,也要做神”,“做神”指的是基础问题研究,“做鬼”则是解决实际问题,这句话让孙剑记忆深刻。在微软亚洲研究院时,孙剑师从时任院长的沈向洋,他的做法是不强调“神鬼”的先后顺序,出现实际问题就先解决“鬼”,解决问题之后再去研究“神”,往往会对实际问题产生更深的认识。
孙剑曾说:“‘先神后鬼’还是‘先鬼后神’是因人而异的,但一定要‘神鬼兼顾’,只有综合经验和理论,才能在科研路上越走越远。”
在计算机视觉领域,有几个方面是业界最关心的,因为与应用密切相关。孙剑说,除了物体检测、全景分割、人体关键点,还有图像分类,知道一张图是人是猫、是室外还是室内在实际应用场景中非常重要。人脸解锁的算法就以此为基础,在使用智能手机拍照时,根据场景自动调整更好的拍摄效果也得益于此;再如三维感知避障导航,一辆小车在室内场景绕一圈,大概就能知道周围的三维几何结构是什么样子,这也是自动驾驶的关键技术之一。
从2014年开始,旷视研发人工智能算法平台Brain++,覆盖从数据的生成、预处理、标注和存储,到算法架构设计、实验环节设计、训练环境搭建,再到训练、加速、调参、模型效果评估和产生模型,以及模型分发和部署应用的全流程。
这些高深的词语也许一般人听不懂,旷视联合创始人兼CTO唐文斌有过一个简单通俗的比喻:如果说旷视各种各样的算法是“鸡蛋”,那Brain++就是出产所有鸡蛋的“母鸡”。
“2015年,谷歌发布了人工智能算法平台TensorFlow,我们比较了一下,觉得Brain++更方便、更有优势,所以一直研发下去,直到今天,我们是唯一全员使用自主研发框架的公司。”孙剑说。
在微软研究院,全球大概有50个计算机视觉研究员,而在旷视研究院,这个领域的研发人员接近500人。孙剑介绍,旷视研究院的研发人员以年轻人为主,“刚毕业或者毕业一两年的”,“最初的核心人员,60%以上是清华大学的毕业生,其中很多是打过ACM(国际大学生程序设计竞赛)的,融合了不同方向的人才,有的擅长做硬件,有的擅长做系统”。
“成长是刚毕业的年轻人最大的需求。创业公司提供了最快成长的环境:硬性的包括对新员工的系统培训,让年轻人能不断做有挑战性的事情;软性的我们内部叫‘勇敢地成长’,鼓励年轻人用成长性思维破除一些习惯性思维,敢想敢做。”孙剑说。
据了解,何梁何利基金创立于1994年,钱学森获得当年的“科学与技术成就奖”,2006年起增设“科学与技术创新奖”。
谈及获奖感想,孙剑说:“刘鹤副总理在颁奖时对我说‘加油干’,一方面我很受鼓舞,另一方面还是要好好做些实际的事情。这个奖是对过去的肯定,我们要时刻准备好下一步做什么。”
对科学坚持不懈的探索并将其转化为实际应用,孙剑在这条道路上走得很踏实,也很快乐:“很多年了,激发我做研发的一个最大动力,就是我们会解决很多难题。当突然找到一个很有效的解决方法,那个时刻,让我感觉自己在与世界对话。可能第二天那份激动就过去了,但我们会一次又一次追寻这样的时刻。”
中国青年报·中国青年网记者 蒋肖斌