7年前,获得国际信息学奥赛金牌的高中生范浩强,毅然加入一家AI创业公司,只是因为——“挺酷的!”
如今,穿着卡通T恤衫、牛仔裤、运动鞋,留着小平头,范浩强坐在位于北京中关村融科资讯中心的旷视研究院,俨然一个标准的互联网公司程序员。他的职业——算法研究总监,让很多人好奇。
说到AI,大到无人驾驶、智能家居,小到办公楼里刷脸打卡、智能识别等,大多数年轻人都有过体验。AI正在成为像水电一样的基础设施,催生了很多新岗位。近日,人力资源和社会保障部、市场监管总局、统计局正式向社会发布了13个新职业信息,其中10个与人工智能相关。
“AI是一栋漂亮的大楼,我们就像施工现场的一个大包工头。”范浩强笑着打了一个比方。25岁就成了旷视研究院算法总监,带领近百人的研发团队,即使在“天才”辈出的中关村,他也是一个传奇。清华大学“姚班”成绩第一、用商用算法拿到4个国际顶级会赛冠军……然而,站在AI的塔尖,他并不认为自己的成功是因为所谓的天赋。
“他说搞AI挺酷的,我想了想,是挺酷的”
“传统的软件开发,一般的程序员就能搞定,但AI算法的开发工作量更大,需要更多人参与进来才能搞定,编程能力是最基础的,最重要的是要对数学算法有一定认识。”范浩强说。
高盛发布的《全球人工智能产业分布》报告统计,2017年全球新兴人工智能项目中,中国占51%,数量上已经超越美国。但全球人工智能人才储备,中国只有5%左右。
中国青年报·中国青年网记者查阅招聘网站发现,各大科技公司对于“算法研究员”求才若渴,学历硕士起招,通常会加注“博士研究生优先、发表过国际顶级会议或期刊论文优先”。高门槛匹配的是相应的高报酬,一名普通的算法研究员薪资水平每月两万元起步,高级算法研究员的薪酬可高达每月7万~10万元。
在旷视研究院,有博士、硕士学位者人才济济,总共曾获ACM信息奥林匹克金牌70块。因此范浩强打趣自己说:“本科学历,毕业两年,在贵司也就这样吧。”
这位言谈间透着一种理所当然的平静的年轻人,身上有很多醒目的标签。上小学和初中时,他就是奥数比赛领奖台上的常客。2011年7月,上高一的范浩强作为中国队的4名参赛选手之一,在泰国芭提雅以599分(满分600)的成绩夺得第23届国际信息学奥林匹克竞赛(IOI)金牌第二名。
同年10月,清华大学信息学总教练唐文斌作为联合创始人创办旷视。他向范浩强发出了邀请。
“他就说搞这个事情的人挺酷的,我想了想,是挺酷的!”于是,还没进入大学的范浩强成了旷视的6号员工,走上了创业路。
同学们忙着备战高考的时候,范浩强被保送至清华大学,并通过“二次招生”考试考进了清华大学“姚班”——计算机科学实验班。
他一边在“姚班”学习,一边在旷视工作。在半工半读的情况下,一直保持了全班第一名的成绩。在大一军训时,他就完成了一篇ICCV论文(计算机视觉国际顶级会议之一)。
2017年,范浩强本科毕业,伸向这位“天才少年”的橄榄枝很多,他也曾考虑是否去做“计算机理论研究”。但最后,他还是选择了“要在这块儿搞出行业里最牛的技术”。在他看来,“这个时间点上,AI就是最大的事情,商业化落地是最重要的一环。”所以他依然留在旷视,为打造服务于各商业领域的AloT操作系统,以及建构具备连接物联网设备能力的生态系统添砖加瓦。
“爬上一座山头,发现前面还有一座山”
“‘一穷二白’的时候我们坚持认为能做出天下最好的人脸识别,别人都觉得是‘天方夜谭’。”回想创业初期的困难,范浩强仍然感慨不已。
旷视当初选择做人脸识别,在业界被认为是一件“不靠谱的事”,学术界不看好,物质条件也非常匮乏,“公司没有建自己的机房,都是租借人家的,一度出现丢失数据的情况”。
当时“训练”一个算法,需要把人脸识别的网络拆成多个部分在很多机器上去训练,然后再把结果拼起来,相当于手工的多级训练,当时在论文里他还会写上:再多一层就训出来了。“现在听起来都很荒谬。”范浩强笑道。
即便是最困难的时候,范浩强也觉得,技术是没有瓶颈的,“技术提升的过程都是见招拆招,克服困难、总结经验,把它沉淀成基础设施,然后再往上攀爬”。
真正的难题在技术之外。比如当他们第一次成功做出“人脸识别”后,市场在哪里,卖给谁。现在,这个最大的问题变成了“怎么把行业和技术结合起来,完成升级”。
“在旷视最‘可怕’的就是so what(那又怎样),你的人脸识别天下第一了,so what?你为1亿人刷脸了,so what?”作为AI商业化落地的先行者,他们前面没有样板,“只能不断爬上一座山头,发现前面还有一座山头”。
如今,范浩强的工作时间以168个小时为单位计算,每周他要处理的事情,不再是单纯的技术工作,他需要带团队。以前他只需要纯做算法,现在要懂硬件、懂产品设计,最近他甚至在学习财务管理。他不知道将来还要懂点儿什么。
角色转变的过程很难。早在2012年,旷视科技就成立了创业公司中鲜见的研究院。一开始,算法研究员都是“单兵作战”,随着研究院不断壮大,对组织化有了更大的需求。但是谁来做这个事情?范浩强环顾四周,发现除了自己,要么就不具备客观条件,要么就还没做好准备,“我想了想,好吧,这件事就我来干!”
“顶级程序员”范浩强找到了一套适用于这个团队的管理逻辑,他称之为“人类语言编程”。“计算机出bug(漏洞)了,程序员要加班处理,不是说把他自己的思维灌输给计算机,而是他改造自己的思维符合计算机。做团队工作也是一样,不是把你的思维强加给一个成员,而是去用他们的思维逻辑改造自己,每个人的成长环境不一样,这时候要把你的思维带入到他的思维中去”。
范浩强说起自己最有成就感的一个瞬间,是在一个基于深度学习的算法用在了人脸识别的门禁产品中,并且在不同光照条件下性能也大大提升的时候。
对于他来说,那模型的准确率只是长了几个点,并没有很惊艳。但是做产品的同事告诉他,用这个模型后,识别性能相对于其他模型而言,对光照条件的改变适应性更强,范浩强真切感受到那些辛苦敲出来的代码产生了具体的、肉眼可见的价值,“那感觉挺对的,不光只是刷刷榜,学术界开心一下,它真的带来了impect(巨大影响)”。
“弄斧要到班门”是最重要的逻辑
7年时间,范浩强以“拔节的速度生长”。
他和团队一起为旷视在人脸识别、人脸检测方向拿下了多个顶会级比赛的世界第一。旷视由此在计算机视觉领域一举成名,“人脸识别”也逐渐成为现实,应用在各类场景之中。在今年的CVPR NTIRE真实图像降噪挑战赛上,旷视科技以绝对优势拿到了Raw-RGB组冠军。
如今站在AI的塔尖,范浩强并不认为自己的成功完全因为所谓天才。
他觉得自己是一个很“极客”的人,“我身边很多人都习惯以极客精神对待每一件事。比如很多玩耳机的同学,会亲自去测一测导线电阻多少,音质有没有损失,有的人甚至自己焊芯片”。
有一段时间,范浩强沉迷于研究用手机在北京拍星星一次最多能拍多少颗。于是他时常半夜跑出去,记录北京夜晚的星空。冬天最冷的时候,他披着大棉袄闯进干燥的寒夜,拍下最多的星星。虽然最后他并没有数清楚,因为星星的分布密度比他想象的大,但是这个执着的想法让他见证了许多个有美丽星空的夜晚。
最近,他开始研究公司各个办公室晚上人都走了、灯都熄了的时候,能拍到什么。“这是research(研究院)办公区凌晨4点的样子。这些灯都是键盘上的指示灯投到了墙上造成的。”他兴奋地拿出手机,翻出那张“得意之作”:深夜的办公区,一排排电脑安静地立在办公桌上,四周围绕着红色、绿色、橙色不同层次的光。“人眼是什么都看不见的,需要设备和算法。我拍了一晚上,代码写了一周。”最后他通过算法将那些“夜晚的主角”在照片上还原出来。这是属于范浩强的“魔法世界”,他精通于此,更热爱于此。
对于如今想要进入AI领域的年轻人,范浩强说,今天的AI和10年前的AI已经不一样了,“现在的AI已经不是莱特兄弟时代了,而是生产野马战斗机的那个时代”,需要的人才能力已经有了质的改变,可能更需要吃苦耐劳、务实的人,他们不仅要具备扎实的编程基础能力,同时想真正做出改变世界的东西,还需要在数学上有较深的理解,对算法结构要了如指掌。但无论怎么变化,他始终相信,“弄斧要到班门”是最重要的逻辑,“要不停地去寻找自己觉得最强的那一批人,去向他们看齐”。
他说,“成功就是信仰+坚持,如果你相信你能做天下第一,并且你每天都为之努力,就会有很多人愿意去帮你,和你一起去成就它。”
中国青年报·中国青年网记者 李翀 实习生 金文汉