自从1956年美国达特茅斯会议提出概念以来,人工智能(Artificial Intelligence)已经从科学家的假设变得触手可及,siri语音助手、叮咚智能音箱、贤二机器僧等人工智能产品让普通人感受到人工智能带来的智慧便利,也创造了更多的创业创新机会。
根据新智元近日发布的《中国人工智能产业发展报告》(以下简称《报告》)的统计,中国人工智能领域的创业公司约有200~250家,大部分创建于2010年后,绝大多数融资仍处于天使轮或者A轮,语音和视觉依然是人工智能创业公司的两大方向,深度学习、机器学习都占据了绝对重要的地位,其次是计算机视觉、自然语言处理和语音识别。
在这些创业方向上,现在的人工智能已经发展到了什么程度?人工智能领域的创新创业机会和难点在哪里?围绕这些问题,近日,中国青年报·中青在线记者专访了科大讯飞轮值总裁、讯飞研究院院长胡郁。
作为企业家,胡郁在1999年参与创立了科大讯飞,负责科大讯飞公司的智能语音及语言核心技术的研究工作,总体牵头科大讯飞的人工智能前瞻项目——讯飞超脑计划;作为科学家,胡郁担任设在中国科技大学的语音及语言信息处理国家工程实验室执行主任,凭借在语音合成与识别、自然语言理解等领域的研究成果,他曾获得国家信息产业重大技术发明奖、国家科学技术进步二等奖各两次。
现在还是“弱智能”,期待“涟漪效应”
上述新智元发布的《报告》称,人工智能在60年的发展中经过了“三起三落”:20世纪50年代到80年代初仍处于诞生和基础阶段,神经元模型得以提出,感知器得以发明;从20世纪80年代到21世纪初,人工智能成功商用但跨越式发展失败;当今,随着摩尔定律和云计算带来计算能力的提升,以及互联网和大数据广泛应用带来海量数据的积累,人工智能有望实现规模化应用,并将深入到金融、交通、医疗、工业等各个领域。
《报告》的观点跟胡郁的判断不谋而合。在他看来,如果将来的人工智能可以发展到一定程度,就会像现在日常生活所用的水、电、煤气、互联网一样成为日常生活中的必需品。
事实上,科大讯飞的语音智能技术已经在教育、医疗、汽车、客服等领域应用和融合。据科大讯飞董事长刘庆峰介绍,目前科大讯飞的人工智能机器已经替代了30%的人工客服,安徽移动甚至有75%的客服内容都被人工智能的机器替代了。
人工智能的大时代已经到来。但胡郁认为,目前的人工智能技术还处于“弱智能”阶段,大多还只能达到语音助手的水平,要想获得与人类大脑类似或同等的智慧,拥有自主学习、举一反三的能力,人工智能还需要将深度学习、大数据等技术相结合,实现“涟漪效应”。
他进一步解释称,以目前的技术水平生产出的人工智能产品在刚开始投入市场的时候,有些性能和体验往往不够好,比如难以实现人机互动。但随着更多人使用,不断累积的真实数据和使用经验就会帮助人工智能产品自我学习和更新。“当它扩散到更多人群的时候,就像波纹覆盖的水面扩大,这时候就已经是改进以后的系统了”。
他把这种“涟漪效应”的优化归功于第一批用户的贡献。“前一千万人免费使用的同时也贡献了宝贵的数据和经验,当第一千万零一个人使用的时候,他往往会惊异于系统的优异性能”。
实际上,科大讯飞最为人熟知的产品——讯飞语音输入法也是在这种“涟漪效应”的作用下才逐渐成长的。
2010年以前,科大讯飞的语音识别技术无法在真实场景下使用,在实验室里,科大讯飞语音输入法的测试识别准确率是90%,在真实的环境下识别准确率只能达到55.8%,但是在“涟漪效应”的优化下,现在的语音识别准确率已经达到95%,并且识别错误率还在以每年30%的速度降低。
让机器从“能听会说”到“能理解会思考”
在国内的人工智能领域中,百度和科大讯飞是体量最大、投入最早的公司。依托资金、科研等实力,这两家公司的选择往往会带动和影响国内的人工智能发展和创业方向。
在今年9月举行的百度世界大会上,百度公司首席科学家吴恩达宣布将开放百度机器学习方面的能力,推出深度学习和百度大脑两大开放平台,让开发者不用再从头写代码。与百度从机器学习入手的考虑不一样,胡郁希望科大讯飞能以语音和语言为入口,掀起一场人工智能的认知革命。
“七万年前人类发生了‘认知革命’,其中的核心是当时的智人拥有了丰富的语言,从而更好地描述自然世界,执行更复杂的计划,可以描述他们脑子里面想到的东西,产生虚构,产生宗教,产生各种概念。”胡郁表示,之前的人工智能是以“深蓝”计算机为代表的逻辑计算阶段,现在则还处于可以精准识别图像和语音的感知阶段,未来更高级的人工智能应该是让机器学会认知。
在他看来,要想让人工智能走出“弱智能”阶段的瓶颈,就必须让机器从“能听会说”到“能理解会思考”,这就需要让人工智能也来一次“认知革命”,让机器和人能对话沟通,让机器学会认知,而以语音和语义为代表的自然语言理解技术应该是一个突破口。
从国际经验看来,他的这一判断也是人工智能的一种实现路径。今年6月初,美国“互联网女皇”Mary Meeker发布的《2016年互联网趋势报告》也认为,语音将成为最重要的交互入口。今年年初,美国麻省理工学院评选出的十大创新预测中,语音接口也被列为第三名,被认为是能解决重大问题、带来全新机遇的希望所在。
胡郁所负责执行的“讯飞超脑计划”就是想实现感知智能和认知智能的突破:在感知智能方面,语音识别、手写识别技术要保证每年30%~50%的错误率下降,要能够识别方言,还要能理解人和机器、人和人之间的对话;在认知智能方面的关键则是让机器能理解、会思考,这就必须在自然语言理解、联想推理、自主学习等多个方面实现突破。
作为“讯飞超脑”计划的重要组成部分,由讯飞牵头的科技部863重大专项——“基于大数据的类人智能关键技术与系统”相关研发工作也在有序进行。这个项目的目标是让机器也能参加高考,并且考上一本,甚至清华、北大和中科大。
“当人工智能掌握的技能越来越多的时候,希望我们人类可以有更多闲暇的工夫去玩,而不是被机器人夺去工作。”胡郁说。
中国需要更多“爬山型”公司
虽然科大讯飞语音输入法等产品已经获得了用户的欢迎,离线和在线的交互次数每日达到20亿,合作开放伙伴突破15万,但在胡郁眼中,科大讯飞并不是一家互联网公司,而是一家正在爬山的科技公司。
之所以要强调二者的区别,是因为在他眼中,做人工智能的公司很像爬山者,需要坚持目标、不改方向,一步步地爬到顶峰,“我们今天是人工智能公司,昨天是人工智能公司,明天还会是人工智能公司”。但互联网公司更像是个冲浪选手,互联网的每一波浪潮都不一样,它要不停地迎接下一个浪潮,“如果下个浪潮不是人工智能,也许他们就换了(方向)”。
此外,胡郁还认为,人工智能的发展需要跟传统产业深入磨合,就像爬山时要走稳每一步、摸清每一块石头一样,虽然过程繁琐但却是必不可少的。“互联网公司要有很高的收益性,这些是累活儿,互联网公司不一定愿意去干”。
作为科学家转型创业的代表,胡郁认为人工智能领域的创业更加需要长期的坚守和持之以恒的投入。“能静下心来坐10年板凳的这种决心,我觉得更重要”。
他坚持认为,中国还需要更多“爬山型”公司:“不管外部环境是PC互联网还是移动互联网,公司爬山的本质,你要征服的这个东西是不可变的。如果你坚守都没有,你后面做创新是不可能的。”
在期待“涟漪效应”能给人工智能带来更多优化的同时,胡郁还呼吁中国的人工智能研究应该从两个方面发力:研究院所、高校应该更加着重于理论钻研,而产业界不仅要应用人工智能技术,还应该去做技术方面的大规模的融合创新。
这样的呼吁源自他对中外人工智能的差异对比:中国的产业界、媒体界对人工智能的了解更多的是应用特性和娱乐特性,而美国则深入钻研人工智能的理论研究,这些研究成果大多难以产业化,但却是最原始的理论基础上的创新。
为什么中外人工智能领域的差异这么明显?胡郁分析,国内人工智能学术界因为要跟产业对接,所以做了许多技术应用和创新;而产业界还没有更加深入、原创的研究能力,所以很少有单位能做整体性的系统创新。
“我们的很多创新其实只是停留在应用或者技术层面上,但没在科学的层面上去发现和创新,如果我们只在这个层面的话,得不了图灵奖也得不了诺贝尔奖,也不可能创造信息论这些东西。”
在他看来,在人工智能的研究上,学术界的理论深度还应加强,也应该花更长的时间去研究人工智能的本质性基础科学。“实际上我们还太少了一点,还应该增强”。
中国青年报·中青在线记者 王林