“天猫精灵,请给我的手机充100元话费。”“好的,已为您充值。”
“天猫精灵,请帮我买一箱可乐。”“根据您的购买记录,已为您挑选330毫升装可乐一箱,请问送到您默认地址吗?”
“天猫精灵,我回家了”。随即,家里的空调开始出风,加湿器喷嘴开始出现水雾。
丢掉鼠标、遥控器,只靠语音便能传达指令,完成购物、控制家电,这些过去看似不切实际的空想,随着阿里巴巴类似“芝麻开门”的魔咒,已为我们打开通向未来智能生活之门。7月5日,“天猫精灵X1”发布现场,随着现场演示进行,记者们已经坐不住了。“定价多少”“哪里能买到”,记者们纷纷在群里询问。
试图打开这扇充满诱惑之门的,并非只有阿里巴巴。
随着亚马逊Echo、苹果HomePod等智能音箱爆红全球,智能音箱领域已汇集了包括谷歌、苹果、微软、亚马逊、三星等几乎所有国际巨头。根据由Strategy Analytics发布的调查数据,2017年智能音箱的全年销量可突破千万台级别,未来5年其产值就能达到或者接近百亿美元的规模。
而阿里巴巴杀入这一领域的野心,显然不仅仅只是做一款产品,而是在人工智能概念火热的今天,去争夺智能家居语音这个全新的超级入口。
据媒体报道,国内的数家大公司也已经在这个超级入口开始大战。京东较早就推出了音响产品叮咚。腾讯即将发布自己的智能音箱产品。除了互联网巨头,传统IT厂商联想集团也进军智能音箱领域。
这场名为“未来·开口即来”的发布会,除了“天猫精灵”的亮相,全场唯一的嘉宾,是阿里人工智能实验室(A.I. Labs)负责人浅雪。这位看上去温和没有攻击力的女士,是淘宝第一代产品经理。她谈到对这款产品的设计理念:“在苹果推出智能手机后,触摸一度是最好的人机交互。而在现在、在未来,还会不会出现比触摸更好的交互手段呢?我们觉得语音是最好的,因为父母可能不会使用复杂的App,孩子也不会使用复杂家电,而通过语音,这一切都能实现。”
智能音箱被认为就是智能家居控制中心。在体积上,她希望这种产品“越来越小,并且无处不在”。
一直以来,阿里巴巴在商业上的成功,掩盖了其在技术上的成功。在“天猫精灵”发布现场,许多记者好奇,其使用的语音技术,来自收购,还是阿里巴巴自身。浅雪回应:阿里巴巴很多年前就自己在做语音技术的研发。
中文语音交互的难点在于中文的语义理解。阿里人工智能实验室研发的中文语义理解引擎针对常用的定时、提醒、天气、娱乐内容、家居控制、助手以及购物等领域进行了特别优化,仅天气预报就能够理解786种中文问法。通过深度机器学习,“天猫精灵X1”已兼容20个领域的自然语义理解。此外也更多考虑到中文语言对话过程中的各种实际案例,对北方话的儿化音,干净利素的问法,小朋友经常叠字叠词,南方话某些与普通话混淆的中文表达方法进行了深度处理。
这套语义理解系统还带有记忆功能和强大总结归纳能力,还加入了模拟的“长期记忆”和“短期记忆”功能,能够针对不同的场景和时间度,让语义理解系统更加贴近用户。除此之外,阿里人工智能实验室还已经着手其他多个语种的研究。
事实上,能够通过语音来完成网购,必须依赖声纹识别技术——用户先将自己的声音注册后生成声音密码,与机器绑定后,确认开启声纹购功能。随后,当你说出 “帮我买一箱可乐”这样的需求时,“天猫精灵”会要求用户跟着念一串随机数字进行声纹校验,如果确认为用户本人,“天猫精灵”会从用户绑定的支付宝中进行扣款完成交易,如果没有通过声纹校验则拒绝执行。
在“天猫精灵”——这个直径83毫米的小圆柱里面,用户看不到的,是第一代人机交流系统AliGenie。由阿里巴巴的科学家团队研发,应用了积累多年的自然语言理解和处理技术。当天,阿里人工智能实验室还同时发布了面向开发者和硬件厂商的AliGenie开发者平台。
未来,基于这个平台生长出来的一切商业模式,都将为阿里巴巴的财报带来新的亮点。在数学中,“X”代表未知数和变量。“天猫精灵X1”作为中国消费级AI产品的开端,充满着未知和变量。这也是阿里人工智能实验室推出的第一款产品命名为X1的原因。
这款看起来有可能开启新大陆的智能音箱,售价为499元。业内人士分析,这个售价应该还是能赢利的。虽然记者们也都没有拿到测试样机,已有很多人表示想购买,“这个价格,就当给孩子买个玩具了”。
浅雪说:“我觉得我们现在做的事,和当年初创的淘宝一样,是充满乐趣的。”