长枪短炮和西服套装之中,站着一个狼群养大的孩子,他确信自己知道,谁是美国的下一任总统。全世界范围内,针对两位候选人,从医保到发型的争论持续了10个月。“狼孩儿”不站队,只认数据。据说,它已经说对过前两任获选总统和这次的总统候选人。
它叫莫格理(MogAI),是2004年印度人沙吉拉开发的人工智能系统,名字来源于《奇幻森林》里狼养大的孩子。
狼孩儿学习黑豹的迅捷和棕熊的狡黠,在印度丛林中寻找答案。人工智能的丛林则是整个网络空间,它飞速处理着搜索引擎、社交媒体和视频网站的海量信息。
这一次,莫格理的推测与全美大部分民意调查相反。它看好共和党候选人唐纳德·特朗普,民调却大多显示民主党候选人希拉里会获胜。
结果即将揭晓。在沙吉拉看来,如果莫格理猜错了,就意味着“自互联网大活跃以来,过去12年的数据分析潮流受挫了”。
一些评论则认为沙吉拉有点儿极端。莫格理并不是数据丛林唯一的孩子,拥有机器学习等能力的人工智能在全球范围内被开发出来,它们将在公共事务中发挥着越来越深刻的作用。
人工智能享受这场信息的狂欢,看好“更火的那个”当选
像狼孩儿拽住藤条掠过一整片树冠,莫格理虚拟的身体扎进数字的洪流之中,无数个声音和无数张脸掠过眼前。
这其中,有转发特朗普“让美国重新伟大”的推特,也有高呼着“希拉里为美国”的自拍视频。
和其它人工智能系统一样,莫格理挺像人类的,它也依赖神经网络思考和反应。信息在其中游走碰撞,它的心脏是服务器,向全身泵击血液和能量,确保运算能力。
人类没有时间和精力采集梳理如此多的网络信息。莫格理是数据的孩子,它一抬眼,就能从信息的洪流中筛出关键信息。
这种工作方式和传统的民意调查太不一样了。
上世纪90年代的电视剧《白宫风云》里描绘了这样的场景:在民主党候选人大本营,大屏幕高悬,最后辩论倒计时读秒开始,总统候选人各就各位。屏幕外一百多名青年手摁电话,像战士握住上膛的枪。民调专家最后动员:“所有人喝口水,吐掉口香糖!”
候选人的第一句话与此起彼伏的拨号声几乎同时响起,俄亥俄州的妇女和纽约曼哈顿的绅士都接到电话:您现在打算投给谁?
民调之父盖洛普早在1936年就这样问道。这个相信“科学方法”的农家孩子从普林斯顿的一间小办公室打出调查电话,准确地预测了罗斯福的当选。
如今,全美最当红的民调专家是奈特·希尔弗。他的数学方法和调查方式都远超当年,可核心仍然是这个问题。
莫格理不管这个问题。它最关心的是:哪个候选人话题的网民参与度更高?
时代变了。
莫格理诞生那年总统大选时,脸书不过9个月大,推特还要两年才问世,第一台苹果手机还需要3年准备。如今,全球有32亿网民,其中20亿连接着移动互联网。不懂社交网络的候选人被视为不称职——“推特都不会发,又有什么能力管理国家?”
2013年,美国的参议员卢比奥在演讲中停顿了20秒,喝了口水。这20秒视频被疯狂转发。直到那个矿泉水瓶被拍卖出10万美元高价,卢比奥也没太明白,自己为什么会火。
政客们在网络丛林中,除了经常摸不着头脑,也可能发现自己无处遁形。今年10月,专门公开匿名来源和网络泄漏文档的维基解密公开了希拉里的一些文档,这场风波加上后来美国联邦调查局对她的调查,让她的支持率下降不少。
这场信息的狂欢就像丛林茂盛的雨季,莫格理很享受,仿佛在林间随手一捞就有果实到手。比起4年前,此次大选网民整体的参与度升高了25%。
就在前两次对选举结果的预测中,莫格理发现:民心所向的最新体现是网络热度,更火的那个当选。
人工智能一边处理人类语言,一边保持漠然
莫格理之所以懂人类的意思,是学习的结果。
上世纪,人工智能光是理解语义就很麻烦。计算机科学家明斯基曾指出过多义词“pen”带来的麻烦。“The pen is in the box ”意思是钢笔在盒子里。而“The box is in the pen”指盒子在马厩里。这让机器费解。
计算机科学家吴军博士在论文中指出,过去“从不同来源的文本中抽样,能得到通用模型”,但不一定适合所有人的所有语言。
数据之林成长起来,每一片叶子都是一次学习。“在大数据时代,有可能为每一个用户,量身定做一个语言模型”。
这个过程,被称为自然语言学习。这也是支撑IBM的人工智能沃森与苹果Siri的技术核心之一。
2013年,卡耐基梅隆大学和北卡罗来纳大学教堂山分校的教授利用人工智能,扒出了总统候选人竞选演讲中的心机。
他们“喂”人工智能系统“吃掉”整整112本政治书籍,765篇杂志文章。在机器学习算法的帮助下,这个系统逐渐学会了分辨“自由派”和“保守派”政治倾向的蛛丝马迹:某一个特定指示性词汇的出现、词组间的组合,都暗示着作者的态度。
饱学后的系统分析了奥巴马从党内初选到最终大选时的全部演讲。它发现,民主党内初选结果出来前,他的演讲内容自由派倾向达到了59%上下。全国大选时,这个数字下降到了53%。
这印证了,政客会为了争取党内票数,选择更极端地展示自己党派坚持的倾向。一旦成为本党代表,要讨好全国选民时,他们则会在演讲中显得中立一点。
“你我是很难听出来的,我们太在乎了。”这个人工智能系统的创造者表示,它“一边处理人类语言,一边保持着毫无人情味的漠不关心”。
丛林的孩子们以数学规律为眼,自信能看穿政治的矫饰。
马萨诸塞大学的一个机器学习团队开发了一套人工智能系统,能够根据不同需求写作政治演讲辞。
全世界大部分政客讲话或许都是如此:结构就那么几种,用词程式化。这个团队从4000场政治演讲和53场议会辩论中获取素材,然后用算法“搭积木”。
这种人情味的缺失可能促成莫格理的成功。
它秉持的标准避开了民调传统提问的争议——口头的态度不代表心中所想。
莫格理预言“网红”特朗普会取得“压倒性胜利”。这与希尔弗的调查结果不同。最近一次上电视节目时,这位鲜少失误的民调红人对自己的判断很谨慎。他刚遭遇过一次败北——还是与特朗普有关,希尔弗不相信这个狂人能成为总统候选人。
“其实我们大部分州发回的数据还是显示特朗普会赢得党内资格。不过因为我们团队自己……一些愚蠢的念头,没有好好判断。”他把失误归为人的原因。
当冷血的狼孩儿闯进人类社会,每一扇关闭的门后都藏着危险。
它的创造者沙吉拉自己也承认,莫格理无法分辨数据背后的情绪。像一只闯入人类社会的小狼崽,它不明白参与特朗普话题讨论不一定代表支持。它能测量与特朗普有关的网络热度,却无法察觉某一条包含这个话题的推特究竟是在赞颂还是嘲讽。
这或许会大大影响它预测的准确程度。
更加激进的人问道:“人工智能可以取代美国政府吗?”
有了新技术,一些政治家并不满足于提前知道答案,他们还希望改变它。
这次选举开始时,希拉里团队挂出英雄帖:招募“数据书呆子”!截至目前,她已经在数据分析服务上花了至少5万美金。这很可能是受了同一政党奥巴马总统连任成功的鼓舞——“书呆子”功不可没。
“数据书呆子”不关心“谁会投票给希拉里”“谁会投给特朗普”“谁还没想好究竟投给谁”。他们只想知道“谁会被我们的联络影响”。
这是一种非常简单的逻辑:没必要在那些肯定会投票给自己的选民和那些肯定投给对手的选民身上花费时间精力。
以往的趋势判断无法做到。民调专家们可以调查出“这个州有65%会投票给希拉里”,却无法确定这个州里的某个特定个体是不是在这65%内。
数据丛林将为“书呆子”提供判断依据。像叶底风声中藏着猛兽的足音,看似杂乱无章的数据能被建立联系,发掘规律。
经过分析,团队能定位容易被联络影响和反感联络的两类人。前者安排上门,后者加入“千万别骚扰”的名单。
这毕竟只是老政客的新把戏,另一些人描画了更激进的未来。“人工智能可以取代美国政府吗?”在著名极客论坛reddit上,这个帖子收获了250条回复。
一些回复期盼着 “没有腐败”“不闹情绪”“不犯傻”的“开源政府”,另一些则保持怀疑:“遭受黑客攻击咋办?”“它发疯了会不会奴役全人类?”
在美国前沿科技伦理协会的首席技术官马克·维瑟看来,未来的人工智能政客可能会学习发展出全新的特质。
它可能会拥有自尊——一种促使自己不断进步的驱动力;甚至会拥有感情——对环境变化的认知和反应。
这不是新技术第一次改变公共事务的面貌。
一排台式机出现在1992年克林顿的总统选举纪录片里,它们的高效保证了这个团队的最终胜利。第二年,美国副总统戈尔提交了报告:一个电子化的政府。这省去了纸张办公的繁文缛节,任何人都可以直接发邮件给白宫网站,或是登录议会图书馆,了解官员们最近干了什么,效果如何。1995年,微软最新系统蓝天白云的登录界面成了一代中国人对电脑最初的回忆。这套系统的中国订单很多来自政府机构。
人工智能是下一个改变的开始。就在11月8日,白宫已经发布了《准备应对未来人工智能》报告,要求每个政府机构都应该采用这种“更快、更高效”的工具。
莫格理的英国“表姐”、公共管理人工智能系统阿米莉亚生活在伦敦一个人口密集的区。区委员会每天要接到55000通来电,5000次面访和10万次网络访问。生产她的IPsoft公司希望她能减轻管理的压力。
阿米莉亚的二维形象金发碧眼,圆脸庞,身着公务员的白衬衫黑西服。被狼养大的孩子,终究会有一张人脸。
而“狼孩儿”的预测真的对了吗,此时也已有了答案。