在微博上“赞一下”感兴趣的消息,或是在论坛里顶起中意的帖子,似乎已经成为最偷懒的网络互动方式。近来的研究却发现,当人们在社交网站上大发好感时,往往已经将自己的政治倾向、宗教态度、婚姻状况和性取向等信息暴露了。
网络检索词和社交网站信息正迅速成为科学家青睐的海量数据库,越来越多的研究者尝试筛选这些信息,以研究人类活动中某些微妙的模式及关联。这项发表于美国《国家科学院院刊》的研究则通过对5.8万名社交网站“脸谱”的用户进行调研,揭示了数字化人口特征的威力与威胁。
执掌此项研究的英国剑桥大学心理学家米加尔·科辛斯基表示,基于“赞一个”的数据可以作出非常精密而个体化的预测,“人们在网上叫好时并没有意识到,自己其实是在暴露非常私密的信息。”
“脸谱”的广大用户“可圈可点”的范围大到一项公共政策,小到一部电影或邻居晒出的猫咪照片。在此项研究中,调研对象已经挂在网上的赞好信息多达人均68次。研究者利用人口统计、行为问卷和心理学测验获得关于网络用户的数据,并将这些数据与他们的网上“赞好”进行分析比较,以确定是否可以仅依靠用户的赞好模式预测其个人信息。
结果显示,尽管并非百发百中,但通过“赞一个”得出的预测在很多方面的精度堪比个人测试。
比如,研究者发现,如果一位用户对美国德克萨斯州奥斯汀市、电影《绝地奶霸》和“恋爱只是两个人的事,与他人无关”的论调竖起大拇指,再联合其他几个赞好项目,便可得出该用户“嗑药”的结论。相应地,如果有人“赞”了游泳、奥利奥碎屑冰激凌和“脸谱”网站上名为“穿着袜子滑地板”的网页,他就不太可能服用禁药。
至于数据模型的预测精度,研究者表示,通过赞好信息的组合预测用户倾向民主党还是共和党的准确率可达85%,判断其是黑人还是白人的准确率可达95%,而对男性用户是否同性恋的分辨率可达88%。
“脸谱”公司公共政策经理弗雷德里克·沃伦斯则认为,利用公开的赞好信息分析用户及其需求并没什么可大惊小怪的,营销专家和社会科学家从很早以前就开始使用网络信息预测使用者的个人特质了。实际上,网络用户大大方方晒出来的赞好信息已经为一些点对点的精确营销创造了商机。
尽管如此,美国纽约大学信息法律研究中心主任海伦·尼森鲍姆还是提醒人们在公开表态时多留个心眼:“很多人在同意提交某些信息时,并没有想到旁人从这里面能推测出什么。”