去年9月,大众汽车曝出丑闻,该公司在车辆中安装了作弊软件,可以自动判定汽车是否处于尾气检测状态,并控制尾气的排放,以便通过车检。美国“环保局”,完全蒙在鼓里。
最终“出卖”大众公司的不是别人,而是自己生产的汽车——整齐划一的好数据直觉上就让人感到不对劲。“环保局”的工作人员就是从这个现象入手,顺藤摸瓜找到了原因。
日常工作中,如果一件事发展得太过顺利,我们也总会隐隐觉得有哪里不对,这样的直觉是有道理的。澳大利亚和法国的研究者们最近在期刊《英国皇家学会学报A》上发表了一篇名为《好得难以置信:压倒性的证据也会失效》的文章,说明了为什么当所有的证据都指向同一个结果时,它反而可能有问题。他们称之为“一致性悖论”。
听起来违背常理。我们一般认为当所有人看法一致时,真相应该就是如此,毕竟不可能所有人同时出错。论文并没有反对这个观点,而给它加了一个前提:系统零偏差或是接近零偏差。简单说来,就是每个个体出错的概率很小,例如在一堆香蕉中挑出一个苹果,几乎不会有人犯错。
但在嫌疑人指认的过程中,系统偏差无法避免。如果目击者只是在嫌犯逃跑时匆匆瞥了一眼,他们认错人的概率将高达48%。
实际上,哪怕只是很小的偏差,也都会对最终的结果产生极大的影响。即使辨认过程中只有1%的情况出现偏见,当超过3人的意见完全一致时,他们正确的概率也会显著下降;若6个或更多证人意见相同,他们指认出真凶的概率甚至低于60%——接近随机指认的结果。而这个偏见产生的原因,可能仅仅是警方无意的行为被证人误读。有趣的是,如果此时出现一名证人与其他人意见相左,那么其他人意见正确的概率反而大大提高。
这就像我们抛硬币时,如果得到硬币正、反面的次数相差过大,我们会认为这枚硬币有问题,而不是概率定律出了差错。同样地,所有证人意见一致的概率其实很小,这种情况下,更有可能是系统出现差错。
DNA检测在刑侦领域一直被认为是铁证,每个人的DNA序列都是独特的。谁也没有想到,有一天DNA证据反而成为了困扰。在上世纪90年代到本世纪初,欧洲警方在法国、德国、奥地利等地的15个犯罪现场都发现了同一个女性的DNA。起初侦探们非常激动,以为终于抓到了这条“大鱼”。这个轰动一时的神秘连环杀手被称为“海尔布隆魅影”,笼罩在欧洲长达15年之久,最后警方啼笑皆非地发现,警方用于收集DNA的工具被污染了,这个追踪已久的“凶手”,其实只是棉签制造厂的一位女工。
正是因为人们太过相信技术,才会造成“一致性悖论”。
走弯路的还有计算机科学家们。在加密技术中,一般认为错误率低于2的负128次方才是可接受的。我们通过各种技术和算法努力提高加密的等级,却忽略了实际操作中的问题:计算机元器件本身有一定概率出错,甚至一束来自遥远太空的宇宙射线都会影响计算,这种情况每个月出现的概率是10的负13次方,远远大于要求的错误率。这就导致了一个尴尬的事实,加密协议宣称的安全程度越高,反而越容易受到各类故障的影响。下一次遇到宣称自己算法保密程度高的广告,不妨反问他有没有解决宇宙射线的问题。
“一致性悖论”不仅可以帮助我们走出难以解释的困境,在鉴别真伪上也卓有成效。在所有实验科学的研究中,背景噪音几乎是无可避免的,种种系统误差会让结果产生一定的异常。但在科学史上,不少实验看起来都有点好得过头了,例如密里根油滴实验和孟德尔的豌豆遗传实验,由于实验数据太过美观,没有任何异常值,许多学者都怀疑结果是编造的,或是经过人工精心挑选。了解了“一致性悖论”,我们就再也不会被社会调研、数据普查,甚至是会计报账中的猫腻和手段欺骗了。
读完论文,我不禁佩服古罗马人的智慧。在古罗马法中,如果所有的法官都认为嫌疑人有罪,他反而会被赦免。那个年代的人们也许不懂高深的数理逻辑,但立法者已经注意到,全体一致的判决往往意味着司法过程中,甚至司法系统内出现了问题。看来,人多不一定可靠。
王嘉兴