9月7日,一篇名为《户均资产247万透视学术糟粕和浮躁》的文章在网络上引发讨论。文章的作者是英国诺丁汉大学当代中国学学院院长、经济学教授姚树洁。文章的矛头直指西南财经大学中国家庭金融调查与研究中心(以下简称CHFS)在《中国家庭金融调查报告2012》中公布的一组数据:在城市样本中,10%的最富人群,占有所有财富的90%;中国城市户均资产高达247万元人民币,中国全国城市的资产超过美国总资产的21%。
“中国城市户均资产高达247万元人民币”的说法引起了公众热议。这样的数据到底可不可信,公众该如何理解这些统计数据?
姚树洁说,根据CHFS样本的数据,他计算的结果是,中国城市户均资产只有76万元。
姚树洁认为,CHFS的统计有问题:一方面,样本太小,只有8000多户,不能用以推断全国2.5亿户的城市人口。另一方面,有的调查员不负责任,难以保证数据的可靠性。
对姚树洁的质疑,CHFS给予了回应。关于样本的选取,调查组负责人甘犁说,调查结果是否科学并不完全取决于样本的大小,随机性更加重要。只要差异性能够反映整体,那么8000样本量就足以说明问题。
中国社科院社会学所社会发展室主任李炜介绍说,样本大小的选择取决于计算的是哪一个指标,如果计算某一种社会态度,取值区间是0%到100%,8000户的代表性应该是足够了,因为它的误差会小于1%。但是如果要计算一些数值,比如收入和房价,它们的取值区间可以从0元到无限大,这个时候需要的样本量就远不止8000户了,像国家统计局做的劳动失业率调查,样本量都是十几万甚至上百万。
对于调查的专业性,甘犁回应,他们的访员均为西南财经大学的本科生、研究生。他们有良好的专业基础,并且经过了严格系统的培训、考核。
姚树洁指出,CHFS最不靠谱的地方在于,它连自己的数据都没有算对。姚树洁在文章中列举多处CHFS报告中计算不周全的问题。
对姚树洁的疑问,甘犁认为彼此的算法存在差异,“要全面了解资产情况,需要同时知道均值与中位数。均值反映了社会总体的财富状况,而中位数则更多地反映了分布的情况,两者差距越大,表明财产分布越不均”。
据CHFS公布的数据,中国城市家庭的平均资产为247万元,总体上反映了城市家庭拥有较大的财富;但中位数仅为40.5万元,表明仅有50%城市家庭的财产多于40.5万元。其中,只有14.3%的城市家庭,其财产多于均值的247万元。拥有超过1000万元资产的城市家庭的比例为1.8%,而有19%的家庭财产低于10万元。
现实生活中,我们面对的统计数据很多,如职工平均工资及其增长速度、房屋销售价格指数等等。当这些数据被公布时,公众往往惊呼“被平均”。如何去理解这种被冠以“平均”的统计数据?
李炜介绍说,在现实情况中,无论政府,还是相关学术机构作出的统计数据,结果出来跟公众的感受都会有差距。“我国城乡以及群体间的差别大,比如住房面积,如果只是算城市住房面积,不会太大,但是如果把农村和城市放在一起,农村的住房面积很大,包括院落、楼层等,这样平均下来,全国的人均住房面积就会大幅度提升。
在统计学中,均值和中位数是两个很重要的概念,均值就是平均数,反映统计总体的平均特征,中位数是指将各个个体的值按大小顺序排列起来,形成一个数列,处于数列中间位置的变量值就称为中位数。
李炜说,调查结果如果考虑周全的话,应该把均值和中位数都公布出来,让公众从多个角度理解数据的意义。中位数相对稳定,而均值会受特殊值的影响。在一个调查中如果一个人的收入极高,平均之后会把大家整体水平都往上拔,这样的结果就会让公众觉得脱离了实际的感受。
本报北京9月11日电