统计数字会撒谎-第3部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
记住下面这点是有益的:无形的误差与有形的误差一样容易破坏样本的可信度。也就是说,即使你找不到任何破坏性的误差来源,但只要有产生误差的可能性,你就有必要对结果保留一定的怀疑。事实上误差总是存在,如果你仍旧半信半疑,想想1948年和1952年的美国总统大选,它们已足够证明这一点。(1948年美国选举时,所有民调都显示###党的杜威会获胜,结果却是杜威败给了共和党人杜鲁门,这是美国历史上至今最大的“选举惊奇”。1952年美国大选,新闻传媒普遍看好###党竞选人史蒂文森,最终共和党候选人艾森豪威尔以绝对优势赢得这场选举。)
更远的例子可以追溯到著名的《文学文摘》(Literary Digest)的惨败,这件事发生在1936年。曾经准确预测了1932年美国大选的1000万个电话用户和《文学文摘》订户,他们又对1936年的大选结果进行了预测,他们向那个倒霉的杂志编辑信誓旦旦地保证:兰登(Landon)将在竞选中脱颖而出,并且与罗斯福(Roosevelt)的所得票数之比为370∶161。这样一个久经考验的调查群体怎么可能产生误差呢?但的确有误差,正如后来许多大学论文和其他史学分析人员所发现的,1936年就有能力购买电话和订阅杂志的人并不能代表所有的选民,至少在经济上,他们是一个极特殊的群体,是有偏的,后来证实他们中的许多人是共和党的选民。该样本选择了兰登,而全国选民却心系罗斯福。
最基本的样本是随机样本,它是指完全遵循随机原则从总体中选出的样本。总体即形成样本的母体。把索引卡片文件夹中每隔10个的名字抽出来,从许多纸张中任意抽出50张,在皮卡迪利大街译者注:皮卡迪利大街是英国伦敦市一条繁华的街道。每遇见的第20个人作为访问对象。(但需要注意的是,在最后一个例子中,总体并不是全世界的人,也不是全体英国人或者所有旧金山人,而只是当时在皮卡迪利大街上的人。一个进行民意调查的访问员宣称,她选择在火车站进行调查的原因是“在那里能遇到所有类型的人。”不过,不得不向她指出的是,某些人比如婴儿母亲的代表性并不足。)
随机样本的检验方法是:总体中的每个名字或每个事物是否具有相同的几率被选进样本?纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有不足之处,在很多情况下,获得这种样本的难度很大并且十分昂贵,以至于单纯考虑成本就会排除它。分层随机抽样是一个更经济的替代品,目前在民意调查和市场研究等领域中得到了广泛的应用。
为了获得分层抽样下的随机样本,你需要将总体按照事先已知的优势比例划分出不同的组。这时你就可能遇上麻烦:关于分组比例的信息可能并不正确。你对访问员进行指导,以确保他们调查到一定数量的黑人,按照这样或那样的比例调查属于不同收入阶层的人,调查一定数量的农民,等等。同时,每一组人中40岁以下和40岁以上的人数相同。书 包 网 txt小说上传分享
内在有偏的样本(5)
这听上去很不错,但实际上会怎样呢?在黑人还是白人的问题上,大部分时候访问员能够准确判断。但在收入分组时,他会出很多错。至于农民,你如何划分一个在城镇上班又有部分时间种地的人?即便是岁数的问题也会引起差错,为了确保准确性,访问员会挑选那些看上去明显小于40岁或明显大于40岁的人进行调查。在这种情况下,由于缺少40岁左右的人而导致样本有偏。你不可能获得可靠的结果!
除此之外,你如何在各层内部获得随机样本呢?最有效的办法是准备好每一层内部所有单位的名单,并调查那些被随机抽中的单位。当然,这耗资不菲。于是你转而进行街头调查,但由于遗漏了那些窝在家里的人而变得有偏;你在白天挨家挨户地上门调查,又把大部分上班族给弄丢了;转而改成晚上访问,又忽略了那些看电影和去夜总会的人。
民意调查最终将演变为一场与误差的持久战。所有信誉良好的调查公司始终战斗在第一线。调查报告的读者应谨记这点:这场战斗永远不可能取得胜利。在看到“67%的英国人反对”某事或其他类似的字眼时,应保留这样一个问题:67%的哪部分英国人?
阿尔弗雷德?C?金西(Alfred C。 Kinsey)博士近期出版的《男性卷》和《女性卷》也存在这个问题。书中的人虽然已经证实了是不折不扣的新潮人物,但是由于抽样过程与随机抽样实在差得太远,调查结果仍然受到了质疑。抽样名单包含了太多接受过大学教育的人(女性中该比例达到75%)和服刑人员,这已经够糟糕的了,但是更严重的缺陷是样本极有可能严重偏向于有自我宣传性行为倾向的人,而且人们很难察觉到这个缺陷。当谈论的主题与性有关时,那些沉默寡言的、对着满怀希望的访员说不,并对于那些将自己从样本中淘汰出局的人,他们与主动站出来说出全部的家伙在性行为上存在很大的差异。
布鲁克林学院(Brooklyn College)的A?H?马斯洛夫(A。 H。 Maslow)所作的一项研究表明:上述推断不仅仅是猜测。他的研究样本中包括了许多女学生,后来她们都主动参加了金西博士的访谈。马斯洛夫发现:一般而言,这些女孩子在关于性的问题上观念更开放而且有更多的经历。
当我们阅读金西的书,或者阅读任意一个近期关于性行为的研究成果时,关键的问题在于如何理解它,才能避免学习到一些根本就不是那么回事的东西。在任意一个基于抽样的研究中,这个问题都十分严重,当你将你的“大部头”或者主要的研究报告采用通俗的手法进行概括时,这个问题会更加严重。
首先,在与金西相类似的工作中,至少包含了3次抽样。正如以前所指出的,从总体中抽出的样本(第一次抽样)远不能称为随机抽样,因此可能对所有的总体都不具备显著的代表性。同样重要的是,我们还需要了解到:任何一个调查问卷都只不过是所有相关问题的样本(第二次抽样)。而绅士或者女士们所给的答案也只不过是他(或她)关于每个问题的态度或者经历的样本(第三次抽样)。正如在其他调查中发现的那样:由哪些人组成调查人员会对结果产生有趣的影响,金西的调查也可能如此。二战期间,美国民意调查中心(The National Opinion Research Center)派出了两组调查人员对某南方城市的500名黑人进行提问,问题只有3个。一组调查人员由白人组成,另一组是黑人。
内在有偏的样本(6)
其中一个问题是:“如果日本占领美国,你认为黑人的境况会得到改善还是变得更糟?”黑人组成的调查组,9%的被调查者回答“变好”,而白人调查组该比例只有2%。回答“变坏”的比例也不相同,黑人调查组只有25%,而白人调查组则达到45%。
用“纳粹分子”替代“日本”,两组的结果大体相同。
第三个问题试图探测被访者的真实态度,这种态度以前两个问题所表现出来的感受为基础。“你认为目前致力于打败轴心国(the Axis)比在国内进一步推进###更重要吗?” 在黑人组成的调查组中,选择“打败轴心国”的比例是39%,而白人组成的调查组则是62%。
这是由莫名因素造成的误差,恐怕其中最重要的因素是被调查者###对方说好话的倾向,当我们在阅读调查结果时必须考虑到这一点。在战争时期回答一个暗含是否忠诚的问题时,一个南方黑人对白人说了一些听起来不错但并不代表他真实想法的话,这不是很正常吗?当然,区别的起因也可能在于不同的调查人员选择了不同的对象进行交谈。
在上述例子中,结果如此明显有偏而导致毫无价值。你可以试着自己分析还有多少民意调查的结论,虽然并无有效的方法揭露它们,但却同样有偏,同样无价值。
一般而言,民意调查都带有一定方向的误差。就像前文所举《文学文摘》例子的偏差一样,如果对此表示怀疑,你还可以找到许多恰当的例子来证明。在《文学文摘》的例子中,与希望代表的全体选民相比,由于偏向了比平均选民收入更高、受过更多教育、信息面更广、反应更快、举止优雅、行为保守、更多固定习惯等特点的群体,而产生了误差。
为什么会这样呢?下面的例子将有助于你理解这一点。假设你是一个被分配到街道某个角落进行调查的人员,有两个看上去符合调查要求的人——年龄大于40岁的黑人农民——向你走来,一个人穿着干净###,上面打着整齐的补丁,感觉整洁清爽,而另一个人看上去肮脏、态度粗暴。为了完成工作,毫无疑问你会向更加符合要求的人走过去,而遍布城市其他角落的你的同事也会做出同样的抉择。
一些反对民意调查的最强烈的情绪来自于自由主义者或是左翼集团,他们普遍认为这些调查都是人为操纵的。这种观点背后的事实是:民意调查结果经常与那些思想开放人士的观点和意愿不相符合。他们指出,民意调查的结果选择了共和党人,但不久之后选票者却做出了相反的选择。
但实际上,正如我们前面所看到的,民意调查并不一定是###纵了,也就是说,并不一定要为了制造假象而恶意扭曲结果。样本有偏的趋势本身就可以自动地操纵结果,使其变得扭曲。
本章小结:
◆为了确保结论有价值,根据抽样得出的结论一定要采用具有代表性的样本,这种样本才能排除各种误差。
◆无形的误差与有形的误差一样容易破坏样本的可信度。也就是说,即使你找不到任何破坏性的误差来源,但只要有产生误差的可能性,你就有必要对结果保留一定的怀疑。
◆最基本的样本是随机样本,它是指完全遵循随机原则从总体中选出的样本。总体即形成样本的母体。
◆随机样本的检验方法是:总体中的每个名字或每个事物是否具有相同的几率被选进样本?
纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有不足之处,在很多情况下,获得这种样本的难度很大并且十分昂贵,以至于单纯考虑成本就会排除它。分层随机抽样是一个更经济的替代品,目前在民意调查和市场研究等领域中得到了广泛的应用。
◆一般而言,民意调查都带有一定程度的误差。
。 最好的txt下载网
精心挑选的平均数(1)
第二章 精心挑选的平均数
我相信你不是一个势利小人,而我也并不做房地产生意。但请让我们作这样的假定,并且假设,此刻你正在一条我熟知的街上看房子。对你的情况进行了初步判断后,我巧舌如簧、费尽心思地让你相信附近居民的平均年收入大约有10000英镑。也许这坚定了你要在此居住的信心,不管怎样,买卖最终成交了,那美妙的数字也被牢记在你的脑海。而且,既然你已经买下了房子——你有那么一点势利,当与朋友聊天时,你就会不经意地流露出你居住的地点:我住在一个相当棒的高收入小区。
一年左右过后,我们又见面了。作为某纳税者委员会的成员,我正在四处奔走,为降低税率、降低财产估价,或降低公共交通费用而呼吁。我的理由很简单,我们支付不起各种上涨的费用,毕竟,附近居民的平均年收入只有2000英镑。也许你会加入到我们委员会的工作中来——你不仅势利,而且还挺吝啬。但是,当听到那可怜的2000英镑时,你也禁不住大吃一惊。到底是我现在撒谎了呢?还是一年前撒了谎?
其实这两次你都无法怪罪于我,利用统计撒谎的妙处被展现得淋漓尽致。无论是10000英镑,还是2000英镑,它们都是正规的平均数,计算方法也完全正确。两个数字都基于相同的数据,来自相同的居民,根据相同的收入。所有都是相同的,但显然其中有一个数据令人误解,足以与弥天大谎相媲美。
我的花招就是两次分别使用了不同的平均数,“平均数”这个词宽泛的涵义帮了大忙。当一个家伙希望用数据影响公众观点,或者向其他人推销广告版面,平均数便是一个经常被使用的伎俩,虽然偶尔是出于无心,但更多的时候是明知故犯。所以,当你被告知某个数是平均数时,除非能说出它的具体种类——均值,中位数,还是众数,否则你对它的具体涵义仍知之甚少。
在希望数值较大时,我使用的10000英镑是均值,也就是附近居民收入的算术平均数。你只要将所有家庭的收入加起来并除以家庭总户数便可得到这种算术平均数。数值相对较小的是中位数,它告诉我们一半家庭的年收入超过2000英镑,另一半家庭的年收入不及2000英镑。我还可以利用众数——所有家庭收入序列中出现次数最多的那个收入。例如,附近的居民中年收入为3000英镑的家庭数是最多的,那么收入的众数就是一年3000英镑。
在这个例子中,不合适的“平均数”实际上是毫无意义的,只要碰到关于收入的数据,这种情况就经常出现。还有一个因素会让我们困惑不已——某种条件下,各种类型平均数的数值十分接近,如果出于一般的目的,根本没有必要区分它们。
比方说,当你看到某个原始部落男性的平均身高为5英尺时,你对这些人的外形条件就能有很好的了解,根本不需要进一步询问这个平均数是均值、中位数或者众数,因为此时各种平均数的数值大致相等。(当然,如果你正在为非洲人赶制一批###,那么就需要比平均数更多的信息,你要用到全距和标准差,这些我们将在下一章进行介绍。)
在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有我们常说的正态分布的形态特点,在你用###绘制正态分布时,将看到一根钟形的###,均值、中位数和众数都落在相同的点上。书包 网 。 想看书来
精心挑选的平