统计数字会撒谎-第6部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
假设智力测验的可能误差为3%,与我们假定的步量任务具有相同的可能误差。这与智力测验的好坏无关,而只是反映了测验与它所要测试的内容具有怎样的一致性。这样彼德的智商更全面的表达是98±3,琳达的智商则是101±3。
这说明彼德的智商以相等的机会落在95~101中任何一点上,并且大于或者小于98的可能性完全一样。同样,琳达的智商落在98~104范围内的可能性也不过50%。从中你会很快发现:有1/4的可能性彼德的智商将超过101,这与琳达的智商低于98的可能性相同。这样看来,彼德的智商并不低于而是高于琳达的智商,它们之间还有3分的差距。
我们的结论是:对待智力测验以及许多其他类似的抽样结果应注意它的范围。正常的智商不应该只是100这样一个数值,而应是诸如90~110的一个范围。将处于这个范围的孩子与低于或高于此范围的孩子进行比较时会得出一些有用的结论。但比较相差不大的两个数据则毫无意义。你必须在脑中牢记这个加减符号,即使(特别是当)它没有明确给出。
在所有抽样研究中都有误差,忽略这些误差将导致一些愚蠢的举动。那些把读者调查奉若神明的杂志编辑,是因为他们不了解调查。对于一篇有40%男性读者喜爱的文章与另一篇只有35%男性读者喜爱的文章,他们会刊载更多类似于前者的作品。
对于杂志而言,40%与35%读者人数的差异是很重要的,但抽样调查形成的差别却并不一定是真实的。出于成本的考虑,读者人数调查的实际样本,特别是已经扣除了那些从来不读该杂志的人后,也许只有几百人。对于一本女性杂志,样本中的男性读者会很少。当这些人又根据他们的回答:“全部读了”、“读了大部分”、“读了一部分”以及“没看”这篇文章而被划分成四组后,35%男性读者的结论也许仅仅建立在几个人基础之上。隐藏在这个看似显著的数据背后的误差可能会很大,依靠它抉择的编辑并没能抓住一根救命的稻草。
为了一个数学上可论证,但是却小得没有意义的差别,人们有时会费尽力气。这种行为藐视了一句古训:只有当差别有意义时才能称之为差别。我们可以看一个相关的案例:老黄金(Old Gold)香烟公司利用一个毫无价值的结论制造了大量喧闹并大赚了一笔。
故事起源于《读者文摘》(Readers Digest)某编辑的一个偶然想法。该编辑自己抽烟,而且他并不认为各种品牌的香烟完全相同。他的杂志开始行动起来,聘请了一些实验室人员对不同品牌香烟的烟雾展开了分析。杂志刊登了最终结果,列出每种品牌香烟的烟雾中尼古丁以及其他有害物质的含量。在详尽的数据支持下,该杂志声明:所有品牌的香烟是一样的,无论你吸的是什么牌子的香烟,不会有任何差异。
也许你会认为,对于香烟生产厂商和那些为香烟杜撰崭新广告词的家伙而言,这是一个有力的打击,它还将引爆关于平缓喉痛和对胸部有益的广告索赔案。但某些人却有了其他发现,在一长串具有相同有害物质的品牌名单上,总有一个排在最后,这就是“老黄金”牌香烟。于是,电报漫天飞舞,大幅广告以最大的字体刊登在报纸上。广告的标题和副本仅仅提到,由一家国家级杂志主持的实验证明“老黄金”牌香烟在不良物质,以及尼古丁含量方面“排名最后”,任何关于各个品牌的差异并不显著的文字甚至是暗示都被省略了。
最后,“老黄金”公司被通知“中止并停止”使用这个具有误导性的广告。但这并不要紧,他们早已获得了足够的好处。
本章小结:
◆我们可以定量地衡量你的样本能以多大的精度代表总体,那就是:可能误差和标准误差。
◆在所有抽样研究中都有误差,忽略这些误差将导致一些愚蠢的举动。
◆只有当差别有意义时才能称之为差别。
txt电子书分享平台
令人惊奇的图形
第五章 令人惊奇的图形
人们对于数字似乎有一种天生的畏惧,当汉普蒂?汤普蒂(Humpty Dumpty)译者注:Humpty Dumpty在英语俚语中是指“又矮又胖的人”。充满自信地告诉爱丽斯(Alice),他能熟练地驾驭文字时,恐怕没有多少人能将同样的自信延伸到对数字的掌握上。也许早期的数学经验对我们造成了心灵的创伤。
不管什么原因,当作者渴望自己的书有人读,广告商希望自己的广告能促进商品的销售,出版商希望自己的书或杂志畅销时,数字产生了真正的问题。很多情况下,表格中的数字是禁用的,而文字又不能达到很好的效果,这个时候解决的方法就只有一种:画图。
最简单的统计图形是直线类图形。在显示趋势时,直线图形非常有用。而对于趋势,人们总是津津乐道于了解它、发现它、分析它,甚至预测它。下面,我们将用图形来显示国民收入怎样在一年内实现了10%的增长。
首先,在纸上用相互垂直的直线画出许多小方格。然后,在横轴的底部注明月份,在纵轴旁标上数字,单位是“十亿美元”。在图中点出每个月的国民收入,再用直线将这些点连接起来,你的图形看起来像这样:
这张图清晰地显示了一年来的变化,而且变化是逐月反映出来的。然而画图者很快就会发现,由于图形纵轴从原点即“0”开始,并且整张图形是按比例绘制的,虽然看上去的确上升了10%——一个了不起的上涨趋势,但是却并不振奋人心。如果你所要做的仅仅是传递信息,那么目的已经达到了。但假如你希望利用图形赢得一场争论、让读者大吃一惊、促使某项行动,或者向他人推销货物等,它就缺乏渲染的效果了。试试把图形的底部抹去,这样不是更好吗?(如果某个爱挑剔的家伙反对这种有误导的变动,你可以理直气壮地指出,这样做节省纸张。)数据是相同的,所以图形也相同,除了图形给人留下的印象不同之外,没有进行任何的伪造。但是粗心的读者现在所看到的是国民收入直线在12个月内上升很快,几乎占据了半张图形,不过,这其实仅仅是因为图表的大部分都已被抹去。就像语法课上遇到的省略句,它们也能被“理解”。但是,眼睛却不能“理解”被抹去的部分,这才导致微小的上升最终变成了惊人的增长。
既然已经开始行骗,那么就别急着金盆洗手。你还有比之好得多的方法,它能使朴实的10%的增长率看上去比100%的增长率更让人振奋。只需要改变横坐标与纵坐标的比例关系,将纵坐标的每一个刻度缩减为原来的1 /10即可,没有人规定不能这么做,而这将会产生一张更加完美的图形。
它真的令人震惊!不是吗?任何看到这幅图的人都会强烈地感觉到在国家的各条经济命脉上正快速地积累着大量的财富。这相当于将“国民收入增长了10个百分点”改写成“国民收入惊人地攀升了10个百分点”。显然图形比文字更有效,因为图形中不存在任何形容词和副词来破坏它所具有的客观性幻觉,而且谁也无法指责你。
你还会有一些著名的或至少是受人尊敬的同伴。某家新闻杂志采用同样的方法来表现证券市场创了新高,他们将图形的底部截去,使得图形中的增长比实际情况更加令人欢欣鼓舞。在一则关于哥伦比亚煤气公司(Columbia Gas System)的广告中有一张复制的、 “来自最新年报”的图形,如果仔细阅读图中的数字并进行分析,你将发现10年来生活指数上升了60%,而汽油成本下降了4个百分点。这是一张不赖的图形,但是对这家公司而言显然还不够理想,于是他们将图形顶部截至90%的刻度(纵坐标没有断层,也没有任何文字说明来提示所做的变化),以至于单纯通过观察得出的结论是:生活指数是原来的3倍,而汽油成本则下降了1/3。
为了罗列公众反对工资增长的意见,钢铁公司使用了类似的误导性图形。然而它根本称不上是新方法,人们很早就揭露了其不完善之处,并刊登在许多地方,而不仅仅是统计专业者使用的技术刊物中。早在1938年,《丹斯评论》(Dun’s Review)的某个编辑就曾经摘录了一张类似的统计图,该图形出现在一则鼓吹华盛顿广告业的广告中,图形的标题是:“政府支出急剧上升!”尽管图中的折线与标题中的感叹号遥相呼应,但是折线后隐含的数据却并不乐观,仅仅从19,500,000美元增长到20,200,000美元。但是图中的那根红色折线从底部激增至顶端,将原本仅仅4%的增长率描绘得仿佛是400%。该杂志利用相同的数据绘制了图形的另一版本,图形的标题是:“政府支出保持稳定”,图中的红色折线客观地反映了4%的增长率。
《矿工》杂志在报纸广告的柱状图中也使用了相似的技巧,但特别用文字指出:柱状图的中部被省略了。
本章小结:
◆最简单的统计图形是直线类图形。在显示趋势时,直线图形非常有用。
◆数据是相同的,所以图形也相同,除了图形给人留下的印象不同之外,没有进行任何的伪造。
◆只需要改变横坐标与纵坐标的比例关系,将纵坐标的每一个刻度缩减为原来的1 /10即可,没有人规定不能这么做,而这将会产生一张更加完美的图形。
◆显然图形比文字更有效,因为图形中不存在任何形容词和副词来破坏它所具有的客观性幻觉,而且谁也无法指责你。
一维图形的滥用(1)
第六章 一维图形的滥用
几十年以来,我们一直听到“小人物”这种说法,它其实指的就是我们自己。当人们觉得这个词过于卑微后,就改用“普通人”,但很快这个提法也被遗忘了。但是“小人物”仍然跟随着我们,扮演着统计图中的角色。
用一个小人来表示成千上万的人,一个钱袋或一堆硬币表示一千英镑或者百万美金,一片牛肉表示明年牛肉的供应量,这些都是形象的图形表达。由于这种图形非常吸引眼球,所以可以作为一种有用的工具,但同时它也能摇身一变,成为一个老练、狡猾而且成功的骗子。
形象图形,又称为象形图,它的前身是普通的柱状图,在比较两种或两种以上事物某个方面的具体数量时,柱状图是一种便捷常用的方法。但是柱状图也具有欺骗性:在描述单一物体时,柱体改变宽度的同时,长度也发生变化;在描述三维物体时,物体的体积又不容易进行比较,以上任何一种情况都提醒我们应该对柱状图保留一些怀疑。一个被截短的柱状图与我们曾经讨论过的被截短的折线图实乃一丘之貉。柱状图通常出现在地理书籍、公司声明以及新闻杂志中,也是因为它“迷人”的特性。
如果我想比较两个数据,例如英国与罗坦提亚(Rotundia)某工种工人的平均周工资,假设数值分别为30英镑和15英镑。为了利用它吸引你的注意,我不会仅仅满足于将数字打印出来,而是画了柱状图。(顺便提一句,如果你去年为了给游廊做一个新扶手而支付的大笔工钱,与这的30英镑不一致的话,请记住你雇用的工人并不是每周都会有这么好的收入。而且,毕竟这里我也没有指明使用了哪种平均数以及是怎样计算得到的,因此它不值得你去争论。瞧瞧,只要你省略了其他一些信息,那么伪装哪怕是最声名狼藉的统计资料又是多么容易呀!也许,你会怀疑我为了举例编造了这个数据,但我敢肯定,如果这里用的是英镑,你就根本不会有这个念头。)
这就是柱状图,其纵轴的上方注明“英镑/平均每周”。这是张清楚且忠于事实的图形,正如收入是1∶2的比例关系一样,图中两根柱体的比例也是1∶2。
然而这张图形并不吸引你的眼球,不是吗?我可以用比柱体看上去更像钱的东西——钱袋来加以改善。一个钱袋表示不幸的罗坦提亚人微薄的收入,两个钱袋表示英国佬的收入;或者3个表示罗坦提亚人的每周收入,而用6个表示英国佬的每周收入。不管哪种方式,这种图仍然沿袭了真实可信的风格,它不会因为你只是匆忙的一瞥而欺骗你。
我有其他的目的,我希望说明英国工人比罗坦提亚工人的境况好得多,因此15与30之间的差距渲染得越大,我的论据就越充分。老实说(当然这种话我并不会真正说出口),我希望你能从中推断出什么,或者留下一个夸张的印象,而我又不会因此惹上麻烦。下面介绍一种方法,这种方法几乎每天都被用来愚弄人。
我随手画一个钱袋用来表示罗坦提亚人的15英镑,然后再画一个高两倍的钱袋代表英国佬的30英镑。还是1∶2的比例,对吗?
但是现在却达到了我所追求的直观感受——英国佬的收入使得罗坦提亚工人相形见绌。
奥妙的关键在于,既然第二个袋子比第一个高一倍,也应该同样宽一倍,那么占用纸张的空间就不是2倍而变成4倍。数字全是2∶1,但视觉效果却是4∶1,而在大多数时候视觉效果起着决定性的作用。更糟糕的是,既然实际事物往往是三维的,那么第二个袋子还应该比第一个袋子厚一倍,几何知识告诉我们:相似物体体积的变化等于任意相似边长度变化的三次方。于是,2乘2乘2等于8,如果一个钱袋里有15英镑,另一个钱袋里面就不仅仅只装了30英镑,而应该是15英镑的8倍,即120英镑。
一维图形的滥用(2)
这就是我这富有创造性图形的威力!明明说的是“2倍”,我却最终让你留下了令人震惊的8倍的印象。
想要怪罪于我,可不是那么简单,因为我只不过在跟风随大流。一家新闻杂志的领头羊也曾经反复使用过类似的钱袋。
美国的钢铁协会(the Iron and Steel Institute)也这么做了,不过用的是一对鼓风炉。他们希望通过图形显示20年来钢铁产量有了大幅度的提升,说明该行业表现出色,从而指出政府的任何干预都是不必要的。暂且不论这个论点