数字往往给人精确、“诚实”的印象,但事实上,生活中我们却常常被数字欺骗。

  1. 数字来源不清。凡是不给出确切的数字出处的,都是耍流氓。下列这些说法都要小心:据调查发现、有研究表明、专家说、来自ⅩⅩ的科学家说……

  2. 用平均数掩盖差距 。例1:“某公司有3003名股东,平均每人持股660股。”真相却是:公司总共200万股,其中3名大股东持有3/4,其余3000人总共持有1/4。

  3. 用百分比掩盖规模 。例2:“霍普金斯大学1/3的女生嫁给了大学老师。”原始数字是:总共只录取了3名女学生,其中一人嫁给了老师。

  4. 用短期波动代替长期效应。例3:“卫生部最新公布,大雾的一周内,伦敦市郊的死亡人数猛增至2800人。”仔细推敲:这是因为大雾带来的吗?该地区 平时 死亡人数如何?接下来的几周死亡人数又是如何?

  5. 遗漏变化的原因 。例4:“最近25年,癌症死亡人数增多。”其实除了癌症本身外,有很多因素更有解释力:以前很多“病因不明”的案例,现在被确诊为癌症;尸体解剖成为常用方法,诊断更加明确;医学统计资料更全面。还有,现在的人口基数,远远超过了从前。

  6. 偷换概念。例5:“某议员提议,我们应该让囚犯离开监狱,去住酒店,这样反而更便宜。因为囚犯在监狱一天的费用是8美元,而住某酒店只要7美元。”其实,这里的8美元,是指囚犯所有的生活费;但议员拿来进行比较的,仅仅是酒店的房租。

  7. 定义不统一 。例6:“好几家平台,都说自己收视率第一。”但是,各家对“收视率”的定义不一致:有的用平均收视率,有的用单集最高收视率,有的用首播重播合计收视率。

  8. 忽略测量误差 进行比较。例7:“李雷智商101,韩梅梅智商99,所以李雷比韩梅梅聪明。”事实上,任何测量都有误差,得到的数值应该加上一个区间,比如±3%。这样李雷和韩梅梅的智商范围有重合,不能断定谁比谁聪明。

  9. 差别过小没有现实意义。 例8:“某次大规模的智商测试结果,男生平均106.1,女生平均105.9。”即使这个差异在统计上显著,由于差异过小也没有任何现实意义。只有当差别有意义时,才能称为差别。

  10. 调整 比例尺 让变化看起来有冲击力。例9:一款减肥应用,纵坐标按0.1千克,而不是1千克为单位做图,使得体重曲线看起来下降剧烈。用在减肥上无伤大雅,但是用同样的手法展示国民收入、国防支出、民工供给量等变化呢?

  11. 参照对象不清。例10:“这款榨汁机的榨汁功能增强了26%。”这是跟谁比?如果是老式手摇榨汁机呢?

  12. 比较时忽略 基数 。例11:“高速公路,晚上7点的事故是早上7点事故的4倍,所以早上出行生还几率高得多。”其实,晚上事故多,只是因为晚上在高速公路上的车和人更多。

  13. 把不同的事情合成在一起。例如12:“调查结果表明,大多数——78%的职员反对工会。”数据是把对工会的无关痛痒的抱怨、微不足道的牢骚统统加进去了,这与“反对工会”根本不是一回事。

  14. 对象不同 强行比较。例13:“美国和西班牙交战期间,美国海军的死亡率是9‰,同时期纽约市居民的死亡率是16‰,所以海军士兵更安全。”其实,这两组对象不可比:海军主要是体格健壮的年轻人,而城市居民包括婴儿、老人、病人,这些人在哪里死亡率都高。

  15. 变换基数让人产生幻觉。例14:“50%折扣,再打20%折扣。”这会让你以为有70%的折扣,实际上折扣只有60%。因为后面20%的折扣是用五折后的价格计算的。

  16. 用数字游戏控制听众感觉。例15,“某种投资回报率第一年为3%,第二年为6%”,则以下两个说法都是对的:1.提高了3个百分点;2.增长高达100%。选用哪种说法,取决于你想让听众感受到什么。

  17. 样本没有代表性。 例16:“2004年杜蕾斯全球性调查报告显示,中国人的平均性伴侣数最多,为19.3人,远远高于全球平均数10.5人。”但是,这次调查是通过互联网进行的,而乐于参与网络调查的,大多数是对调查内容感兴趣的年轻人。参与调查人数虽然多,但是没有代表性,因此结果没有意义。

  18. 归因错误。例17:1999年,数据显示美国男性每收入1美元,女性只能收入75美分。克林顿据此在国情咨文中说:“75美分对比1美元,只能表明在两性平等的道路上,我们只走了3/4,美国人民不会感到满意……”这是把男女平等的政治诉求,与男女工资应该等同混淆起来。即使政治上做到了男女平等,市场上的男女工资水平可能还是有差异,因为两性之间存在客观的身心差异。

  19. 因果关系不成立。例18:“在印度,研究人员发现,看电视的人对男女平等的态度更积极。”这指示我们应该普及电视,来改变印度农村地区对女性的态度吗?并非如此。真实的情况是:教育程度好的人才买得起电视,而教育程度好的人对男女平等的态度更开明。经常看电视与男女平等积极的态度之间,不是因果关系,而是伴随关系。

  20. 理论适用错误。例19:“网上一个段子说公务员负担比例,在汉朝,是8000人养1个公务员,唐朝是3000人,明朝是2000人,清朝是1000人,而今天是18个人,这暗示这个时代的公务员太多了。”这个错在毫无根据的按比例放大或者缩小。实际上,随着人口规模的上升,公共服务需要的人数不是按线性比例增加,而是几何级增加的。在合理的理论框架下,才能评价18个人养1个公务员是多还是少。

  21. 数字不会欺骗,是人会欺骗。西方有句俗语说:Don’t hate the player, hate the game(别去恨玩家,要恨恨游戏)。只有营造一个激励诚实的环境,才能在根本上解决被欺骗的问题。