拨开数据谎言的迷雾
  • 来源:科普时报
  • 作者:姚利芬
  • 2022-04-01 13:08

哲学家哈里·法兰克福在其著作《论扯淡》中称:在我们的文化里,有太多的人在夸夸其谈。在某种意义上,这比“说谎”对我们的危害性更大。说谎的人知道何者为真,却讲的是假话。夸夸其谈的人既不关心何者为真,也不关心何者为假,只在乎自身利益。然而,当前貌似正经但实则在夸夸其谈的行为有哪些存在形式?如何发现这种粉饰言行?这些问题一直困扰着我们,犹如问我们什么是时间一样,“如果没有人问我,我是明白的;如果我想给问我的人解释,那末我就不明白了。”

《拆穿数据胡扯》,[美]卡尔·伯格斯特龙 杰文·韦斯特著,胡小锐译,中信出版集团2022年3月出版。

幸运的是,《拆穿数据胡扯》一书对此给出了试探性地回答。很多人认为自己很容易发现粉饰之谈,因为它常以花哨的语言形式出现。然而,本书重点并非研究这种老派的夸耀,而是研究新派虚谈。新派虚谈试图用数学、统计语言来营造严谨性、准确性,试图以此披上“科学”的外衣。

为什么新式虚谈总是利用数字、统计数据和数据图表粉饰那些可疑的论断?本书作者没有对此研究。在我看来,这是因为近代以来对自然的数学化造成的。自然的数学化的本质并非是使用数学的语言描绘大自然和人类社会,而是把整个世界看成数字化的结果。在西方,这种传统由来已久,它起源于毕达哥拉斯—柏拉图传统,他们或者认为数学、或者认为理念是世界的本质。在近代,伽利略宣称大自然这本书是用数学写成的。因此,哪个学科越能用数学的语言进行描述,哪个学科就越“科学”,也就越不容置疑。这就解释了本书作者发现的一个现象:“在人文和社会科学领域,学生们被教导要让相互冲突的观点相互碰撞,要与不一致的观点做斗争;但在 STEM(科学、技术、工程和数学教育)领域,学生们解决悖论、调和相互矛盾的证据、批判错误论断的机会非常少。”无论如何,新式虚谈不那么容易被人发现,我们经常被种种数学化的形式所“忽悠”。不过,通过阅读此书,会帮助我们快速而准确地辨别出那些一本正经、以数据之假面出现的新式吹嘘。

本书逻辑清晰、语言优美,很多地方论述得十分精彩。印象最深的是第4章,即因果关系,这也是揭示数据粉饰十分关键的一步。虽然书中没有明确提出,但我认为作者是通过以下几个方面论述“因果关系”中的数据粉饰。

首先,把相关性当成因果关系。毫无疑问,因果关系是某种关联,但并非有关联的两个事物都存在因果关系。暴风雪来临之前,气压计读数会产生变化,但我们不会认为气压计读数的变化导致了暴风雪的来临。虽然两者看似有先行后续的联系,但这种联系并非因果关系。新粉饰之辞经常把联系说成存在因果关系,以达到言说者的其他目的。在作者看来,虽然结婚率与自杀率有关,但这并不意味着婚姻会导致自杀。因此,我们不要看到数据显示相关性,就草率地认为存在因果关系。

其次,因果倒置。我们通常用旗杆的长度解释旗杆的影长,这是因为旗杆是产生旗杆的影长的原因。反之,那简直就是本末倒置。本书中也提到了这种因果倒置的新粉饰形式。伟大的统计学家之一罗纳德·费希尔试图证明,吸烟不会导致肺癌,而是肺癌导致吸烟。他的理由是,肺癌导致患者不适,而吸烟可以缓解这种不适。

再次,凭借错误的假设推导出因果关系。本书给我们提供了一个例子:据心理学家斯科特·盖勒和同事研究,买扎啤的学生喝的啤酒数量大约是买杯装和瓶装啤酒的学生的2—4倍。但在最后,“如果喝扎啤,就会喝得更多”被理解为“人们喝得更多是因为他们喝的是扎啤”。因此,“我们应该禁售扎啤,这样学生们就会少喝酒。”毫无疑问,这也是一种新粉饰推理。

最后,在一些伪相关性中寻找因果关系。作者说,有的关联性无关紧要,在这些关联性中寻找因果关系本质是一种牵强附会。例如,在美国小姐被谋杀的人数与水蒸气等高温物体的关联中寻找因果关系,简直就是不折不扣的生拉硬扯了。

如何解决“因果关系”中的胡扯呢?可以看出,作者想利用因果关系的操控理论来解决此问题。因果关系的操控理论种类繁多,不过哲学家姆斯·伍德沃德提出的理论能被大多数所接受。虽然新粉饰总是利用数字、统计数据和数据图表等形式,但本书没有或许会让读者眼花缭乱的方程式,通篇充溢着幽默感,读起来轻松愉悦。在这种阅读气氛中,读者不知不觉学会了如何发现和拆穿生活中新式谎言的策略。

(作者系中国科普研究所创作研究室副研究员)


编辑:于翔
相关新闻

  • TEL:010-58884104
  • E-Mail:kepu@kepu.gov.cn
  • 如果您有任何意见或建议,请联系我们!
  • 版权所有:中国科普网