《拆穿数据胡扯》
[美] 卡尔·伯格斯特龙 杰文·韦斯特 著
胡小锐 译
鹦鹉螺 | 中信出版集团出版
在当今社会,科学知识成为广受青睐和信赖的主要信息,但这也为信息噪声大开方便之门。过去,学术噪声以华丽的辞藻和耸人听闻的话语作为伪装;今天,科学噪声则把自己包装成大数据和神奇算法的模样。TED演讲中的数据、《纽约时报》《华盛顿邮报》报道的最新发明的分析大数据的算法、医学期刊中的诊断数据,你能分辨其中哪些是信号,哪些是噪声吗?这些量化的、统计学的和计算机语言形式的噪声,就是这本书主要关注的对象。
这些信息噪声几乎随处可见且不易辨别。两位作者花了多年时间研究打着数学和统计学幌子的各种信息噪声,帮助读者在信息世界中有效地分析海量数据和观点,分辨科学的信号与噪声,并培养摒弃信息噪声的本能。
科学地对抗科学的胡扯
文/胡翌霖(清华大学科学史系副教授)
这本书英文原名叫“Calling Bullshit”,直译过来就是“对抗胡扯”。中译本书名用了《拆穿数据胡扯》,提示出本书的主题——本书所讨论的并不是一般的“空话”或“谎言”,而是那些被用来包装谎言的东西,特别是那些看似“科学”的包装——作者称之为“新派胡扯”。
老派胡扯属于“文科”,靠的是花哨的修辞和华丽的词藻,而新派胡扯属于“理科”,“使用数学、科学和统计语言来制造严谨准确的印象。它们利用数字、统计数据和数据图表粉饰那些可疑的论断,给它们披上了一层合理的外衣(见序言)”。
作者开篇就告诉我们,胡扯无处不在,从螳螂虾到人类,只要存在“交流”的地方,就存在欺瞒。遗憾的是,人类拥有更复杂的认知能力和语言体系,所以人类能够制造出更丰富的胡扯。
《三体》小说里有一个情节,说三体人花了几秒钟破译了地球人的语言,但他们无法理解欺骗和隐瞒。这个设定在我看来就很胡扯。且不论三体人的语言是什么样的,至少就我对地球语言的了解来看,欺骗和隐瞒简直就是任何语言的本质要素。
赫拉利在《人类简史》中提出,让人类这个物种脱颖而出的就是“讲故事”的能力,说直白些,其实就是“编造”的能力。语言的诞生就是一把“双刃剑”,它同时强化了人类传达信息的能力和编造信息的能力。很难想象一个有语言体系且有自由意志(从而能任性地选择如何使用语言)的智慧生物是不懂胡扯的,无论它是什么物种,也无论它处于怎样的科技水平。
科技水平的提升并不能自动清除胡扯,相反,“技术并没有消除胡扯问题,而是让问题变得更糟”。科学研究也无助于是,一方面许多科学研究者本身在有意或无意地生产胡扯,另一方面各种欺骗或谣言也能够拿起科学的包装来强化自己的传播。数据和图表比华丽的词藻更加有用,可以让胡扯如虎添翼。
在第1章作者总结了几条“原理”以解释胡扯的泛滥:“(1)制造胡扯的工作量比清除胡扯的工作量小;(2)制造胡扯对智慧的要求比清除胡扯的要求低;(3)胡扯的传播速度比清除工作的速度快。”科学、技术、数据、图表等,也都是“双刃剑”,它们既可以助力于清除胡扯,也可以助力于制造和散播胡扯,而借助同样的科技水平,强化胡扯往往比清除胡扯更容易。
所以我们不能奢望随着科技进步,胡扯的传播越来越少,相反,从近些年社交媒体上能观察到的趋势来看,我们发现胡扯的泛滥简直愈演愈烈。
作者假设,在移动互联网时代之前的人们,可能把胡扯流行归因于信息闭塞,他们会想象,如果人手一台机器,随手就能够连接到丰富和权威的数据源对任何问题进行查证,那么胡扯还能有生存空间吗?答案是令人遗憾的,神奇机器的幻想已经实现了,这个机器就叫智能手机,但在移动互联网时代,这台机器恰恰是更多胡扯的载体。
所以我们不能寄希望于科技,而是得自己多长心眼,如原书副标题所说:“用怀疑的眼光看数据驱动的世界”。如何学会辨别和反抗胡扯的技巧,这就是本书的主体内容。而辨别胡扯,重点就是要扒开让它显得煞有其事的外衣——各种貌似科学的论调、看似严谨的数据和仿佛明晰的图表。
总之,这本书给我们提供了“科普”,涉及统计学和心理学等领域,帮助我们辨别那些看似可靠的“科学的胡扯”。
但这种“科学地对抗科学的胡扯”本身,或许也是一个“胡扯”。正如书名和作者偶尔的自嘲那样,作者提供的东西,或许也有不少“胡扯”。
本书提供的方法真的管用吗?一方面,顶尖的科学家和顶级科研杂志的编审者们都很难做到火眼金睛(第9章提到大量经典实验难以复现的现象),我们这些普通读者只是读了几本科普书,能获得多高的辨识力呢?另一方面,一些辨别胡扯的“技巧”或许也是双刃剑,例如作者提到的第一个技巧是“质疑信息来源”,主张要多去追究信源的来路和动机,思考他们要“兜售”什么。但是同样是“动机论”,也经常会被大众用来抵制那些可靠的信息——比如宣称基站辐射无害的人肯定就是为了兜售基站嘛,宣称疫情严重的人肯定就是为了兜售疫苗嘛……对“兜售者”的怀疑眼光既可能妨碍谣言的传播,同时也有可能妨碍谣言的澄清。
最后作者给出一条箴言,教人们在使用社交媒体时要“多思考,少分享”。但这一建议能起到好的效果吗?因为耐心读完了整本书的人,多少应该比一般人更善于甄别胡扯,但是如果他们变得更加谨慎,更少转发,那么结果恐怕是那些毫不谨慎也不懂甄别的大众继续转发大量胡扯,而有辨别力的声音越来越少了吗?
或许作者的最后一章才是真正重要的事情:“驳斥胡扯”。作者鼓励我们,在辨清胡扯时不要默不作声,而是可以勇敢地站起来驳斥(当然要以得体的方式)。
当然,无论能不能改变世界,在这个充满胡扯的世界中,我们至少该学会独善其身,本书可以作为胡扯世界的生存指南。
>>作者简介
卡尔·伯格斯特龙(Carl Bergstrom),美国华盛顿大学生物学系教授。他研究流行病如何在人群中传播,以及信息如何大规模地在生物和社会系统中流动——从细胞内对基因表达的控制到社交媒体上错误信息的传播。
杰文·韦斯特(Jevin D.West),美国华盛顿大学信息学院副教授、公众知情中心主任。
作者:胡翌霖
编辑:金久超
责任编辑:朱自奋