总统列

健全的科学依赖于对人类科学的理解

我的同事Howard C. Nusbaum正在芝加哥大学心理学系休假,担任美国国家科学基金会(NSF)社会、行为和经济科学理事会行为和认知科学部主任。我邀请他从他在国家科学基金会的有利地位来权衡可靠性、有效性和可复制性的目标,并讨论心理科学不仅在实现这些目标方面可以发挥的特殊作用,而且还可以理解为什么这些目标如此难以实现。

——美国aps总裁苏珊·戈尔丁-梅多

科学是产生知识和检验信念的方法;它通过经验评估胜过权威,并依赖于可靠性和有效性来维护知识。但科学也是人类的事业:无论是心理学还是神经科学,物理学还是化学,研究都是由人设计、实施和报告的。即使是电脑控制的实验,人类也要对结果负责。当人类参与其中时,错误就会发生。有些错误是由于决策和判断中的认知偏差造成的(Gilovich, Griffin, & Kahneman, 2002;Tversky & Kahneman, 1974),包括确认偏误(例如Nickerson, 1998);还有一些是由于意外、疏忽或粗心造成的;还有一些人可能会受到激励。

当结果与现实不符时,“动机性”错误就会发生,并且出于独立于客观证据的原因(无论是出于信念还是获利)而有意扭曲或捏造分析(Broad & Wade, 1982)。诊断动机错误是困难的。阿利格拉·古德曼的小说直觉(2006)说明了当错误发生时,个人和职业动机如何使科学知识的水变得浑浊。选择性数据报告是小说的一个转折点。以大致相同的方式,William Broad和Nicholas Wade(1982)讨论了罗伯特A.密立根是如何通过选择性报告证明量子电荷而获得诺贝尔奖的。然而,最终,复制作为自然的科学纠正过程胜出。

心理科学一直特别关注可靠性和有效性的工具,这是我们智力历史的结果。心理学从分析学
内省对主体间可测性的研究是一门依靠客观系统方法论发展起来的科学。这种方法论将心理科学置于与物理科学研究同样客观的基础上。接受这一体系就是为什么我们反对对假定的硬科学(如物理学)和软科学(如心理学)的错误区分。科学方法建立了宇称,而理解那些不能直接观察到的现象的目标——无论是精神状态还是暗物质——当然不会分裂
科学分开。

虽然我们很清楚心理科学中关于重复性的争议,但重要的是要记住,所有的科学都面临同样的问题。物理学已经处理了关于冷聚变和超光速粒子的争议,但最终科学理论和复制导致了澄清。然而,复制并不总是解决问题的方法。想想prosper - ren Blondlot在1903年发现的n射线(Broad & Wade, 1982)。这一发现是一种物理现象,在数百篇论文中被物理过程所复制(Simon, 2014;Tretkoff, 2007),但尽管有重复实验,还是有人持怀疑态度。一位持怀疑态度的物理学家拜访了布朗德洛特,通过简单的干预表明,唯一真实的现象是观察偏差。

当理论和知识推动复制时,它们可以纠正科学错误,但可靠性和有效性并不相同。统计分析提出了一个问题,即一些结果是否太好而不真实(Francis, Tanzman, & Matthews, 2014)。这种分析本质上质疑报告的结果在统计上是否可信。结果并不表明错误,而只是简单地标记了一些看似不可能的发现,这些发现可能无法复制。

这不仅仅是心理学的问题,而且在遗传学中也出现了(Francis, 2014)。孟德尔(Gregor Mendel)的数据也好得令人难以置信(Broad & Wade, 1982;> 2012)。但孟德尔遗传学经受住了时间的考验。统计数据支持一个论点,但并不代表结果的全部真相。鉴于错误有很多方式扭曲研究和阻碍进展,我们需要了解社会、文化和心理力量是如何在科学中起作用的。

科学必须产生可信和可靠的知识。美国国家科学基金会社会、行为和经济科学理事会(SBE)咨询委员会成立了科学可复制性小组委员会。他们的报告(Bollen et al., 2015)将稳健的发现定义为可重复、可复制和可概括的,具有明确的定义。该报告呼吁支持新的有力和可靠的科学,SBE已经发布了一封“亲爱的同事信”(DCL;Cook, 2016)宣布支持对稳健性失败的研究,提高稳健性的方法,增强研究稳健性的培训,并支持关键SBE研究的重复/推广。鉴于对可复制性的关注延伸到其他社会科学(Camerer等人,2016),SBE致力于提高SBE科学的稳健性。来自计算机和信息科学与工程理事会的DCL (Kurose, 2016)宣布支持计算和通信研究的可重复性。

科学依赖于可信度。然而,有许多方法可以使研究结果无法复制,但并非所有方法都会损害有效性。考虑到当前研究之外的不确定性和未知因素,科学需要谦逊。SBE DCL支持越来越多的强有力的研究和对强有力的科学的更多反思,并希望引导一种更明智的研究方法。稳健科学的问题并非社会科学和行为科学所独有;它存在于所有的科学中,因为所有的科学都是由科学家进行的——物理学家和遗传学家也是人,因此会受到可能导致研究误入歧途的社会和心理力量的影响。仅这一点就产生了一种独特而重要的责任,即理解社会和行为科学中稳健的科学行为。œ

参考文献

Bollen, K, Cacioppo, J. T., Kaplan, R. M., Krosnick, J. A., Olds, J. L., and Dean, H.(2015)。科学咨询委员会可复制性小组委员会提交给国家科学基金会社会、行为和经济科学理事会的报告。检索自https://www.nsf.gov/sbe/AC_Materials/SBE_Robust_and_Reliable_Research_Report.pdf

Broad, W, & Wade, N.(1982)。真相的背叛者:科学殿堂中的欺诈和欺骗。纽约:西蒙与舒斯特出版社。

Camerer, c.f, Dreber, A., Forsell, E., Ho, T.- H., Huber, J., Johannesson, M.,…Wu, H.(2016)。评估经济学实验室实验的可重复性。科学351, 1433 - 1436。

Cook, f.l.(2016)。亲爱的同事信:在社会、行为和经济科学方面进行了强有力的、可靠的研究。检索自https://www.nsf.gov/pubs/2016/nsf16137/nsf16137.jsp

Francis, G.(2014)。最近的突破性表观遗传学实验太成功了。遗传学198, 449 - 451。

Francis, G., Tanzman, J., and Matthews, W. J.(2014)。心理学论文在期刊上的超额成功科学《公共科学图书馆•综合》9, e114255。

Gelman, A.(2012)。孟德尔的可疑数据[博客文章]。检索自http://andrewgelman.com/2012/08/08/gregor-mendels-suspicious-data/

吉洛维奇,T.,格里芬,D.,和卡尼曼,D.(编辑)。(2002)。启发式和偏见:直觉判断的心理学。英国剑桥:剑桥大学出版社。

古德曼,A.(2006)。的直觉。纽约,纽约:拨号机。

Kurose, J.(2016)。致同事的信:鼓励计算机和通信研究的可重复性。检索自https://www.nsf.gov/pubs/2017/nsf17022/nsf17022.jsp

尼克森,r.s.(1998)。确认偏误:一种以多种形式存在的普遍现象。普通心理学评论,2, 175 - 220

西蒙,M.(2014)。大错特错:想象中的辐射震惊了科学界,毁掉了它的“发现者”。《连线》杂志。检索自https://www.wired.com/2014/09/fantastically-wrong-n-rays/

Tretkoff E.(2007)。本月物理学史:1904年9月:罗伯特·伍德揭穿了n射线。美国物理学会。检索自https://www.aps.org/publications/apsnews/200708/history.cfm

Tversky, A.和Kahneman, D.(1974)。不确定性下的判断:启发式和偏差。科学185, 1124 - 1131。