点击阅读英文原文
一项新研究发现,即使基于相同的问题和数据集,学者们也可能得出截然不同的研究结论,这要求学者们仔细记录下他们在工作中做出的决定和判断。
在这项研究中,29个分析团队基于有关在线学术讨论的相同数据集验证了两个假设。
第一个假设是“女性积极参与对话的倾向与参加讨论的女性人数呈正相关”。
第二个假设是“地位较高的参与者比地位较低参与者的对话信息更冗长”。
通过使用一种名为DataExplained的新工具来跟踪研究人员所做出的决定,该研究发现了这些问题对不同解释的开放程度。
例如,一些分析师将“高地位”定义为学者的职位等级,而其他分析师则使用诸如引文等方式来定义。至于“冗长”,这可能是指学者的评论字数或他们在一年内发表的评论数。不同团队还使用了不同的统计技术和样本量。
这项研究的共同作者、柏林ESMT商学院的组织行为学助理教授马丁·施魏因斯伯格(Martin Schweinsberg)说:“在你做出判断的地方就会有噪音,而且比我们想象的要更多。”
根据发表在《组织行为和人类决策过程》(Organizational Behavior and Human Decision Processes)杂志上的这篇论文,结果是“研究人员报告了完全不同的分析和分散的实证结果”。
对于第二个测试学者地位和信息冗长程度之间联系的假设,29%的分析人员找到了支持的证据,但21%的结论恰恰相反。
至于“当其他女性在场时女性发言更多”的观点,研究者们有了更多共识,近2/3的人认为这一假设得到了支持。尽管如此,超过1/5的人发现了相反的效果。
施魏因斯伯格教授称,这些发现“非常生动地揭示了”有多少种方式来解决一个看似简单的问题。
这项工作是一系列众包实验中的最新一项,在其中多个研究团队使用相同数据独立解决相同问题。于2018年进行的一项实验探讨了种族偏见,研究足球裁判是否给了深色皮肤球员更多红牌。
大多数人发现了种族偏见的证据,但这些发现的范围很大。根据施魏因斯伯格教授的这篇论文,“令人不安的暗示是,如果只有一个团队获得了数据集并提出了他们倾向的分析,那么研究得出的科学结论可能是红牌数量的重要种族差异,或者平等的结果”。
这个最新实验的不同之处在于它通过DataExplained密切跟踪了参与者的决策过程。 “我们提供了一个步步相扣的链条来了解这是如何发生的。”施魏因斯伯格教授说:“每隔几行代码,我们就会问他们一组关于所采用路径的标准问题。”
该研究解释说,该平台于今年早些时候公开,“记录了所有执行的源代码,并提示分析师评论他们的代码和分析思维步骤”。
施魏因斯伯格教授说,这种系统监测是否有意义取决于提出的问题。他说:“如果有人是死是活,就没有太大的歧义。”尽管他的论文指出即使在医学领域也存在矛盾的发现。
他建议道:“如果问题足够大并且具有足够重要的影响,那么(做)这样的事情可能是明智的。”
david.matthews@timeshighereducation.com
本文由Liu Jing为泰晤士高等教育翻译。