科学可证伪(科学可证伪性重复性可验证)居然可以这样

2023-11-04Aix XinLe

诺奖得主阿诺德宣布从《科学》撤回一篇论文，原因是结果无法被重复。"可重复性"对科研有多重要？科学界如何应对"重复性

诺奖得主阿诺德宣布从《科学》撤回一篇论文，原因是结果无法被重复。"可重复性"对科研有多重要？科学界如何应对"重复性危机"？记者/丁林新媒体编辑/吕冰心

1月3日，诺贝尔化学奖获得者弗朗西丝·阿诺德（Frances Arnold）在社交媒体宣布，将她所在实验室2019年5月发表在《科学》的一篇论文撤回她写到"该研究无法被重复""文章提交时我有点忙，没有做好自己的本职工作。

阿诺德因"酶的定向进化"领域的开创性贡献，获得了2018年诺贝尔化学奖她的突破性研究主要集中在上世纪90年代，本次撤稿的《科学》论文，与阿诺德获2018年诺奖的成果并无直接的关联被撤论文中，研究者试图用定向进化的方案，产生细胞色素P450的各种变体酶类，并用这些酶来催化合成各种环状内酰胺分子（其中最有潜力的应用，是合成常见于抗生素分子的β-内酰胺）。

△β-内酰胺的催化实验，好比让一个线状分子打结成环（动图来源：加州理工学院）在《科学》的撤稿声明中，阿诺德团队写到："试图重复该研究时，发现（研究中的）酶在反应中并没有宣称的催化活性和特异性在随后对其中一位第一作者实验笔记的细致检查中发现，关键实验的同期条目和原始数据缺失了。

"阿诺德告诉《撤稿观察》博客，声明中所提及的第一作者Inha Cho目前已经不在她的实验室。

△阿诺德与本次撤稿文章的两位共同第一作者，博士生Inha Cho（左）、博士后Zhi-Jun Jia（右）（图片来源：加州理工学院）撤下了论文，收获了认同根据2013年一篇《科学报告》研究的统计，近年来学术文章的撤稿率逐渐上升。

其中，顶级期刊的撤稿率最高该研究还发现，由于学术不端而撤稿会引起同行引用率的逐年下降但这种尴尬不适用于主动撤稿的情况——主动承认错误，被认为是当事人学术诚信的体现

△总体来说，主动撤稿的科学家撤稿后短期内被引用不但没有下降，甚至有小幅上升（来源：《科学报告》）的确，弗朗西丝·阿诺德宣布撤稿后，不但没有成为千夫所指，还在社交媒体上受到了诸多赞扬（尤其是来自年轻学者）。

人们纷纷表示她的行为"有勇气"

△《科学》总编辑Holden Thorp在社交媒体对此次撤稿决定表示肯定（来源：twitter）但阿诺德认为，撤稿应该成为科学实践的常态在接受《福布斯》的邮件采访时，阿诺德表示："撤回论文不应该像现在这么困难，公开承认错误也不应该被认为是勇气之举……理想条件下，科学家应该在论文发表前就发现存在的问题，但有时候，那是做不到的。

" 诺奖得主撤稿并不少阿诺德并不是第一个撤稿的诺贝尔奖得主2008年3月，2004年诺贝尔生理学或医学奖获得者琳达·巴克（Linda Buck）发现其团队2001年发在《自然》一篇论文的研究结果无法重复，并发现发表数据与原始数据不一致，因此主动要求撤稿。

被暗示有主要责任的第一作者，曾在巴克实验室做博后的邹志华当时接受北京科技报采访，表示巴克的撤稿决定过于草率但就在两年后，巴克实验室又撤回两篇邹志华担任第一作者的研究（分别发表于《科学》和《美国科学院学报》）。

2014年，美国研究诚信办公室（ORI）发表了对该事件的调查结果：邹志华在《自然》《美国科学院学报》两项研究中有篡改细胞染色图片的学术不端行为

△诺奖得主两年内接连撤下《自然》《科学》《美国科学院学报》三篇论文（来源：nature.com）2009年，哈佛大学的杰克·绍斯塔克（Jack Szostak）在获得诺贝尔生理或医学奖前的几个月，刚刚撤下一篇文章。

获奖后的2016年，绍斯塔克实验室在《自然·化学》发表一篇重磅研究，称一类多肽能够帮助复制RNA，这可能与地球生命最初起源相关但文章发表后，该实验室的一位研究者Tivoli Olsen发现，她试图重复实验却不能得到相同结果——已经发表的结果是原始数据的分析出现错误导致的。

2017年，绍斯塔克实验室再次主动撤稿，诺奖得主表示"实在难为情"

△杰克·绍斯塔克手持核酸模型（来源：harvardmagazine.com）Olsen接受《撤稿观察》博客采访时说到："科学家的工作之一就是排查问题你既不能左右，也不能忽略这个过程的结果我尽了自己的职责，确保以后其他人不必再在同样问题上浪费时间。

"此外，2017年的诺贝尔生理或医学奖得主迈克尔·罗斯巴什（Michael Rosbash）也曾在2016年撤下一篇文章，因为该研究的结果不能被与他分享诺贝尔奖金的迈克尔·杨（Michael Young）所在的团队重复。

曾在2016年引发满城风雨的"诺奖级科学家"韩春雨，最终也从《自然·生物技术》主动撤稿了，但他并没有获得舆论的支持人们更关注的，是其实验成果"不可重复"的问题——国内外20家实验室的负责人联合署名，表示无法重复韩春雨的NgAgo实验结果，对其论文结果提出质疑。

科学实验结论"可重复"为何重要？在上述案例中不难发现，"不可重复"成为撤稿关键词之一作为科学研究中的基本原则之一，"可重复性"目前并无公认的明确定义简单地说，另一位研究者用同样的数据和分析方案，应该能达成与原作者相同的结论。

（图片来源：world.edu）为什么诺奖得主也要因为"实验结论不可重复"老老实实撤稿？因为人们对科学的信任，并不是基于学者的"权威性"（谁最权威听谁的），而是建立在检验研究是否符合客观事实的"可重复性"上。

空口无凭的"假说"，听起来再合理也没有用，久经检验的"理论"更加接近真相科学并非一成不变，而是不断进步的过程科学理论可证伪、可被不断检验（重复），是其有别于其他知识获取方式的重要特征卡尔·萨根曾说："非凡的主张需要非凡的证据。

"即便是诺奖得主在《科学》上发表的初步结果，在得到他人重复之前也不能当做板上钉钉的事实科学家想 "站在巨人的肩膀上"，也得先确定所选的肩膀足够结实通过多次重复实验，研究者可以判断自己的某个科学发现是"纯属偶然"还是真正的客观规律；而不同实验者用同样（或尽量接近）的方法重复同一个实验，不仅能排除学术造假、减少主观偏见或实验错误等因素导致的结果偏差，也是检验某个实验方法能否被更大规模应用的途径。

许多因素会导致"不可重复" 但的确许多因素会导致研究不可重复（或只能部分重复）：一些违背伦理的实验不应该被重复；罕见的天文、地质现象无法被重复；实验方法描述不清、细节缺失会导致其他研究者难以精准重复；实验结果是假阳性、实验设备出现了没被发现的故障；实验环境和研究对象存在差别，等等。

有些时候，一些研究的实验设计本身不够严谨，导致结论的不确定性或误差较高2013年，哈佛医学院的两位研究者Jonathan Schoenfeld与John Ioannidis综合了之前发表的264项营养学研究，发现各个独立研究中的结论有的综合之后趋势保持一致（如"培根致癌"），有的在综合考虑后效应就趋向微弱（如玉米在一些研究中致癌，在另一些研究中抗癌）。

所以，科学实验不能重复，具体原因有时不太容易确定当不同实验者的结论不符，但原因尚不明确时，研究者不会第一时间撤稿——当类似的研究有所积累之后，真相的趋势可能就会显现出来弗朗西丝·阿诺德团队发现《科学》论文结果不能重复后，连部分原始记录也找不到，因此选择撤稿。

科学的"重复性危机" 科学家撤稿事件，引起的动静总是不小但是悄悄发生的"重复性危机"更值得被关注2015年，心理学家Brian Nosek领导的"开放科学中心"组织在《科学》发表的一项研究显示，他们尝试重复的97项已发表心理学研究中，只有36%能够得到统计学上显著的结果。

重复实验中观察到的心理学效应，强度上平均也只有原始研究的一半左右心理学研究是"重复性危机"的重灾区迄今为止，不少广为流传的心理学效应，被发现不能重复比如，1988年的"表情反馈假说"认为，通过牙齿咬笔等方式使面部呈现微笑表情，就能提升人的幸福感；1996年的"社会启动"假说，宣称向人们展示衰老相关的词语，会让他们有老龄化举动如走得更慢；2010年的"权力姿态"假说认为，摆出强有力的体态几分钟，就会改变自身的激素水平，让人更加自信。

2018年，"社会科学重复性计划"的24位科学家对2010-2015年发表在《自然》《科学》的21篇社会科学论文进行了重复检验他们招募了原实验5倍数量的志愿者，最终只有62%（即13篇）论文的结果可重复，而且结论的强度并未达到原论文宣称的程度。

△能被重复的13篇论文中，发表后多数默默无闻而不能被重复的8篇论文，其中4篇由于"结论惊人"在社交媒体获得了更多转发和传播（图片来源：univie.ac.at）其他科学领域也没能幸免"重复性危机"例如，2018年《公共图书馆·生物学》发表的一项分析发现，仅在美国，就有超过50%的临床前医学研究（每年280亿美元）不可被重复。

这意味着许多原本可以挑战关键医学问题的研究资源将被浪费在错误的基础上

△《自然》曾发动一项网络问卷调查，参与调查的1500多名研究者中，超过一半（52%）认为重复性危机存在，而且"问题很严重"（图片来源：nature.com） "危机"塑造科学新常态剑桥大学赛恩斯伯里实验室的主管Dame Ottoline Leyser受BBC采访时解释：诸多实验难以重复，学术造假只是其中一小部分，而且相对容易被识破。

Leyser 说："推崇研究影响力而不是实质、推崇漂亮结论而不是乏味、确认性工作的科学文化才是问题"也就是说，科学基金组织追求"性价比"，学术期刊追求"突破"，学术机构通过发表文章来衡量科研成果的倾向，重复性的研究自然就受到冷遇，许多新研究发表后并未被严格检验，留下了隐患。

为了应对"重复性危机"近年来，若干种应对方案被陆续提出、推广例如，有学者提倡在开展研究之前，就"预注册"整个实验过程及分析手段即便最终的实验结果不符合预期，研究者也不能通过更改实验设计来取得"更漂亮"的结果。

△"预注册"方案让研究从计划阶段开始，就接受外界批评和检验，让研究"基础"更加牢固（来源：nature.com）还有对统计学方法的改善一些科学家号召对"统计学显著"的要求应该更加严格；另一些科学家向其他数学分析方案求助，例如用贝叶斯统计学（而不是传统的p值）来检验数据的可靠性。

△有部分学者认为，过分强调统计学显著是重复性危机的罪魁祸首2019年3月，800名学者在一篇《自然》社论上签名，号召让传统的"统计学显著"检验方式"成为历史"（来源：nature.com）而随着"可重复性"这个概念被越来越重视，学术期刊也要求研究者采用更大的样本量、公开实验数据，并采用更严谨的统计方案。

康涅狄格大学的教育心理学教授Eric Loken感慨，"二十年前，科学家只要说服三位审稿人和一位期刊编辑，发表论文的周期基本上就算完成了……今天，研究者知道自己的论文发表后，还要被互联网上千万个有想法的审稿人审阅，实验本身还可能被可重复性计划这样的科学群体再次检验。

"2018年，《科学》杂志的编辑分析了《撤稿观察》数据库中的一万多篇撤稿文章他们发现，近年来撤稿事件的大量增加，或许也并不是"危机"，而是科学群体更加自觉的体现人们继续将撤稿视为禁忌，反而会造成长远的隐患。

在临床医学等研究领域，及时纠错不仅意味着大量研究资源和时间的节省，可能还意味着一些病人的生命能够被拯救

（图片来源：sciencemag.org）《撤稿观察》的创始人之一Ivan Oransky表示：大量论文被撤稿，或许只是人们开始认真对待学术诚实的结果这就好比有某种疾病一直存在，在大规模筛查技术出现后，其病例也随之大量涌现——这不是应该惊慌的"疫情"，而是痼疾被攻克的开始。

参考资料：retractionwatch.com/2020/01/02/nobel-winner-retracts-paper-from-science/theconversation.com/retraction-of-a-journal-article-doesnt-make-its-findings-false-103829

scitech.people.com.cn/GB/7009519.htmlplato.stanford.edu/entries/scientific-reproducibility/www.sciencemag.org/news/2018/10/what-massive-database-retracted-papers-reveals-about-science-publishing-s-death-penalty

www.vox.com/science-and-health/2018/8/27/17761466/psychology-replication-crisis-nature-social-science