网站首页 > 历史论文> 文章内容

科学界的造假之王:写了200多篇论文183篇遭撤稿

※发布时间:2018-11-12 15:50:45   ※发布作者:habao   ※出自何处: 

  跳蛋门事件完整照片

  学术造假已经不再是什么新鲜话题,历史上的学术骗子也是数不胜数。其中骗子之王更是达到前无古人的地步,发表论文数212篇,因涉嫌造假而遭到撤稿的就达到了183篇之多。然而打假的过程并不是一帆风顺,也因此诞生了有名的“学术”。

  2000年4月,《麻醉与镇痛》(Anesthesia & Analgesia)刊登了一封致编辑部的信件。维尔茨堡大学的麻醉学家彼得·克兰克(Peter Kranke)与两位同事在信中直讽,日本麻醉医生藤井善隆(Yoaka Fujii)发表的一篇文章中关于治疗恶心和的药物数据“完美得不可思议”。

  在科学界,称实验结果“完美得不可思议”并不是一种赞誉——这相当于质疑作者学术不端甚至造假。但《麻醉与镇痛》并没有特别注意这一,而是打了个圆场:在发表致编辑部的同时,还发表了来自藤井的解释,藤井反问道:“到底要提供多少,才能我的可信?”换言之,“不相信我?随你。”在此之后,藤井又先后在该上发表了11篇论文。致编辑部的共同作者之一克里斯蒂安·阿普费尔(Christian Apfel)曾赴美国食品与药物管理局提醒他们注意藤井的问题,但并没有收到回复。

  或许感到他的好运要受到挑战了,在2005年前后,藤井便差不多终止了在麻醉学领域的文章发表,继而转战眼科和耳鼻喉科学。截至2011年,藤井已发表文章200多篇,在他的研究领域可算非常高产了。2011年12月,他在《麻醉学期刊》(Journal of Anesthesia)上发表了一篇文章,这成了他所发表的最后一篇文章。

  随后的两年里,他在大部分研究中造假的事实露馅了。如今他雄踞个人撤稿篇数榜首,遭撤稿的文章有惊人的183篇之多,一个人就占了从1980年到2011年撤稿总篇数的7%。这个爬得高又摔得痛的故事还了学术出版的新:诞生了用于搜寻学术造假的统计学工具,以及乐意用它们寻找造假的“学术”。

  2009年,史蒂夫·伊恩提斯(Steve Yentis)成为《麻醉》(Anaesthesia)的主编。他承认当时“并没有意识到问题已经很严重”。

  2010年,故事迎来了关键的转折。和10年前的《麻醉与镇痛》一样,《麻醉》发表了一篇由多位作者署名,质疑藤井研究结果的评论,并且呼吁加强论文监管,过滤虚假结果。

  这篇评论是由伊恩提斯授权发表的,后来他在“谎言、致命谎言和统计”一文中写到,这篇评论一经发出便收到了洪水般的来信,其中一位读者说“为研究者基础的事感到惋惜”,还督促麻醉学期刊的编辑要有所行动。这封信的作者是英国麻醉学家约翰·卡莱尔(John Carlisle)。

  无独有偶,此时的麻醉学领域正处于两次大型学术不端冲击的恢复阶段。第一次冲击来自塔夫茨大学的疼痛学专家斯科特·鲁本(Scott Reuben),他在临床实验中数据作假,最终被判。紧接着在第二年,的高产研究者约阿希姆·博尔特(Joachim Boldt)被论文,违反学术,近90篇论文遭撤稿。

  《麻醉》发表过6篇博尔特的文章,这让伊恩提斯有些难堪,因此当他读到卡莱尔的来信时,他看到了机遇。他回信直言卡莱尔要有所行动并拿出,“我督促相关来信人对藤井的研究进行分析”。卡莱尔坦白他那时并未掌握统计学的专业技术,在麻醉学同行中也不算很出名。但是他的结论却简单而又令人无法忽略——藤井的数据根本不可能从真实实验中获得。

  卡莱尔将藤井从1991~2011年间168篇符合临床实验“金标准”的论文,与其他调查者文章中的数据进行对比。他对比的变量包括患者试验前的身高、血压,以及药物副作用出现的比例等。

  通过这种手段,卡莱尔在2012年发表于《麻醉》的文章中得出结论:在藤井的一些文章中,通过其试验得到最终研究结论的概率是10-33——一个低得的数字。卡莱尔解释道:“这些数据偏离随机样本的程度足以说明它们根本不可能成为。”换言之:如果一件事好得难以置信,数学便会告诉你,它确实是不可信的。

  卡莱尔的结论与2000年藤井的观点很像,不同的是这次受到了人们关注。在他的研究结果发表后不久,日本一项调查研究显示,藤井所发表的212篇论文中仅有3篇的数据明显可靠,有38篇无法是否造假,另外171篇则被认定完全伪造。调查最后总结道:“这相当于一个人坐在书桌前,写了一本关于科研点子的小说。”

  卡莱尔的统计分析方法不仅适用于麻醉,还还适用于人体科学研究。他说:“这个方法可以应用于任何随机分组的研究,无论是植物、动物还是矿物研究”这对于其他学术刊物来说也“相当容易”施行。

  斯坦福大学麻醉学家,时任《麻醉与镇痛》主编的史蒂文·谢弗(Steven Shafer)说:“约翰·卡莱尔的基本方法已经作为一种检测研究造假的工具开始得到推广,尽管它还在不断完善中。” 谢弗、伊恩提斯以及许多人都在为此努力。谢弗表示,他们的一个目标是使这个过程自动化。

  谢弗表示,在2012年,他曾经亲自使用卡莱尔的方法鉴别出一篇投给《麻醉与镇痛》的论文存在造假。谢弗退稿后,又得知它被投递给了其他期刊。他说:“同一篇论文,不同的数据!我在拒稿信中暗示了这是造假论文,论文作者看到之后又了新的数据。”他与编辑通知了该论文作者所在机构的负责人,对方回复:“这些人以后不会再进行研究了。”

  卡莱尔的方法需要与期刊编辑合作,但许多人并不愿意参与。有人认为有理由修订论文,论文作者们则认为他们是“围剿”的者。通常在允许匿名评论论文的网站上,如一篇论文出现大量后会跟进报道,这时才会有人采取行动。

  例如,因发明了致癌物检测手段(埃姆斯测试)而闻名的布鲁斯•埃姆斯(Bruce Ames),在2009年与同事共同开展了一项与卡莱尔类似的分析研究。研究对象是三篇印度科学家Palaninathan Varalakshmi团队的论文。与卡莱尔不同,在这次调查中,三位研究者对他们进行了反击——他们称埃姆斯的方法“不公平”,说它是对关系和相关性的混用。这一次,负责Varalakshmi论文的编辑站在了Varalakshmi这一边。在这三位科学家发表过论文的期刊中,至今仍没有一家对他们的问题论文采取行动。

  遗憾的是,这才是学术造假调查的典型结果。对造假者追责困难的部分原因在于学术出版本身。伊恩提斯说,学术出版“一直依赖于人,而不是体系;同行评审过程有其自身的优劣性,而造假鉴别不是它的强项”。

  出版都建立在信任之上,即使可以获取原始数据,同行评审员通常也会匆匆略过。例如《自然》(Nature)要求作者“进行适当的统计检验,尤其需要说明数据是否符合统计检验的假设”。PLOS的执行编辑韦罗妮克•基尔默(Veronique Kiermer)认为,编辑“会将作者自证的过程作为评审的一部分,但不会系统地检查论文涉及的全部深层数据的统计学分布。”同行评审同样也不要求检查全部数据统计。

  2014年,《自然》出现了一起令痛的干细胞论文撤稿事件(小保方晴子STAP细胞论文造假事件),小保方晴子的导师笹井芳树随后。但依旧认为:“我们和评审者不能发现论文背后的致命问题。”《自然》在另一篇评论中提到,抓得太严会造成真的问题,期刊“仅仅宣布撤稿可能就会受到起诉的,更别说在撤稿声明中提到学术不端了。”

  《自然》或许乐于于将繁重的监管工作留给学术机构,但伊恩提斯已吸取教训。尽管2010年由他授权发表的评论引起了读者对藤井善隆论文造假问题的关注,但他却了评论信息。直到看到一堆信件,包括卡莱尔的信,他才行动起来。因此,直到2012年才刊出了那篇决定性的分析报告。伊恩提斯说:“如果现在评论中出现这样的,我不会再不管。”