科学界的造假之王：写了200多篇论文183篇遭撤稿

　　跳蛋门事件完整照片

　　学术造假已经不再是什么新鲜话题，历史上的学术骗子也是数不胜数。其中骗子之王更是达到前无古人的地步，发表论文数212篇，因涉嫌造假而遭到撤稿的就达到了183篇之多。然而打假的过程并不是一帆风顺，也因此诞生了有名的“学术”。

　　2000年4月，《麻醉与镇痛》（Anesthesia & Analgesia）刊登了一封致编辑部的信件。维尔茨堡大学的麻醉学家彼得·克兰克（Peter Kranke）与两位同事在信中直讽，日本麻醉医生藤井善隆（Yoaka Fujii）发表的一篇文章中关于治疗恶心和的药物数据“完美得不可思议”。

　　在科学界，称实验结果“完美得不可思议”并不是一种赞誉——这相当于质疑作者学术不端甚至造假。但《麻醉与镇痛》并没有特别注意这一，而是打了个圆场：在发表致编辑部的同时，还发表了来自藤井的解释，藤井反问道：“到底要提供多少，才能我的可信？”换言之，“不相信我？随你。”在此之后，藤井又先后在该上发表了11篇论文。致编辑部的共同作者之一克里斯蒂安·阿普费尔（Christian Apfel）曾赴美国食品与药物管理局提醒他们注意藤井的问题，但并没有收到回复。

　　或许感到他的好运要受到挑战了，在2005年前后，藤井便差不多终止了在麻醉学领域的文章发表，继而转战眼科和耳鼻喉科学。截至2011年，藤井已发表文章200多篇，在他的研究领域可算非常高产了。2011年12月，他在《麻醉学期刊》（Journal of Anesthesia）上发表了一篇文章，这成了他所发表的最后一篇文章。

　　随后的两年里，他在大部分研究中造假的事实露馅了。如今他雄踞个人撤稿篇数榜首，遭撤稿的文章有惊人的183篇之多，一个人就占了从1980年到2011年撤稿总篇数的7%。这个爬得高又摔得痛的故事还了学术出版的新：诞生了用于搜寻学术造假的统计学工具，以及乐意用它们寻找造假的“学术”。

　　2009年，史蒂夫·伊恩提斯（Steve Yentis）成为《麻醉》（Anaesthesia）的主编。他承认当时“并没有意识到问题已经很严重”。

　　2010年，故事迎来了关键的转折。和10年前的《麻醉与镇痛》一样，《麻醉》发表了一篇由多位作者署名，质疑藤井研究结果的评论，并且呼吁加强论文监管，过滤虚假结果。

　　这篇评论是由伊恩提斯授权发表的，后来他在“谎言、致命谎言和统计”一文中写到，这篇评论一经发出便收到了洪水般的来信，其中一位读者说“为研究者基础的事感到惋惜”，还督促麻醉学期刊的编辑要有所行动。这封信的作者是英国麻醉学家约翰·卡莱尔（John Carlisle）。

　　无独有偶，此时的麻醉学领域正处于两次大型学术不端冲击的恢复阶段。第一次冲击来自塔夫茨大学的疼痛学专家斯科特·鲁本（Scott Reuben），他在临床实验中数据作假，最终被判。紧接着在第二年，的高产研究者约阿希姆·博尔特（Joachim Boldt）被论文，违反学术，近90篇论文遭撤稿。

　　《麻醉》发表过6篇博尔特的文章，这让伊恩提斯有些难堪，因此当他读到卡莱尔的来信时，他看到了机遇。他回信直言卡莱尔要有所行动并拿出，“我督促相关来信人对藤井的研究进行分析”。卡莱尔坦白他那时并未掌握统计学的专业技术，在麻醉学同行中也不算很出名。但是他的结论却简单而又令人无法忽略——藤井的数据根本不可能从真实实验中获得。

　　卡莱尔将藤井从1991~2011年间168篇符合临床实验“金标准”的论文，与其他调查者文章中的数据进行对比。他对比的变量包括患者试验前的身高、血压，以及药物副作用出现的比例等。

　　通过这种手段，卡莱尔在2012年发表于《麻醉》的文章中得出结论：在藤井的一些文章中，通过其试验得到最终研究结论的概率是10-33——一个低得的数字。卡莱尔解释道：“这些数据偏离随机样本的程度足以说明它们根本不可能成为。”换言之：如果一件事好得难以置信，数学便会告诉你，它确实是不可信的。

　　卡莱尔的结论与2000年藤井的观点很像，不同的是这次受到了人们关注。在他的研究结果发表后不久，日本一项调查研究显示，藤井所发表的212篇论文中仅有3篇的数据明显可靠，有38篇无法是否造假，另外171篇则被认定完全伪造。调查最后总结道：“这相当于一个人坐在书桌前，写了一本关于科研点子的小说。”

　　卡莱尔的统计分析方法不仅适用于麻醉，还还适用于人体科学研究。他说：“这个方法可以应用于任何随机分组的研究，无论是植物、动物还是矿物研究”这对于其他学术刊物来说也“相当容易”施行。

　　斯坦福大学麻醉学家，时任《麻醉与镇痛》主编的史蒂文·谢弗（Steven Shafer）说：“约翰·卡莱尔的基本方法已经作为一种检测研究造假的工具开始得到推广，尽管它还在不断完善中。” 谢弗、伊恩提斯以及许多人都在为此努力。谢弗表示，他们的一个目标是使这个过程自动化。

　　谢弗表示，在2012年，他曾经亲自使用卡莱尔的方法鉴别出一篇投给《麻醉与镇痛》的论文存在造假。谢弗退稿后，又得知它被投递给了其他期刊。他说：“同一篇论文，不同的数据！我在拒稿信中暗示了这是造假论文，论文作者看到之后又了新的数据。”他与编辑通知了该论文作者所在机构的负责人，对方回复：“这些人以后不会再进行研究了。”

　　卡莱尔的方法需要与期刊编辑合作，但许多人并不愿意参与。有人认为有理由修订论文，论文作者们则认为他们是“围剿”的者。通常在允许匿名评论论文的网站上，如一篇论文出现大量后会跟进报道，这时才会有人采取行动。

　　例如，因发明了致癌物检测手段（埃姆斯测试）而闻名的布鲁斯•埃姆斯（Bruce Ames），在2009年与同事共同开展了一项与卡莱尔类似的分析研究。研究对象是三篇印度科学家Palaninathan Varalakshmi团队的论文。与卡莱尔不同，在这次调查中，三位研究者对他们进行了反击——他们称埃姆斯的方法“不公平”，说它是对关系和相关性的混用。这一次，负责Varalakshmi论文的编辑站在了Varalakshmi这一边。在这三位科学家发表过论文的期刊中，至今仍没有一家对他们的问题论文采取行动。

　　遗憾的是，这才是学术造假调查的典型结果。对造假者追责困难的部分原因在于学术出版本身。伊恩提斯说，学术出版“一直依赖于人，而不是体系；同行评审过程有其自身的优劣性，而造假鉴别不是它的强项”。

　　出版都建立在信任之上，即使可以获取原始数据，同行评审员通常也会匆匆略过。例如《自然》（Nature）要求作者“进行适当的统计检验，尤其需要说明数据是否符合统计检验的假设”。PLOS的执行编辑韦罗妮克•基尔默（Veronique Kiermer）认为，编辑“会将作者自证的过程作为评审的一部分，但不会系统地检查论文涉及的全部深层数据的统计学分布。”同行评审同样也不要求检查全部数据统计。

　　2014年，《自然》出现了一起令痛的干细胞论文撤稿事件（小保方晴子STAP细胞论文造假事件），小保方晴子的导师笹井芳树随后。但依旧认为：“我们和评审者不能发现论文背后的致命问题。”《自然》在另一篇评论中提到，抓得太严会造成真的问题，期刊“仅仅宣布撤稿可能就会受到起诉的，更别说在撤稿声明中提到学术不端了。”

　　《自然》或许乐于于将繁重的监管工作留给学术机构，但伊恩提斯已吸取教训。尽管2010年由他授权发表的评论引起了读者对藤井善隆论文造假问题的关注，但他却了评论信息。直到看到一堆信件，包括卡莱尔的信，他才行动起来。因此，直到2012年才刊出了那篇决定性的分析报告。伊恩提斯说：“如果现在评论中出现这样的，我不会再不管。”

杭州论文网

科学界的造假之王：写了200多篇论文183篇遭撤稿