2018年初,《FEBS Letters》期刊(影响因子:4.124)的编辑们首次注意到,生物s医学领域的论文似乎存在系统性数据造假的问题,推测是“论文工厂”的产物。论文工厂指的是出售造假论文的非法组织,服务包括数据造假、出售论文作者身份、提供虚假同行评审等。
今年以来,生命科学领域有大量涉嫌造假的论文被撤稿。例如,2021年1月,英国皇家化学学会的期刊撤稿了68篇文章,大部分作者来自中国医院。
6月27日,FEBS Letters发布了一篇题为“The raw truth about paper mills”的文章,针对论文工厂造假论文的特征进行了分析,下文简要总结了这些特征。
链接:
https://febs.onlinelibrary.wiley.com/doi/10.1002/1873-3468.14143
相同的论文模板、循环利用的数据
论文工厂的造假论文具有非常相似的结构或者共同的模板。一些完全不相关的论文,彼此间的文本、表格和图形整体布局和设计都很相似,而且重复使用数据。重复使用的数据不仅包括Western blots、显微图像,还包括散点图、条形图,甚至具体数值和数据集。
下图显示出两篇不相关论文的图像以及全部数值重复。这两篇论文隶属不同单位的作者,均已于2020年7月被撤稿。
引用完全不相关的论文
论文工厂的论文常常相互引用。例如,最近提交至FEBS Letters的一篇文章,描述了miRNA在特定疾病中的作用,列出的一些参考文献,与该论文没有任何相关性,感觉是纯粹为了引用而引用。
编辑仔细检查引用的四篇论文后发现,每篇文章都有一个条形图,与所提交论文的图表数值相同,但设计和颜色有所改变,如下图所示。这四篇文章的作者来自中国不同的医院,发表在两个不同的期刊上。
原始数据的问题
如果怀疑论文造假,则要求作者提供原始数据。当作者被要求提交原始数据时,有些作者表示无法提交,有的作者干脆不回复。如果论文已经进入修订阶段,作者同意提交原始数据的可能性还会大一些。然而,作者所提供的“原始图像”常引起编辑对论文真实性的怀疑。
这些论文中,Western blots和DNA凝胶经常有人工处理的痕迹。据称,一种基于人工智能的图像合成技术Generative Adversarial Nets,可以电脑合成极其逼真的Western blots图像。
总体而言,“论文工厂”批量生产的造假论文,常存在以下特征:
-
多篇无相关性论文的文本或结构高度相似;
-
图表与其他论文的组成、结构、注解以及格式高度相似;
-
公式化的论文标题结构;
-
论文提交系统显示,该论文与不同作者的多篇论文均由同一台计算机提交;
-
作者使用商业的、非学术机构的电子邮件地址;
-
作者的ORCID ID缺失;
-
参考文献引用完全无关的论文;
-
当编辑使用作者提议的评审专家时,审稿时间异常短,并且都为好评。
参考文献:
FEBS Lett. 2021;595(13):1751-1757.