《科学美国人》分析了100篇以上学术论文的语言用词,发现了令人担忧的:一些论文雷同到看上去像是工业规模大量生产出来、用以糊弄同行评审系统的。
例如,2014年5月出版的《诊断病理学》中有一篇论文,从表面上看,是一篇典型的同行评审文献。作者是来自广西医科大学的8名科研人员,他们评估了基因XPC的不同变体是否与胃癌有关,但是并未找到两者之间的关联,最后只好说在这个问题上,他们的论文并不能得出最终结论,论文中这样写道:
“然而,有必要使用标准化、无偏差的分类方法,通过病症相同的胃癌病人和相匹配的控制,进行大样本研究。然而,基因与基因、基因与的交叉作用也应该被纳入到分析中。研究中考虑到所有这些因素,将最终让我们对XPC多态性与胃癌风险的关系有更好、更全面的理解。”
文章指出,多年前发表在《欧洲人类遗传学》上的一篇论文,是关于“DDH1基因的不同变体是否与前列腺癌(PCA)有关”的荟萃分析:
“然而,有必要使用标准化、无偏差的方法,通过病症相同的前列腺癌病人和相匹配的控制,进行大型试验。然而,基因与基因、基因与的交叉作用也应该被纳入到分析中。研究中考虑到所有这些因素,将最终让我们对 CDH1160 C/A多态性与前列腺癌风险的关系有更好、更全面的理解。”
两段文字的措辞几乎完全一致,连“最终让我们有更好、更全面的理解”这种空洞无物的词都一模一样。唯一的区别只是研究的基因和疾病不一样,用XPC替换CDH1 ,用胃癌替换了前列腺癌。
这样的学术抄袭屡见不鲜。许多看似的研究小组都在论文中抄袭上述段落。《公共科学图书馆期刊》(PLoS ONE)上的一篇论文也用到“最终让我们有更好、更全面的理解”,不过研究主体又变成了 “XRCC1基因突变与甲状腺癌风险的联系”。
另一篇发表在《癌症期刊》(Journal of Cancer ,威立出版社出版)上的论文则是“最终让我们对XPA 基因突变与癌症风险有更好、更全面的理解”,诸如此类,不一而足。有时只是措辞上的小变化,但是在十几篇论文中可以发现,语言完全雷同,只是把不同的基因和疾病嵌进这段文字中,就像在玩一个版的疯狂填词游戏。
这样的“填词论文”还有很多其他的例子。搜索短语“由于明显的不相干排除”,得到十几篇各种类型的研究论文,只有一篇不是来自中国。键入“利用标准化的形式,来自已经发表的研究数据”同样能搜到十几篇研究论文,全部来自中国。输入“Begger法漏斗图”也得到数十篇文章,也都来自中国。