既然如此,“其他的学术文献数据库是否存在同样的问题?”拉贝告诉时代周报,他希望继续求证,但是不想再用“”的老办法,而是决定研发针对SCIgen论文的鉴别技术,直接找出这些由机器制造的论文。
“这些自动生成的论文是否也可以被自动检测出来?我的答案是肯定的。”拉贝说。2012年,他成功开发出了自己的鉴别技术,并将发表在《科学计量学》上。
与此同时,拉贝利用自己的检测软件检测出了85篇由SCIgen生成的虚假论文,它们均被IEEE文献数据库收录。据了解,IEEE文献数据库主要涉及计算机科学、电机工程学和电子学等领域,隶属于美国电气和电子工程师协会(IEEE),后者是全球最大的国际性的电子技术与信息科学工程师协会。
拉贝将这一情况告知IEEE后,对方删除了这些论文,为此他当时并没有此事。几个月后,拉贝又在IEEE文献数据库中发现了新的一批SCIgen论文,拉贝再次与对方联系,“不过这一次,他们好像自己已经发现了。现在IEEE数据库似乎已经被清理‘干净’了。”
差不多同时,拉贝在学术出版机构Springer的数据库中发现了另一批SCIgen论文,其中有一些是在2013年最新发表的。拉贝前后发现的SCIgen论文总共加起来有120多篇。
尽管拉贝的工具在检测SCIgen论文上十分有效,但也只能应对一时。他告诉时代周报,现在至少有两种SCIgen程序的翻版,一个用在数学领域,一个用在物理学领域。“市场上”是否还有其他论文生成器?没有人知道。
“就像对付那些剽窃行为一样,他们也该刊登公示,但看上去他们只是移除了这些论文了事。”拉贝说。今年年初,对出版方的处理方式感到不满的他向《自然》披露了此事。
寻找中国“作者”
在拉贝发给时代周报的120多篇虚假论文中,除了两篇论文的署名作者来自伊朗,两篇来自,其他的署名作者均来自中国,它们几乎都是会议论文,以会议论文集的形式被上述两家数据库收录的。这些论文发表时间最早是2008年,最晚是2013年。
一名高校学者告诉时代周报,会议论文是在学术