与已发表论文相似而被撤稿,2/3是中国学者 本来可以防范掉
作者|MedEditor
来源|Hanson临床科研(ID:HClinicalResearch)
这种撤稿是怎么回事?
这几天后台有多位朋友留言问,发现有篇文章被撤稿,如何理解:"One of the conditions of submission of a paper for publication is that authors declare explicitly that their work is original and has not appeared in a publication elsewhere. Re-use of any data should be appropriately cited. As such this article represents a severe abuse of the scientific publishing system."
字面意思是:发表论文的基本要求是,作者确认其论文是原创作品,且未发表在其他出版物。应该适当引用其他论文和数据。我们判断本论文出现了对科学出版系统的严重滥用。
说白了就是:这篇论文复制已发表论文内容太多,被认定为抄袭,故而撤稿。
我们做了检索,找到了其中的12篇论文。对这些论文进行分析并引以为鉴,才能避免以后再次出现类似情况。
检索数据库:Medline
检索工具:文献鸟/PubMed检索时间:August 10, 2020检索及分析机构:Healsan Consulting LLC(美国恒祥咨询公司); Stork(文献鸟)
从时间分布看,12篇做了上述关键词标示的撤稿论文中,2016年有3篇,2017和2018年2篇,2015年和2019年各一篇;近日有一篇由此撤稿,但撤稿信息没有出现在Medline数据库。
从作者分布看,12篇因为抄袭论文内容而被撤稿的论文中,有8篇是中国学者发表的论文。
其中无锡第五人民医院有两篇,其他机构均只有1篇。
这些因为论文内容抄袭而被撤稿的论文,发表的期刊如下:Arch Phys Med Rehabil, Curr Gene Ther, Food Chem, Chemosphere等期刊。
需要说明的是,我们也发现,很多因为内容抄袭而被撤稿的论文,因为其撤稿说明并没有被Medline数据库收录,所以上面检索仅仅是冰山之一角。
比如最近频繁传出的论文工厂事件:
SCI论文造假新高度:8篇一样。群友怎么说?通讯/共同作者怎么办?
比克博士再揭121篇涉嫌造假论文,113发表在同一杂志;还在等之前400余篇处理结果
此3分杂志危险。发同一组患者,先后患上鼻咽癌、前列腺癌,及在三个不同医院患上肺癌。
到底多高相似度,导致了期刊撤稿?
因为通常来说,对于已经发表的文章,期刊也不愿意撤稿,那样也会极大地影响期刊的声誉。
所以我们用turnitin查重数据库做了查重。显示这些因为内容复制被撤稿的论文,相似度普遍高于50%。
论文相似度过高,到底有多严重?
应朋友们要求,我们一直开展有1元查重。所以积累了大量查重结果。
在对我们最近查重的295篇SCI论文的分析中(图1),发现相似度大于50%的草稿占9.15%,意味着这些论文如果不加修改而发表,随时都可能被撤稿;
另外,相似度30%-49%的草稿23.05%,这些稿件如果未加修改就投稿,基本上是被直接拒稿。
查重有严重问题的草稿占到了约1/3,显示出这一问题的严重性。
(图1. Credit:MedEditing LLC, USA)
但需要注意的是,这个结果并不能代表投稿论文的全貌。因为写作过程中参考过其他论文的作者、寻求查重的可能性更大,所以本样本量可能存在偏倚。
举例几个相似度高的草稿查重结果。
如图2,相似度高于50%。
如果杂志社未做查重而发表,随时被指责为抄袭而毫无争议地撤稿。
(图2. 相似度高达60%,最高的单篇相似度分别为14%和6%。Credit:MedEditing LLC, USA)
如图3,相似度超过30%。
如果这些稿件未经处理而直接投稿,会被直接拒稿。
(图3. 相似度40%,单篇最高20%。Credit:MedEditing LLC, USA)
15%-29%的相似度并不意味着是安全的,也属于相似度高的范围。
具体也要看有没有单篇相似度很高。如图4中的论文相似度为26%,但单篇都很低,如果所有引文都有标注,则是安全的。
(图4. 相似度为26%。Credit:MedEditing LLC, USA)
剽窃所致撤稿,
占到中国学者所有撤稿的39%
根据美国恒祥咨询公司的大数据分析,近三年中国SCI论文共有1397篇SCI论文撤稿,其中因为剽窃所致的撤稿有547篇,占39%
如何防范?
面对如此高比例的抄袭现象,通讯作者尤为紧张和焦虑。我们收到最多的问题就包括“如何预防第一作者投稿的论文抄袭?”
想想也是,兢兢业业努力了一辈子,终于功成名就,却可能因为一个学生为毕业去作弊而前功尽弃。
最基本的防范当然是:尽责。当通讯作者抱怨自己因第一作者抄袭而被带进坑时,需要首先问问自己:是否做好了实验室管理和常规lab meeting听取实验报告?是否起到了导师应有的责任,给予学生相应培训?是否认真检查过学生的论文原始数据?及最后一招,是否向学生要了投稿前查重报告?
其实大部分学生也是无辜的
即使导师在上述各点上做好了,就能杜绝相似度高吗?难。
新西兰的学者做了研究,发表在2017年Higher Education (高等教育)杂志。文章题目是“‘It’s not fair’: policy discourses and students’ understandings of plagiarism in a New Zealand university”。
研究显示,大部分抄袭的发生,是由于他们根本不知道哪些原因导致了抄袭。
作者也由此觉得这对学生不公平,因为学校、机构及老师(通常为PI或者通讯作者)有义务提供这些教育;但目前却没有这方面培训。
学生的认识有限,老师又没有专门就这个问题给予培训,出了问题该处罚谁呢?
中国学者“不知情”抄袭
主要原因是什么?
1,源于写SCI论文的方法。
因为英语不是中国人的母语,而大部分科研工作者对自己的英语水平不够自信,所以就去摘抄已经发表的文章中句子甚至段落;如此一来,投稿时编辑查重结果显示自然是相似度很高,尤其以方法学部分尤为严重。
2,参考的文献有限。
近几年科研论文尤其是生物医药领域的科研论文发文量急剧增加,但是采用的基本参考文献却主要是那些文献,肯定也会导致更大机会与之前已经发表的文章出现相同句子。
还有部分研究者用同样的方法学做了系列研究,实验方法学部分相同,或者与其他人的研究方法类似,如果不加修改直接引用也会导致相似度明显增高。
如何避免不知情抄袭?
核心两点:原创和引文。
1),千万不要大段摘抄或者在一篇文章中过多引用一篇文献的内容,因为这是明显的抄袭,语言润色或者修改并不能改变抄袭的本质。
2),同样,对于内容的抄袭,尽管已经通过修改词句等降重手段来掩饰,但仍然是抄袭。
3),所有引用都加上引文标注。
4),最关键的,从思想上意识到,高相似度就会被认定为抄袭;从具体防御策略上,在完成稿件及投稿之前,一定要做查重。这也是最简单的防范措施。
5),最根本方法。还是自己组织语言撰写文章。这是从根本上解决问题的关键。尽管英文写作确实很难,但是勤加练习,还是会越来越得心应手。
Hanson解读:
1,针对Medline数据库的统计发现,因为内容抄袭而导致的撤稿中,中国学者占了大多数;
2,针对投稿前草稿的查重显示,1/3草稿相似度过高;
3,只是责怪通讯作者或者第一作者有失公平,因为目前培养体系中就未涉及到这部分内容。学生或者青年学者可能会出现不知情抄袭,需要学校及导师专门加强这方面的教育;
4,有方法可以完全避免抄袭。最简单一招就是:投稿前做查重。
编者按:本文转载自微信公众号:Hanson临床科研(ID:HClinicalResearch)
广告、内容合作请点这里:寻求合作
咨询·服务