- 四月,草长莺飞,校园漫天柳絮雪花般的飞舞着,伴随着下课铃声,让人透不过气来,再有不到一个月,就是各大院系提交论文的时间,图书馆也是在考研之后第一次变得“紧张”起来。
查重:用人民日报上的定义,论文查重,也就是查重复率,也就是文字复制比,是高校对学术不端文献的检测。
- 晚安也是硬生生看着把论文重复率,从30%变成5%,这其中的滋味,真是有苦说不出,让人崩溃。
在自己预先对论文进行查重的时候,一定要确定你们学校查重使用的系统!目前的高校使用的查重系统基本为知网、维普、万方,其实论文的查重方式都是大同小异,其中最重要的是数据库。
知网:论文的查重规则(最新版)
采用的是字符数切分送检方式,13个字符的相似性就会被确定为重复,13个字符将相当于6-7个汉字(计算机语言中,汉字为2个字符),如果一段中有6-7个字和其他文章有相似之处就会被认定为重复。
-
目前百分之七十的高校,采用知网检测系统,知网论文查重细分为很多种类,较为常用的就是知网本科查重系统PMLC,知网硕博查重系统TMLC,VIP5.1(更新了加了2个新的对比库,港澳对比库与外文对比库),此外,还有知网期刊检测,这个主要用来做普刊发表检测的,不适用于毕业论文检测。 对于本科生来说,知网pmlc一直都可以检查到本科论文库的。
-
另外,需要知道的是,知网对论文的分节是以“章”作为判断分节的。封面、摘要、绪论、第一章、第二章、等等这样一系列的都会各自分成一个片段来检测,每一个片段都计算出一个相似度,再通过这样每章的相似度来计算出整篇论文的总重复率。在知网查重系统识别到你论文中有某句话涉嫌抄袭的时候,它就会对这句话的前面后面部分都重点进行模糊识别,这个时候判断标准就变得更严格,加一些副词或虚词并不能避免被查出来。
维普:论文查重规则(最新版)
空间向量余弦算法,根据语义识别技术来判定文章是否存在抄袭现象(关键词技术)。
-
维普这些年势头不错,从知网的手上抢了不少的客户,因为知网对高校的授权费不断上涨,导致不少高校弃用知网,采用维普。
说到维普,真的是要敲黑板,尤其是对理工专业的同学们,维普很变态,维普很变态、维普很变态,如果你的小心脏受不了,请不要第一次就挑战维普,先不说维普这个一听就高大上的技术,就冲这几年越渐强大的数据库,各位都应该给它一个尊重。
就问有没有,本着满怀信心的将知网10%重复率的“成绩单”,递给维普大佬,却只能默默回来苦等二辩。
就问有没有,之前心事重重的维普20%重复率的“成绩单”,交到知网手里,却惊喜连连。 -
维普查重基本上对学术期刊进行了绝大部分的覆盖,也就是说,一旦论文作者的文章引用或者借鉴学术期刊,那么,维普查重基本上就会涵盖该学术期刊,在检测过程中就会自动识别与该文章相似的学术期刊,进行数据库的比对。说明了维普查重的检测范围学术期刊比较丰富全面。这是维普查重比知网查重严格的原因之一!
-
维普查重使用的是关键词识别技术,也就是即使文章作者的部分语句是自己原创的,但是只要其关键词和其他文章的关键词重复,维普查重也可能会自动识别该部分为疑似剽窃部分,这也是为什么诸如法学、经济学等文章使用维普查重重复率高的原因所在。关键词识别技术虽然能够在很大程度上识别大部分抄袭,但是也有可能会将作者的原创误判为疑似剽窃部分,该计算规则相较于知网而言就更为严苛和不合理。
——对于维普查重,我有心得,给各位提一下:尽量引用和借鉴互联网上的文章,而且尽可能引用年限较近的,原因在于维普查重对于互联网的文章收录有限。
万方:论文查重规则(最新版)
10个字符的相似性就会被确定为重复,10个字符将相当于5个汉字(计算机语言中,汉字为2个字符)
- 万方数据无论是从技术还是资金层面而言都处于劣势,其发展速度相对滞缓,技术部分发展相对有限,对于一些代码、表格、公式等都无法进行识别,其在检测过程中对于论文当中该部分只能选择忽视即不进行查重,相较于知网检测庞大的数据库而言,万方数据的数据库相对狭小,尤其是其无外文数据库,导致一些论文若仅仅是对外文的翻译调整即可逃避万方数据的查重,这也使得万方数据的借鉴意义对于知网检测愈来愈小。
万方如今地位如此尴尬,个人认为数据库占了很大的原因。
说了这么多,其实我想说的是,时间不早了,明天该上班的上班,该学习的学习,该写论文的写论文,emmm
网友评论