晚安：你为论文花了多少钱？

作者: 人生当苦何妨 | 来源:发表于2019-03-29 23:42 被阅读0次

晚安：你为论文花了多少钱？
【李居会馆】伟大的中国人，该醒了
还可以这样理财，你知道吗？
真爱，是浩荡而汹涌的！
为情绪买单的你，到底花了多少钱？
现在这个时代，哪些道理是结过婚才明白的？
2019-02-13
不要累死你的爱
习惯阅读5
还没有试过，你怎么知道

四月，草长莺飞，校园漫天柳絮雪花般的飞舞着，伴随着下课铃声，让人透不过气来，再有不到一个月，就是各大院系提交论文的时间，图书馆也是在考研之后第一次变得“紧张”起来。

查重：用人民日报上的定义，论文查重，也就是查重复率，也就是文字复制比，是高校对学术不端文献的检测。
晚安也是硬生生看着把论文重复率，从30%变成5%，这其中的滋味，真是有苦说不出，让人崩溃。
在自己预先对论文进行查重的时候，一定要确定你们学校查重使用的系统！目前的高校使用的查重系统基本为知网、维普、万方,其实论文的查重方式都是大同小异，其中最重要的是数据库。

知网：论文的查重规则（最新版）

采用的是字符数切分送检方式，13个字符的相似性就会被确定为重复，13个字符将相当于6-7个汉字（计算机语言中，汉字为2个字符），如果一段中有6-7个字和其他文章有相似之处就会被认定为重复。

目前百分之七十的高校，采用知网检测系统，知网论文查重细分为很多种类，较为常用的就是知网本科查重系统PMLC，知网硕博查重系统TMLC,VIP5.1（更新了加了2个新的对比库，港澳对比库与外文对比库），此外，还有知网期刊检测，这个主要用来做普刊发表检测的，不适用于毕业论文检测。对于本科生来说，知网pmlc一直都可以检查到本科论文库的。
另外，需要知道的是，知网对论文的分节是以“章”作为判断分节的。封面、摘要、绪论、第一章、第二章、等等这样一系列的都会各自分成一个片段来检测，每一个片段都计算出一个相似度，再通过这样每章的相似度来计算出整篇论文的总重复率。在知网查重系统识别到你论文中有某句话涉嫌抄袭的时候，它就会对这句话的前面后面部分都重点进行模糊识别，这个时候判断标准就变得更严格，加一些副词或虚词并不能避免被查出来。

维普：论文查重规则（最新版）

空间向量余弦算法，根据语义识别技术来判定文章是否存在抄袭现象(关键词技术)。

维普这些年势头不错，从知网的手上抢了不少的客户，因为知网对高校的授权费不断上涨，导致不少高校弃用知网，采用维普。
说到维普，真的是要敲黑板，尤其是对理工专业的同学们，维普很变态，维普很变态、维普很变态，如果你的小心脏受不了，请不要第一次就挑战维普，先不说维普这个一听就高大上的技术，就冲这几年越渐强大的数据库，各位都应该给它一个尊重。
就问有没有，本着满怀信心的将知网10%重复率的“成绩单”，递给维普大佬，却只能默默回来苦等二辩。
就问有没有，之前心事重重的维普20%重复率的“成绩单”，交到知网手里，却惊喜连连。
维普查重基本上对学术期刊进行了绝大部分的覆盖，也就是说，一旦论文作者的文章引用或者借鉴学术期刊，那么，维普查重基本上就会涵盖该学术期刊，在检测过程中就会自动识别与该文章相似的学术期刊，进行数据库的比对。说明了维普查重的检测范围学术期刊比较丰富全面。这是维普查重比知网查重严格的原因之一！
维普查重使用的是关键词识别技术，也就是即使文章作者的部分语句是自己原创的，但是只要其关键词和其他文章的关键词重复，维普查重也可能会自动识别该部分为疑似剽窃部分，这也是为什么诸如法学、经济学等文章使用维普查重重复率高的原因所在。关键词识别技术虽然能够在很大程度上识别大部分抄袭，但是也有可能会将作者的原创误判为疑似剽窃部分，该计算规则相较于知网而言就更为严苛和不合理。

——对于维普查重，我有心得，给各位提一下：尽量引用和借鉴互联网上的文章，而且尽可能引用年限较近的，原因在于维普查重对于互联网的文章收录有限。

万方：论文查重规则（最新版）

10个字符的相似性就会被确定为重复，10个字符将相当于5个汉字（计算机语言中，汉字为2个字符）

万方数据无论是从技术还是资金层面而言都处于劣势，其发展速度相对滞缓，技术部分发展相对有限，对于一些代码、表格、公式等都无法进行识别，其在检测过程中对于论文当中该部分只能选择忽视即不进行查重，相较于知网检测庞大的数据库而言，万方数据的数据库相对狭小，尤其是其无外文数据库，导致一些论文若仅仅是对外文的翻译调整即可逃避万方数据的查重，这也使得万方数据的借鉴意义对于知网检测愈来愈小。
万方如今地位如此尴尬，个人认为数据库占了很大的原因。

说了这么多，其实我想说的是，时间不早了，明天该上班的上班，该学习的学习，该写论文的写论文，emmm