论文降重其实是一件很简单的事情,摸清套路后完全不需要花费太多的精力。在这里,笔者简单整理了一些前辈们的降重经验,希望帮助大家伙,绿了那标红的句子。
关于重复率,有两个公式:
论文重复率=相似字数÷总字数
分析:
简单理解:查重时把文章分解为一个个小句,根据某个算法算出单句相似度。把其中相似度大于50%的句子的相似字数加总再除以论文总字数即为重复率。
单句相似度,似乎目前还没有很明确的概念,大致意思就是:作者写的一个句子和已有文献句子相同的字数占该句子总数的百分比。
最重要的一个信息是:相似度>50%的句子才会被标黄,相似度>80%的句子会被标红。相似度<50%的被标绿并且相似度被计为0.
这样一来,我们的降重目标就很清晰了,基本上有2个办法:
①降低每句相似字数,以降低总相似字数;
②把句子的相似度降低到50%以下,那么这句相似字数直接就变为0了。
具体措施:
1、对于【轻度相似】的句子,只要替换几个关键词即可,不需要花费太多的时间跟精力,我们的目标是被标红的句子。
2、对于【重度相似】的句子:
(1)短句处理:查重分解句子是根据标点来断句的,删去句子后面的逗号,将短句连成长句以增加该句的分母,对语序做了调整,这样一来,句子的相似度会大大降低。
(2)长句处理:总有些专业词组几乎不可能修改,而且在句子中占的比重过大,需要战略性地放弃修改这些部分,把他们独立成一个短句分离出去,达到降低重复率的作用。
(3)对于在文段中没有起到作用的标红语句,则可以选择删去。
网友评论