美文网首页
春天不仅属于内容创作者,也属于内容抄袭者(上)

春天不仅属于内容创作者,也属于内容抄袭者(上)

作者: 728306dbc561 | 来源:发表于2018-05-04 17:33 被阅读13次

    一、抄袭者的春天

    区块链内容平台给内容创作者带来福音的同时,也给内容抄袭者带来免费的午餐。内容创作者获利越多,抄袭的风气会越旺盛。

    Primas,赞我,Ulord对版权保护都给出了初步解决方案,但是语焉不详,还看不出背后的原理。

    1、Primas:给文章打上哈希值和数字签名,即Primas DNA。

    2、赞我:结合SHA算法(安全散列算法)对开发的数据源进行单项加密。

    3、Ulord:用AI服务模块进行原创内容审定,防范恶意模仿、老话新谈。

    primas和赞我很容易破解,内容修改哪怕一个逗号,哈希值就变了,抄袭者轻松躲过检测。

    Ulord是利用人工智能的文字识别算法,但是目前的机器识别还达不到语义分析的能力。

    (PS: Press One用于证明你的数字身份,不是用于版权保护。例如,你把别人的一篇文章,原文不动的烙印在Press One上,这篇文章就属于你的证明了。如果原作者发现,也只能跟你打口仗,没有别的办法。)

    早在2008年,中国各高校为了检测毕业生论文的抄袭,开始采用学术不端检测系统。大概当今所有的研究生毕业论文都会经过抄袭检测。


    二、论文学术不端检测的原理

    应用最广泛的是清华同方中国知网的论文学术不端检测系统,其检测原理是将论文和数据库论文对比,检查文字的重复率。

    对比数据库包括:中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,中国重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,个人比对库,其他比对库。

    部分书籍不在知网库,检测不到。

    一篇论文被判别抄袭的条件:引用或抄袭的A文献文字总和在你的各个检测段落中要达到5%;连续13个字相似或抄袭被识别出来。

    中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为5%,以段落计,低于5%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。

    举个例子:假如检测段落1有10000字,那么引用单篇文献500字以下,是不会被检测出来的。


    三、道高一尺,魔高一丈

    抄袭检测系统的初衷是很好的,在一定程度上能够起到警示作用:杜绝抄袭,踏实学问。正所谓道高一尺,魔高一丈,中国知网的“学术不端检测系统”早已被同学们攻克。

    大学生论文抄袭防检测有几大法宝:

    1.改写。把原论文的句子用自己的话改写一遍,换换词汇、叙述顺序、主被动语态,改写过程中对每字每句都了如指掌,答辩时亦会如鱼得水。

    2.翻译。英文过关的同学,挑选一些英文论文的内容段落,翻译成中文,排列组合凑成一篇文章。我觉得这种方式还是挺有技术含量的。

    3.图片化。适合于理工科公式和图表多,将别人的公式和图表弄成图片,稍作修改,系统毫无办法。

    4.这条最霸道,插入空格法。拿一篇论文一点不改,只是将文章中所有的字间插入空格,然后将空格字间距调到最小。因为查重的根据是以词为基础的,空格切断了词语,自然略过了查重系统。

    如果说优化检测系统的算法,尚且能够提高检测成功率。那么,下面这个高阶抄袭法,检测系统彻底无解。

    我在下篇文章中谈谈高阶抄袭法,以及应对之策,敬请关注。


    我是白涛,区块链和通证经济的爱好者和写作者,欢迎留言交流。
    加入的写作社群有:BEAT、BU联盟、007。

    相关文章

      网友评论

          本文标题:春天不仅属于内容创作者,也属于内容抄袭者(上)

          本文链接:https://www.haomeiwen.com/subject/dwxjrftx.html