1、知网
其实知网背后的查重逻辑很简单,而且可以说英文比中文更加简单,我之前看到有小伙伴说知网中文查重单纯的调换语序、插入新的词汇和改变一两个词语都是没用的,如果真的是这样的话,那知网现在英文的库以及算法还远没有中文成熟,可能大家都听说过一个说法就是知网是以13个字(单词)作为基准来测量论文是否重复,也就是说如果不能检测到连续重复的13个字,就不会被检测到。虽然有这个说法,但是我改了很多英文的知网查重论文之后,我发现并不一定是13个英文单词,有时候小于13个(比如9-10个)单词它也会标红,这可能是知网有它自己的算法,那如果是这样的话,还有没有什么捷径可以走呢?答案是有的。
虽然知网英文查重我见过小于13个单词标红的情况,但是我却从来没有见多小于5个单词(6-9个的也非常非常少)标红的情况。所以,这个意味着只要不让系统查到5个单词以上重复的情况就可以了,如果大家觉得5个单词很难,那其实你可以改到只有不超过8个左右单词重复就可以,我之前尝试这种改法,把一篇20000万字重复率30%的论文改到重复率只有1.5%。
而且,上面说了,知网英文论文查重机制很有可能是比中文要更傻瓜一些的,即你可以通过一些具体而又简单的手段达到上述目的,我就以一句简单的13个单词的句子举例,比如:
(1) 替换词语
降重前:Writing in English was so hard for Korean people born in the 1950’s.
降重后1:Writing in English was so difficult for Korean people born in the 1950’s.
替换后2:Writing in English was incredibly difficult for Korean guys born in the 1950’s.
第一个版本替换了hard,第二个同时替换了so、hard和people,如果你觉得第一种不保险,可以使用第二种,因为可以看出,即使替换了hard(降重后1),hard前后分辨还有5个和7个单词保持不变,使用过知网的小伙伴都知道,前后句是一起查重的,就是知网并不会给你断句,只要连贯有13个单词重复就算重复,如果按照第一种改,那只要这句话的后面一句前2-3个单词继续重复,知网同样还是会算作重复,所以我更推荐第二种改法,而且为了保险起见多改一个词也不会浪费太多时间(知网查重要花很多钱,据我所知现在网上VIP5.3系统查重价格起码200+,便宜的大家千万别去弄啊,有论文泄露风险的)。
从这句话当中我们也发现,句子中的介词与动词一般是无法直接替换的,所以替换词语的技巧在于尽量替换句子中可以替换的名词,形容词以及副词,如果是知网的小伙伴降重的话,我首先推荐这个方法,因为比较简单,不用重新调整任何的顺序,操作起来最顺手,而且我尝试过也确实有效。随便操作下降重到20%以下都没问题。
(2) 插入词语
降重前:Writing in English was so hard for Korean people born in the 1950’s.
降重后:Writing in English was so difficult and nearly impossible for Korean people that were born in the 1950’s.
可以看到,句子中插入了一些不会影响句子原义的单词,这种手法你可以通过观察句子,看能不能找到和句子中原本就有的形容词、副词或者名词相近的意义的单词,通过添加不必要的描述,或者看句子有没有从句省略之类的,把原有的句子分成两半甚至三半(最好从句子中间划分,这样保证原句子前后的单词都不超过10个),达到降重的目的。不过这个方法比第一个方法操作起来稍微困难一些,不过只要有一点英语基础的小伙伴就可以做到啦,也挺简单的。
(3) 重构语序
降重前:Writing in English was so hard for Korean people born in the 1950’s.
降重后:It is so hard for Korean people born in the 1950 's to write in English.
这里知网的降重只需要简单的重构语序,比如像上面这句话我们把它改为主语从句,这样的话系统检测不到完全相同顺序的10个左右的单词,就不会算作重复啦,不过这个方法需要把句子打乱重排,好在知网只需要很简单的重排就可以,对于稍微有一点英语基础的小伙伴也很容易做到。
通过上面说的三种方式混用,不需要特别高级的英语逻辑的思维,也绝对可以像我说的把英文论文的知网查重率降到5%以下,甚至更低,不过如果需要1%左右的小伙伴,则需要多次查重并且巧妙地混用这三种方式,比如:
降重前:Writing in English was so hard for Korean people born in the 1950’s.
降重后:It is incredibly hard and nearly impossible for a Korean guy that was born in the 1950’s to write in English.
如果你每一句都这样来认真修改,我敢保证知网绝对再也查不出你这句是重复的,而且和上下文的联系也都断绝了(句首句尾都不一样了),这样别说3%,重复率降到接近0%都是没问题的,不过,如果对于要求不高的小伙伴,这样写会耗费大量时间,而且对于很多英语基础不太好的小伙伴可能门槛稍高一点,所以只要根据自己的情况在上述的方法中灵活运用就可以了,知网的英文降重就说到这里,期望对大家有用!
2. Turnitin
说完知网,终于说到了让我们又爱又恨的Turnitin,说爱是因为每次拿Turnitin查重之后,总是需要绞尽脑汁来修改,包括利用一些高级词汇来替代等,从而一定程度上可以使原文用词更加多样化;但是恨呢,是因为Turnitin改重实在是太难啦!可以说上述知网改重方法的作用都极为有限,不过也可以作为参考,因为只有掌握了知网的改重方法并且在此方法上进一步扩展,才有可能达到Turnitin降重的效果。
在说到Turnitin的有效改重方法之前,必须先说一些Turnitin查重的内在逻辑,在改了很多Turnitin论文查重之后,我发现Turnitin根本没有所谓的连续重复几个词就算重复的说法!如果硬要说,Turnitin我很少见过2个词以下被标红的情况,而3个词连续重复就被标红比比皆是!那说这个有什么用,其实就是想告诉大家,仅仅通过知网的单一修改方式改Turnitin基本不顶用!甚至,我见多很多人改完的论文提交到Turnitin查重比没改的重复率更高!而这些这都是基于Turnitin的内在查重逻辑来的,如果你仅仅是通过利用简单句替换简单句,比如用一个26个单词的简单句替换一个16个单词的简单句(意思不变,通过简单修改语序,插入单词,替换单词等),那26个单词都重复就会比之前16个单词重复的重复率不降反升。所有的这些都是基于一个事实,就是在答主观察了很久之后,发现Turnitin可能是根据语言逻辑和行文逻辑进行查重的,而不仅仅是根据查找重复的字段来进行判定。
说实话,很多小伙伴可能会问那这是什么鬼,可能太深的东西说多了很多小伙伴也没法理解,那就直接说这个东西有没有一些技巧呢?
根据我的经验,技巧呢,有!但是我相信这个技巧需要改一些文章来充分理解和掌握。同时呢,好消息也有,一般要求使用Turnitin查重的论文最终的要求都不会定地太高,比如,我很少见什么要求要求将Turnitin的重复率降到3%以下,最常见的要求一般是10-20%这个区间,所以一般的论文只要降到这个区间就好啦。
既然Turnitin是根据逻辑,准确的说是语言逻辑来判定重复,那其实最根本的Turnitin降重技巧就是改变原句的语言逻辑,具体到操作上有以下几个技巧,不过都需要一定的英语水平才能得心应手。
(1) 联合运用上述知网降重技巧并尽量避免简单词汇
降重前:Writing in English was so hard for Korean people born in the 1950’s.
降重后:It is incredibly tough and literally impossible for a Korean resident that was born in the 1950’s to conduct English writing.
还是以上面那句话举例,其实第一句话放到Turnitin里99%肯定是重的。那我们怎么修改呢,首先,第一句话太简单了,第一、句子结构的简单,除了修饰people用了一个省略连接词的从句,其它部分就是典型的主谓宾简单句,所以我们可以考虑加一个主语从句,同时也多加一些修饰语部分,让句子结构变的更加复杂;第二、用词太简单了,什么so,hard,people之类的词,大家都喜欢用so,这个so不重复才怪对吧,所以要想办法用更高级词替代so,hard,people之类的词,这里仅仅提供一个参考,比如使用incredibly, tough, resident之类的词,当然有时候有些词并不一定是等价的,比如people和resident,resident更有居民的意思,而people是泛指的人,所以有时候需要根据文章上下文进行判断,可以使用什么词汇替代,总之,Turnitin查重首要避免简单词特别是那种烂大街的词的使用(避免语言逻辑太简单),其次,如果光改词不行,那就必须改句子行文逻辑,而这一条里面讲的就是最简单的一种,即稍微对语序作出调整并加一些简单的修饰。
(2)插入语的使用
降重前:It is incredibly tough and literally impossible for a Korean resident that was born in the 1950’s to conduct English writing.
降重后:It is incredibly tough, even literally impossible, for Korean guys born in the 1950’s, due to the lack of systematic English education, to conduct English writing.
那如果上面那个知网的方式改了还是重复怎么办,根据我的经验,既然Turnitin是一个根据行文逻辑查重的方式,那插入插入语就是一种很好的打破英文语言逻辑的方式,虽然这句话已经被改地很恶心了,放在论文里也稍显复杂和难懂,包含很多多余的信息,所以可以将literally Impossible改成插入语放进去,同时Korean guys后面也可以加插入语修饰,说实话,如果还是不满足,大可以用更多插入语修饰Korean guys, English writing等等,可能很多考四六级的小伙伴或者和我一样出国留学考过Toefl甚至GRE的小伙伴都被这个东西恶心过,但是不得不说,插入语真的是对付Turnitin的好办法之一,然而,往往论文插入太多无关信息可能看起来太难看,那就最后说一个杀招,可能会比插入插入语好一点的办法。
(3) 化主动为被动
降重前:It is incredibly tough and literally impossible for a Korean resident that was born in the 1950’s to conduct English writing.
降重后:For Korean residents that were born in the 1950’s, English writing is rarely skilled.
对于英语这门语言来说,化主动为被动可以说是对语言逻辑完全的修改和颠倒,所以,通过这种方式,一般对Turnitin的降重都会取得相对较好的效果,当然,这对英语基础不太好的小伙伴会有一点别扭,最大的原因是中文是极大地弱化了主被动关系的一门语言,比如,用中文说,我是在中国出生的,这个理所当然,然而,在英语环境里,就像上面写的那句话一样,你不可能自己把自己生出来,所以正确的写法是I was born in China,翻译过来就是我是在中国被生出来的,别扭不别扭,但是,相信大家勤写就好啦,我现在写多了英文的东西,有时在写中文的时候反而过分强调主被动关系而显得很别扭,所以相信大家如果多写就会发现,英语里几乎90%的主被动关系都可以在保持原义不变的情况下转化,同时又避免了像插入插入语那样句子过分冗长的情况,所以转化主被动关系就是对付Turnitin最大的绝招啦(不过英语论文最好还是主动语态+简单句是最好的,如果Turnitin不算重复的话最好别加太多被动语态)。
(4) 尽量先改重复率大的论文条目
最后一条,并不是关于语言的建议,而是我改Turnitin总结发现的一个技巧,也一起分享给大家,查过Turnitin的人都知道,Turnitin查重报告和知网查重报告不一样的一个点事Turnitin报告里和不同论文重复的部分会用不同颜色标出来,非常醒目,最后也会给出和这些论文分别重复了多少,为了醒目,在Turnitin报告里,重复率前三的论文条目会用红色,玫红色和紫红色在文中具体位置标出(一般),而对于比如重复率超过30%的论文,前三篇的重复率一般是很高的,甚至会出现单篇大于15%的情况,所以我一般降重会先降低重复率>2%的论文条目,这一点和知网不一样,因为你会发现,Turnitin即使再降重,可能也会出现零星的重复情况,这就意味着你如果把重点集中在本来重复率就<2%的条目上,很有可能你改了之后你新使用的语言会和另一个条目重复,而重复率依然是<2%,这样会导致你在做无用功,而对于一般要求在小于20%的论文里,根据我的经验,你把重复率>2%的条目全部认认真真灵活运用我上面说的方法,肯定是可以达到要求的,所以,一定记得先去改重复率>2%的条目(知网不同,知网最好全部改,因为一个是知网界面对用户不太友好,所有都是红色标出,这样的话在看正文的时候根本不可能指导这句话是和哪一个条目重复,除非你一个一个地对着报告去看,这样的话十分浪费时间,还不如都改一边快;另一个是知网的重相对好降,而且采用知网作查重库的学校对重复率要求一般较高,所以推荐全部改)。
祝大家论文能顺利通过!