随着论文查重工具的不断进化,论文抄袭剽窃行为也由简单走向复杂,2009年的时候,论文检测工具才刚刚起步,论文抄袭行为也比较单一,主要是从期刊和搜索引擎中摘取,现在,这两种方式的复制行为几乎百分之99%会被查重工具查出来,所以论文工具的进化让抄袭剽窃的手段也丰富了,有人认为论文抄袭的网络比对来源通常来自于各类文库,如果我抄袭微博上的还会不会被查重工具查到呢?
首先,我们需要了解什么情况下论文查重工具才能查到这个内容,目前的论文查重工具对比的资源主要分为两大类,一类是传统资源库,这个里面包括各类期刊库、硕博库、大学生本科论文联合共享库(往届库),一类是互联网资源库,那么目前本科毕业生抄袭的来源主要是互联网,包括微博内容也都属于互联网内容资源,那么决定能不能抓取到最新的微博内容还有一个关键点,就是网络抓取算法,懂一点的都知道这个主要是靠python技术,也就是我们通常了解到的爬虫,如果你用的知网查重,你会发现,查重报告中标红的互联网来源部分比较少,这是因为知网的网络抓取算法还不够全面,众所周知,在网络抓取这一块比较快和准的是格子达论文查重,paperquery能够实时抓取网络数据,包括微博内容。在实际的测试当中也证实了这一点,半个小时发的微博复制到word文档中,然后放到paperquery中查重,结果显示全部标红。当然,并不是所有的内容都会被paperquery查抓取标红,比如微博下面的评论,还有热度极低的140字以内的短微博,微博文章是一定会被查到的。
所以,结论是会不会查到取决于你用什么软件查,如果是知网可能会查不到,如果是paperquery就基本上都能查到,这就是为什么学校使用知网的学生基本上都会用paperquery做初检的原因,因为更放心。
最新阅读: