PDF查重和word查重有区别吗

作者:王秋霜来源:艺考网

PDF查重和word查重有区别,比如:尾注和脚注一般在Word里知网系统是检测不到的,而在PDF里,知网系统会把它当成正文检测。PDF格式保密性强,如果在查重解析过程中,PDF文档里的内容识别不正确的话,会出现乱码,造成结果为0,PDF检测则相对偏高。

PDF查重和word查重有区别吗

一、PDF查重和word查重有区别吗

一般来说,PDF查重和word查重在一些特殊情况下,这两种格式的查重结果还是有所差别的,有时甚至是差别非常大。

1、出现乱码会导致结果不同

(1)由于PDF格式的私密性强,就很难被转换格式或被编辑,所以PDF文档提交到知网查重的系统里之后,知网查重系统会扫描PDF里的内容来进行解析。

(2)但在解析过程中,可能会出现解析不成功或者解析出现乱码的现象,如果乱码了,那么知网查重结果就和正常情况的结果完全不同了。

PDF查重和word查重有区别吗

2、识别结果不同

(1)若论文中有大量的脚注和尾注,或者页眉页脚内有很多的内容,一般正常word文档内知网查重系统是能够区别这些脚注尾注和页眉页脚的,而且这些内容不与正文一起参与查重。

(2)在PDF格式下,上述的部分有可能会被识别成正文,从而会一起参与到查重中,那么这样查重的结果就会有区别。

PDF查重和word查重有区别吗

3、目录格式不同

(1)在目录排版正确的情况下,一般Word会自动生成目录,知网系统也可以识别到目录,然后按照目录来分章节检测,这时目录不参与正文检测且显示灰色。

(2)对于PDF格式论文,知网系统会将目录转换成文本进行检测,这时目录格式已经不完全正确,也就是这时的目录已经不是Word自动生成,因此会导致知网系统会把目录当成正文检测,所以PDF检测偏高。

PDF查重和word查重有区别吗

二、pdf格式易出错的内容

1、目录排版

在转换时,目录会出现混乱,不仅系统会被不承认,还会被用作文本来检测,所以就会影响重复率,但这样是可以用来提高全文的重复率。

2、无法识别图片,将其置乱

有一些PDF格式的内容是使用图片的形式,但事实上,它会让转换更难识别,所以导致检测时,使全文的重复率不准确。

PDF查重和word查重有区别吗

3、脚注很容易参与文本检测

一般pdf转换成word后,pdf的脚注内容没有格式就会和文本内容混合。在正常情况下,检测脚注会重复,那自然全文的重复率也会增加。

4、参考文献标识为正文

若参考文本是因为转换而错误,那还会导致系统识别不良,而且参考的部分也会被检测成文本。

本文由作者上传并发布(或网友转载),本站仅提供信息发布平台,文章仅代表作者个人观点。

猜您喜欢

艺友热搜