首页/文章/ 详情

毕业论文查重就是一个坑

1年前浏览1484

1. 引言

又进入到毕业季了,无论是即将毕业的本科生还是研究生,毕业前必须面临的一个重任是论文查重, 辛辛苦苦写出来的东西必须要通过这个鬼门关,这似乎是每个学校都要求的。抄袭别人的成果是作为一个学生或研究人员的大忌,剽窃(Plagiarism)在一个正常的学术环境下是绝对不能容忍的,这是一个人必须坚守的学术道德(Academic Ethics) 。在一个健康的学术环境里不需要特意地进行Plagiarism Checking, 因为其中的每个人都遵守最基本的底线;但在一个鱼目混珠的学术环境里,查重是应该的也是必须的,不过目前教育部门似乎没有统一的审核标准,因此把一件本来认真严肃的事情变成了一些商家大发横财的机会。想一想,800多万毕业生,即使有70%的学生需要进行论文查重,这将演变成多么大的一个商机。另一方面,学生为了降低查重率,变着法子地逃避查重,于是网上出现了许多避免查重的奇淫技巧,不能不说这是一件很悲催的事情。

2. 论文查重的基本原理

论文查重的本质是找文字之间的相似度,通过计算句子之间的相似度(Word2Vec)和段落与段落之间的相似度(Doc2Vec)按照一定规则计算相似系数,相似系数越大表明文字之间的重复率越高。当用户提交一篇文章后,系统把文章按标点符号拆分成单句, 然后把每一句与数据集中的文章进行比较。 例如下面的代码用来建立数据集模型。

在数据集模型后,便能进行相似度计算。

有许多算法可以进行相似度计算,也有许多自己可以定义的规则来确定文章的相似度, 例如可以把单句得出的相似度平均来得出整个段落的相似度,也可以首先对每个段落进行总结(Summarize), 然后再进行相似度计算, 甚至直接把文章的摘要进行相似度计算。这些变化的算法和规则导致了使用不同公司的产品会得出不同的相似度。

3. 论文查重潜在的问题

句子相似度的计算是以句子中的词与词之间的距离来评价的,实际的语言中有时差不多相同的词汇表达出来的语义是不一样的甚至出现截然相反的语义,但相似系数非常高,这显然属于误判。另一方面,对于文科类的文章,句子的结构和顺序理论上来说可以任意变化,但对于理工科类的文章,一些定理,公式,规范等不是随意可以改变顺序和结构的,这会导致查重率偏高。

4. 一个简单的查重率测试

为了发现查重中存在的问题以及应对方法,随手写了下面一段文字,使用一个在线的查重软件,使用Google和Bing两个搜索引擎进行了联机查询。

Like other Itasca software, 3DEC is an open-research software, which means that it is not just a simple computation software, its research function is actually much greater than its design function. Especially, the embedded programming language FISH and external programming language Python greatly extend the capability of using 3DEC. Since the version 4.0 of 3DEC released, 3DEC has changed dramatically in its operation from original command-line data files with CALL commands to a fully graphical operation (GUI) with project arrangement. Although using command-line functions still remain in the software, it indeed does not have much value because the Plot command is no longer supported under the DOS prompt. 

结果发现没有重复的,证明确实是我原创的文字。

最后还给出一个有点儿stupid的Summary

5. 结束语

学生论文查重对于净化学术风气是一件值得赞赏的事情,不过教育部门应该制定相应的规则,出台相应的免费软件供学生检查使用。目前的论文查重就是一个坑,除了能带动部分商业机构的赚钱欲望,对真正的学术气氛发展和学生学术道德的建设作用非常有限。

来源:计算岩土力学
化学理论3DEC
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2022-09-20
最近编辑:1年前
计算岩土力学
传播岩土工程教育理念、工程分析...
获赞 119粉丝 876文章 1732课程 0
点赞
收藏
未登录
还没有评论

课程
培训
服务
行家

VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈