HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于语义匹配的抄袭检测方法

作者:邹杜 陈育青 张凌语义匹配抄袭检测指纹文本语义

摘要:现有的抄袭检测方法大多根据相似度来判定文档间是否存在抄袭.与常见的复制检测不同,在抄袭检测中,占文档很小比例且未加引用的复制文本也将被认定为抄袭.受文档尺寸、复制篇幅和干扰信息的影响,现有方法的检测效果均不理想.针对这种局限性,文中分析了文本语义与指纹排列顺序的关系,提出了语义匹配方法,将指纹向量投影到一个二进制向量,在降低维数的同时保留了指纹的位置信息.在PAN公用语料集上将该方法与Jaccard和Hamming距离法进行了对比测试,发现文中方法的召回率和准确度均更优.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

华南理工大学学报·社会科学版

《华南理工大学学报·社会科学版》(CN:44-1443/C)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《华南理工大学学报·社会科学版》自创刊以来,本刊坚持以马克思列宁主义、思想、邓小平理论、"三个代表"重要思想、科学发展观、新时代中国特色社会主义思想为指导,立足广东,面向全国,积极反映人文社会科学各领域在改革开放和现代化建设中理论与实践的成果,努力把本刊办成有特色、有水平、有影响的综合性学术期刊和重要理论研究阵地。

杂志详情