HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于词法分析与特征量化的代码相似度检测方法

作者:俞婷; 张桂英相似度检测词法分析特征量化dfa

摘要:针对现有代码相似度检测方法存在的缺陷,提出了一种基于特征量化的检测方法:在词法分析阶段,通过确定有穷状态自动机(DFA)分词和单词语义识别从较小的单词粒度上对代码进行了特征量化;在代码检测阶段,构造用于计算代码语句特征量化值的多元线性函数.为进一步提高代码识别度,探讨了求解方程系数组的多元线性回归数学模型.为了提高检测准确度,在匹配阶段设计了两次匹配操作:一是代码语句特征量化值匹配,二是对特征量化值相等的代码进行语义类型匹配.通过测试证明该方法在一定误差范围内是准确的,相比现有传统的检测方法具有明显的优势.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

嘉兴学院学报

《嘉兴学院学报》(CN:33-1273/Z)是一本有较高学术价值的双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《嘉兴学院学报》的办刊宗旨是以特色求发展,促进学术交流,坚持思想性、学术性、地方性和规范性的统一,刊发自然科学、社会科学类学术论文。

杂志详情