HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种基于SVM/RS的中文机构名称自动识别方法

作者:宇缨; 王晓龙; 刘秉权模式识别svm特征选择语义粗糙集语义搭配

摘要:该文提出一种支持向量机(Support Vector Machines,SVM)和粗糙集(R0ugh Set,Rs)相结合的中文机构名称短语识别方法。该方法借助词的基本语义搭配关系表示短语的构成规则,并通过粗糙集属性约简的方法自动学习到机构名称构成规则的无冗余集。识别时,首先寻找到与这些规则匹配的词串作为候选机构名,然后结合候选机构名以及其上下文词的语义特征,利用SVM分类器判断该候选是否是真正的机构名称。这种方法对1617万字人民日报语料开放测试的F值分别达到82.06%。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子与信息学报

《电子与信息学报》(CN:11-4494/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情