HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

利用URL-Key领域术语识别方法

作者:吕书宁; 董志安url领域术语低频术语svm

摘要:首次提出利用URL-Key进行领域术语识别的方法。以URL作为媒介,借助已知URL-Key的领域性来判断未知领域候选术语的领域性。首先,借助互联网中已有的人工分类领域URL,根据URL-Key在各领域汇总使用的频度,采用基于方差的领域URL-Key识别方法,构建领域URL-Key词表;然后,利用伪反馈技术,收集候选领域词检索得到的URL结果集,根据URL结果集构建候选领域术语的URL-Key特征向量;最后,利用SVM对候选领域术语进行提取。在4个领域进行实验,都取得不错的效果。新提出的方法可以有效地解决低频术语识别问题,为低频术语的识别提供新的思路。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

北京大学学报·自然科学版

《北京大学学报·自然科学版》(CN:11-2442/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《北京大学学报·自然科学版》主要刊登基础科学、应用科学及交叉科学等领域的研究成果及综述性文章。由北京大学理工科的40名教授组成编委会,负责确立学报的办刊宗旨及审定论文的学术质量。

杂志详情