HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

互联网隐式文本特征的提取

作者:陈君隐式文本特征数据crfs模型聚类算法

摘要:随着互联网环境下大数据的极速膨胀,其文本信息也变得越发复杂,同时存在大量的隐式文本,针对隐式文本信息,当前缺乏有效的特征数据提取方法,为了解决该问题,提出了扩充CRFs模型的聚类提取方法。首先采用CRFs模型对候选文本对象进行建模,根据知识库扩充候选文本的特征词集合;然后利用聚类算法提取隐式文本对象集,经过迭代计算,得到特征词的匹配程度,并据此进行文本对象的分类;提出改进的特征去噪方法,结合权重计算提取得到目标文本对象。通过实验数据的分析,验证了本文提出的方法可以有效应用于隐式文本对象的特征数据提取上,提高了隐式文本特征提取的查全率和准确率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子技术与软件工程

《电子技术与软件工程》(CN:10-1108/TP)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情