HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于改进的softmax回归模型的话题跟踪算法

作者:朴乘锴; 袁方; 刘字; 王煜类别信息特征权重softmax回归话题跟踪

摘要:话题跟踪的目的是将新的新闻数据分配到已知话题中,对把握新闻发展趋势和进行舆情分析具有重要作用。本文深入分析了几种基于向量空间模型的特征项权重算法,发现传统算法没有充分体现特征项中类别信息的作用,在此基础上引入了类别区分度因子对卡方统计量进行改进,给出了加入类别信息的卡方统计量算法,该算法能够更准确地提取出对新闻区分度较大的特征项。同时,在特征项权重的框架内对常用的Softmax线性模型进行了基于余弦假设的改进。基于标准数据集TDT4的实验表明,本文给出的权重算法和分类算法均能够提高话题跟踪的查全率和查准率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

燕山大学学报

《燕山大学学报》(CN:13-1219/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《燕山大学学报》主要刊登哲学、历史学、语言文学、文化学、政治学、伦理学等学科的学术论文、研究综述和学术评论,尤其欢迎对重大理论问题和现实热点问题进行学术探讨的争鸣文章,欢迎对国内外最新的学术思潮、理论方法进行分析和评价的文章。

杂志详情