HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

微博中文本特征质量对检索效果的影响

作者:唐晓波; 房小可微博文本特征描述能力辨别能力检索

摘要:【目的】通过对国内4大微博平台中特征词质量的测度,探讨其质量指标对检索效果的影响。【方法】将权重计算指标TF-IDF从特征词角度提升为特征的研究,并通过描述能力和辨别能力两个质量测度指标对国内4个主流微博平台中各特征的质量进行评估。【结果】微博中文本特征的描述能力和辨别能力对检索效果产生正向影响;各平台不同特征的质量对分类有着不同程度的影响,两种测度指标综合考虑时得到的分类效果最好。【局限】微博中的对话回复、粉丝数、关注数等特征并没有被考虑在内;对于语义研究中的特征词一词多义或者同义词的讨论并未涉猎。【结论】本研究可更好地揭示微博中各种特征影响检索效果好坏的重要程度,有助于研究者对各平台特征作用的深入理解,从而从根本上提高社会化媒体平台的检索质量。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

数据分析与知识发现

《数据分析与知识发现》(CN:10-1478/G2)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《数据分析与知识发现》内容定位于广泛吸纳计算机科学、数据科学、情报科学以及数字科研、数字教育和数字文化等领域的技术与方法,研究数据驱动的语义计算、内容分析、数据挖掘、知识发现、智能管理和决策支持等方面的技术、方法、系统以及支撑设施、政策与机制等,尤其是聚焦从海量、异构、分布、动态、甚至富媒体数据中挖掘和发现知识以支持研究、管理和决...

杂志详情