HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

中文网络健康社区中的用户信息需求挖掘研究——以求医网肿瘤板块数据为例

作者:陆泉; 朱安琪; 张霁月; 陈静网络健康社区信息需求大数据挖掘分布式文本聚类肿瘤

摘要:【目的】构建适应大数据环境的中文网络健康社区用户信息需求挖掘框架,以肿瘤科为例分析用户信息需求。【方法】使用潜在语义索引(LSI)模型和MapReduce分布式文本聚类技术对中文网络健康社区--求医网肿瘤板块的全部提问数据(共计24305条)进行用户信息需求挖掘。【结果】挖掘出用户的5个信息需求类目及其占比:治疗(43.3%)、病理及病因(34.5%)、检查(12.1%)、术后(7.0%)、预防(3.1%),各类目下Top20关键词;发现国内外各需求类目占比差异巨大;预防信息需求将持续上升;需求的性别差异显著,男性最关注治疗信息、女性最关注病理及病因信息;需求的年龄差异较大,青年群体占比极高(83.79%)等。【局限】可能存在更好的阈值选择,更完整医学主题词表;尚未进行信息需求的多维分析。【结论】本文框架可在大数据环境下挖掘用户信息需求,并分析需求的变化趋势以及年龄与性别差异。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

数据分析与知识发现

《数据分析与知识发现》(CN:10-1478/G2)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《数据分析与知识发现》内容定位于广泛吸纳计算机科学、数据科学、情报科学以及数字科研、数字教育和数字文化等领域的技术与方法,研究数据驱动的语义计算、内容分析、数据挖掘、知识发现、智能管理和决策支持等方面的技术、方法、系统以及支撑设施、政策与机制等,尤其是聚焦从海量、异构、分布、动态、甚至富媒体数据中挖掘和发现知识以支持研究、管理和决...

杂志详情