HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

面向出版社富媒体知识的文本分类研究

作者:刘琼昕; 宋祥; 王鹏富媒体文本分类支持向量机降准

摘要:大数据环境下,出版行业面临着富媒体数据带来的跨媒体数据组织和海量历史数据的挑战。为了形成有效的知识组织,针对富媒体出版社的文本数据具有数据量巨大、标签分层级的特点,本论文使用截断奇异值分解进行降维,应用线性分类核支持向量机模型,并且设计了多层级分类方法,对富媒体文本进行文本分类。实验表明,在富媒体出版社的文本数据下,本文方法取得了较好的文本分类结果。在150维的文本特征下,区域分类的第二级分类效果最好,其中准确率达到0.98,召回率达到0.76,F1指标达到0.87。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

情报工程

《情报工程》(CN:10-1263/G3)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《情报工程》目标:在为支持政府和企业在情报分析领域中的世间,提供情报分析的理论研究、技术方法、工程应用等方面的专业化学术交流平台。

杂志详情