作者:郑国伟; 吕学强; 夏红科; 周建设公司名识别关键句群抽取倾向性分析句子相似度互联网查询
摘要:为尽早发现负面新闻以降低对公司的影响,提出采用判断新闻文本关键句群倾向性的方法判断新闻的倾向性。对于公司名识别,在综合原有方法优势的基础上增加百度百科查询,向公司名基础词典加入公司名和公司代码映射;在关键句群抽取环节中,使用doc2vec模型计算句子和新闻标题相似度,综合句子位置信息、句子中领域动词信息、句子中公司名信息;使用Word2vec模型并结合TFIDF的句子表示方法,使句子的表示更加准确、更有侧重。使用LSTM模型对关键句群进行分类,实验结果表明,该模型分类效果优于传统机器学习分类模型和CNN。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社