HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于深度学习的文本情感分析并行化算法

作者:翟东海; 侯佳林; 刘月半监督递归自编码文本情感分析并行计算

摘要:在训练集和测试集数据量大的情况下,半监督递归自编码(semi-supervised recursive auto encoder,Semi-Supervised RAE)文本情感分析模型会出现网络训练速度缓慢和模型的测试结果输出速率缓慢等问题.因此,提出采用并行化处理框架,在大训练集情况下,基于“分而治之”的方法,先将数据集进行分块划分并将各个数据块输入 Map 节点计算每个数据块的误差,利用缓冲区汇总所有的块误差,Reduce 节点从缓冲区读取这些块误差以计算优化目标函数;然后,调用 L-BFGS (limited-memory Broyden-Fletcher-Goldfarb-Shanno)算法调整参数,更新后的参数集再次加载到模型中,重复以上训练步骤逐步优化目标函数直至收敛,从而得到最优参数集;在测试集大的情况下,模型的初始化参数为上述步骤得到的参数集,Map 节点对各句子进行编码得到其向量表示,然后暂存在缓冲区中;最后,在 Reduce 节点中分类器利用各语句的向量表示计算各自语句的情感标签.实例验证表明:在标准语料库 MR (movie review)下本文算法精确度为 77.0%,与原始算法的精确度(77.3%)几乎相同;在大数据量训练集下,训练时间在一定程度上随着计算节点的增加而大量减少.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

西南交通大学学报·社会科学版

《西南交通大学学报·社会科学版》(CN:51-1586/C)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《西南交通大学学报·社会科学版》以马克思列宁主义、思想、邓小平理论为指导,以务实创新为灵魂,以高思想品质,高理论含量、高社会价值为特点,坚持为科教兴国战略和社会主义精神文明和物质文明建设服务。

杂志详情