HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于迁移学习的个性化循环神经网络语言模型

作者:徐萍; 吴超; 胡峰俊; 吴凡; 林建伟; 刘静...语言模型个性化循环神经网络迁移学习小数据集预训练词向量

摘要:针对在小数据集上开发个性化语言模型仍存在的障碍,提出基于迁移学习的个性化循环神经网络语言模型。设计了基于预训练词向量、预训练电影剧本数据集、基于参数微调和特征提取分类器的迁移学习训练模式,在小数据集上建立了具有较高辨识度的个性化语言模型,降低了模型的困惑度,改进了模型的性能。模型的实验以电视剧Seinfeld角色为基础。结果表明:该模型在特定角色测试数据集上的困惑度比其他角色数据集平均低17.65%,证明其已经学会了该角色的个性化风格;迁移学习使得模型最低困惑度平均降低了36.38%,较好地解决了基于小数据集开发个性化语言模型存在的障碍问题。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

南京理工大学学报

《南京理工大学学报》(CN:32-1397/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《南京理工大学学报》报道科技新动态,内容丰富,包括机械工程、电子工程、机电工程、光电技术、化学工程、环境科学、计算机科学、信息工程、自动控制与系统工程、热能工程、材料科学与工程、应用数学、应用物理、应用力学和管理工程等方面的高层次学术论文。

杂志详情