一种基于强化学习的深度信念网络设计方法

作者：邢海霞; 程乐深度信念网络强化学习自适应对比散度鲁棒性能

摘要：近年来,基于深度学习思想发展起来的深度信念网络(Deep Belief Networks, DBN)在人工智能和大数据预测分析中得到了成功的应用。由于DBN的隐含层数较多,传统的DBN有监督精调(Fine-tuning)方法-BP算法很难得到令人满意的学习精度,甚至会因为梯度扩散(Gradient Diffusion)导致精度调节失败,且网络鲁棒性差。针对此问题,提出一种基于强化学习策略的DBN模型(RL-DBN)及其算法。首先利用自适应对比散度(Adaptive Contrastive Divergence, ACD)算法来快速预训练DBN的隐含层以获取较优的初始权值,然后用强化学习算法代替BP算法对DBN进行精调以提高有监督学习的精度和网络的鲁棒性。实验结果表明,相较于现有的类似模型,RL-DBN在学习速度、精度以及鲁棒性能等方面均有较大提高。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

控制工程

《控制工程》（CN：21-1476/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《控制工程》相关的高技术研发成果，促进控制工程学科的发展，建立高等院校、科研院所与工业界在自动化领域交流与合作的桥梁。

杂志详情

服务推荐

控制工程相关期刊

一种基于强化学习的深度信念网络设计方法

服务推荐

在线咨询

杂志订阅

期刊推荐

中国组织工程研究

科学技术与工程

价值工程

包装工程