作者:李佳宁; 易建强; 赵冬斌; 西广成神经模糊预测器神经模糊控制器强化学习模糊规则确定度
摘要:为了实现基于非训练数据的神经模糊控制器的在线学习,提出了一种基于强化学习的神经模糊控制系统和相应的学习算法.该控制系统由神经模糊预测器和神经模糊控制器两部分组成,其中,神经模糊控制器采用基于确定度的模糊规则模型作为知识表示形式的扩展型神经模糊网络.在学习算法的设计中,尝试了利用强化信号得到输入状态的"期望输出",进而将强化学习转化为基于训练数据学习的解决思路.仿真实验验证了所提出的控制系统结构和学习算法的合理性和可行性.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社