基于模糊聚类的分层强化学习算法
【出 处】:《
计算机工程与科学
》
CSCD
2010年第1期 55-56页,共3页
【作 者】:
张欣
;
戴帅
【摘 要】
本文提出了一种新的分层强化学习Option自动生成算法,以Agent在学习初始阶段探测到的状态空间为输入,采用模糊逻辑神经元的网络进行聚类,在聚类后的各状态子集上通过经验回放学习产生内部策略集,生成Option,仿真实验结果表明了该算法的有效性。
相关热词搜索:
上一篇:一种基于AFSA的神经网络投影寻踪耦合回归模型
下一篇:可满足性求解技术研究