基于模糊聚类的分层强化学习算法

快速导航

1973年创刊

《计算机工程与科学》的办刊宗旨是为计算机界同行发表有创见的学术论文，介绍有特色的科研成果，探讨有新意的学术观点提供理想园地；�...查看更多>>

【出处】：《计算机工程与科学》 CSCD 2010年第1期 55-56页,共3页

【作者】：张欣 ; 戴帅

【摘要】本文提出了一种新的分层强化学习Option自动生成算法，以Agent在学习初始阶段探测到的状态空间为输入，采用模糊逻辑神经元的网络进行聚类，在聚类后的各状态子集上通过经验回放学习产生内部策略集，生成Option，仿真实验结果表明了该算法的有效性。