文章摘要:为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法。针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数。为应对Agent之间的相互影响和动态的环境,引入集中式训练和分散式执行框架。该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各Agent的权重分配问题。采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率。仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性。
文章关键词:
论文分类号:TN914.41;TN973.3
文章来源:《信息记录材料》 网址: http://www.xxjlcl.cn/qikandaodu/2021/1118/2334.html
信息记录材料投稿 | 信息记录材料编辑部| 信息记录材料版面费 | 信息记录材料论文发表 | 信息记录材料最新目录
Copyright © 2018 《信息记录材料》杂志社 版权所有
投稿电话: 投稿邮箱: