一种基于深度强化学习的协同通信干扰决策算法

SONG Bai-lin,XU Hua,QI Zi-sen,RAO Ning,PENG Xiang

Acta Electronica Sinica（2022）

引用 0|浏览2

暂无评分

摘要

针对协同电子战中跳频通信干扰协同决策难题,通过构建"整体优化、逐站决策"的协同决策模型,基于深度强化学习技术,设计了在Actor-Critic算法架构下融合优势函数的决策算法,并在奖励函数中嵌入专家激励机制以提高算法的探索能力,采用集中式训练方法优化决策网络,使算法能够输出资源利用率最高的干扰方案,并大幅提高决策效率.仿真结果表明,相比于现有智能决策算法,本文算法给出的干扰方案能够节约8％干扰资源,决策效率提高50％以上,具有较大实用价值.

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要