网络攻防实训_网络攻防期末实验

网络攻防实训_网络攻防期末实验

基于随机博弈与改进WolF-PHC的网络防御决策方法

1、WoLF-PHC算法是一种典型的策略梯度强化学习方法,使防御者通过网络反馈进行学习,不需要与攻击者之间过多的信息交换。

69 0 2023-05-07 网络攻防