网络攻防实训_网络攻防期末实验
基于随机博弈与改进WolF-PHC的网络防御决策方法
1、WoLF-PHC算法是一种典型的策略梯度强化学习方法,使防御者通过网络反馈进行学习,不需要与攻击者之间过多的信息交换。
73
0
2023-05-07
网络攻防
1、WoLF-PHC算法是一种典型的策略梯度强化学习方法,使防御者通过网络反馈进行学习,不需要与攻击者之间过多的信息交换。