海森辅助的概率策略梯度方法
胡磊, 李永强, 冯宇, 冯远静
Hessian Aided Probabilistic Policy Gradient Method
HU Lei, LI Yongqiang, FENG Yu, FENG Yuanjing
模式识别与人工智能 . 2025, (2): 177 -191 .  DOI: 10.16451/j.cnki.issn1003-6059.202502006