PDF(1138 KB)
海森辅助的概率策略梯度方法
胡磊, 李永强, 冯宇, 冯远静
PDF(1138 KB)
海森辅助的概率策略梯度方法
Hessian Aided Probabilistic Policy Gradient Method
| {{custom_ref.label}} |
{{custom_citation.content}}
{{custom_citation.annotation}}
|
/
| 〈 |
|
〉 |