两方零和马尔科夫博弈下的策略梯度算法

李永强, 周键, 冯宇, 冯远静

PDF(884 KB)
模式识别与人工智能 ›› 2023, Vol. 36 ›› Issue (1) : 81-91. DOI: 10.16451/j.cnki.issn1003-6059.202301007
研究与应用

两方零和马尔科夫博弈下的策略梯度算法

    {{javascript:window.custom_author_cn_index=0;}}
  • {{article.zuoZhe_CN}}
作者信息 +

Policy Gradient Algorithm in Two-Player Zero-Sum Markov Games

    {{javascript:window.custom_author_en_index=0;}}
  • {{article.zuoZhe_EN}}
Author information +
History +

本文亮点

{{article.keyPoints_cn}}

HeighLight

{{article.keyPoints_en}}

摘要

{{article.zhaiyao_cn}}

Abstract

{{article.zhaiyao_en}}

关键词

Key words

引用本文

导出引用
{{article.zuoZheCn_L}}. {{article.title_cn}}. {{journal.qiKanMingCheng_CN}}. 2023, 36(1): 81-91 https://doi.org/10.16451/j.cnki.issn1003-6059.202301007
{{article.zuoZheEn_L}}. {{article.title_en}}. {{journal.qiKanMingCheng_EN}}. 2023, 36(1): 81-91 https://doi.org/10.16451/j.cnki.issn1003-6059.202301007

参考文献

参考文献

{{article.reference}}

基金

版权

{{article.copyrightStatement_cn}}
{{article.copyrightLicense_cn}}
PDF(884 KB)

Accesses

Citation

Detail

段落导航
相关文章

/