两方零和马尔科夫博弈下的策略梯度算法

李永强; 周键; 冯宇; 冯远静

doi:10.16451/j.cnki.issn1003-6059.202301007

模式识别与人工智能 ›› 2023, Vol. 36 ›› Issue (1) : 81-91. DOI: 10.16451/j.cnki.issn1003-6059.202301007

研究与应用

两方零和马尔科夫博弈下的策略梯度算法

{{article.zuoZhe_CN}}

作者信息 +

Policy Gradient Algorithm in Two-Player Zero-Sum Markov Games

{{article.zuoZhe_EN}}

Author information +

History +

本文亮点

HeighLight

摘要

Abstract

关键词

Key words

引用本文

EndNote

Ris (Procite)

Bibtex

导出引用

{{article.zuoZheCn_L}}. {{article.title_cn}}. {{journal.qiKanMingCheng_CN}}. 2023, 36(1): 81-91 https://doi.org/10.16451/j.cnki.issn1003-6059.202301007

{{article.zuoZheEn_L}}. {{article.title_en}}. {{journal.qiKanMingCheng_EN}}. 2023, 36(1): 81-91 https://doi.org/10.16451/j.cnki.issn1003-6059.202301007

参考文献

原文顺序 | 文献年度倒序 | 文中引用次数倒序

参考文献

基金

版权

PDF(884 KB)

Accesses

Citation

Detail

段落导航

Received	Published
2022-08-05	2023-01-25
Issue Date
2023-01-25

选择文件类型/文献管理软件名称

选择包含的内容

本文亮点

HeighLight

摘要

Abstract

关键词

Key words

引用本文

{{custom_sec.title}}

{{custom_sec.title}}

参考文献

参考文献

{{custom_fnGroup.title_cn}}

脚注

{{custom_ack.title_cn}}

基金

版权

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

本文亮点

HeighLight

摘要

Abstract

关键词

Key words

引用本文

{{custom_sec.title}}

{{custom_sec.title}}

参考文献

参考文献

{{custom_fnGroup.title_cn}}

脚注

{{custom_ack.title_cn}}

基金

版权