模式识别与人工智能
2025年8月6日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2025, Vol. 38 Issue (3): 193-204    DOI: 10.16451/j.cnki.issn1003-6059.202503001
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于角色的自适应参数共享方法
方宝富1,2, 王琼1, 王浩1, 王在俊3
1.合肥工业大学 计算机与信息学院 合肥 230601;
2.新疆农业大学 计算机与信息工程学院 乌鲁木齐 830052;
3.中国民用航空飞行学院 民航飞行技术与飞行安全重点实验室 广汉 618307
Role-Based Adaptive Parameter Sharing Method
FANG Baofu1,2, WANG Qiong1, WANG Hao1, WANG Zaijun3
1. School of Computer Science and Information Engineering, Hefei University of Technology, Hefei 230601;
2. College of Computer and Information Engineering, Xinjiang Agricultural University, Urumqi 830052;
3. Key Laboratory of Flight Techniques and Flight Safety, Civil Aviation Flight University of China, Guanghan 618307

全文: PDF (2103 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 在大规模异构多智能体强化学习中,参数共享常用于减少训练参数并加速训练过程,但传统完全参数共享方法容易导致智能体行为过度一致,而独立参数训练方法却受到计算复杂度和内存限制.因此,文中提出基于角色的自适应参数共享方法(Role-Based Adaptive Parameter Sharing Method, RAPS).首先,根据智能体的任务特性进行角色分组.然后,在同一网络结构下,结合非结构化网络剪枝技术,为不同角色的智能体生成稀疏化的子网络结构,并引入动态调整机制,根据任务需求自适应优化共享参数与独立参数的比例.此外,通过角色间的协作损失函数,进一步增强异构智能体间的协调能力,在有效降低计算复杂度的同时,保持异构智能体的行为差异性.实验表明,在不同多智能体任务上,RAPS都能提升多智能体系统的性能和可扩展性.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
方宝富
王琼
王浩
王在俊
关键词 大规模异构多智能体强化学习参数共享非结构化网络剪枝角色分组    
Abstract:In large-scale heterogeneous multi-agent reinforcement learning, parameter sharing is often utilized to reduce the number of training parameters and accelerate the training process. However, the traditional full parameter sharing approach is prone to causing excessive behavioral uniformity among agents, while independent parameter training methods are constrained by computational complexity and memory limitations. Therefore, a role-based adaptive parameter sharing(RAPS) method is proposed in this paper. First, agents are grouped into roles based on their task characteristics. Then, within a unified network structure, sparse sub-network structures are generated for different agent roles by integrating unstructured network pruning techniques. A dynamic adjustment mechanism is introduced to adaptively optimize the ratio of shared and independent parameters according to task requirements. Additionally, a collaborative loss function between roles is incorporated to further enhance coordination among heterogeneous agents. Thus, computational complexity is effectively reduced by RAPS while behavioral diversity among heterogeneous agents is preserved. Experimental results demonstrate that RAPS improves the performance and scalability of multi-agent systems significantly in different multi-agent tasks.
Key wordsLarge-Scale Heterogeneous Multi-agent Reinforcement Learning    Parameter Sharing    Unstructured Network Pruning    Role Grouping   
收稿日期: 2025-01-16     
ZTFLH: TP391  
基金资助:安徽省自然科学基金项目(No.2308085MF203)、安徽高校协同创新项目(No.GXXT-2022-055)、民航飞行技术与飞行安全重点实验室开放基金项目(No.FZ2022KF09)、民航飞行技术与飞行安全重点实验室重点项目(No.FZ2022ZZ02)资助
通讯作者: 方宝富,博士,副教授,主要研究方向为智能机器人系统.E-mail:fangbf@hfut.edu.cn.   
作者简介: 王 琼,硕士研究生,主要研究方向为多智能体深度强化学习.E-mail:2324289404@qq.com.
王 浩,博士,教授,主要研究方向为分布式智能系统、机器人. E-mail:jsjxwangh@hfut.edu.cn.
王在俊,硕士,研究员,主要研究方向为多机器人任务分配、人工智能.E-mail:tiantian20030315@126.com.
引用本文:   
方宝富, 王琼, 王浩, 王在俊. 基于角色的自适应参数共享方法[J]. 模式识别与人工智能, 2025, 38(3): 193-204. FANG Baofu, WANG Qiong, WANG Hao, WANG Zaijun. Role-Based Adaptive Parameter Sharing Method. Pattern Recognition and Artificial Intelligence, 2025, 38(3): 193-204.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202503001      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2025/V38/I3/193
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn