模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2007, Vol. 20 Issue (2): 254-260    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于内省推理的多agent在线学习方法
韩伟1,2,陈优广2,姜昌华2
1.南京财经大学 信息工程学院 南京 210046
2.华东师范大学 信息科学技术学院 上海 200062
An InternalInference Based Multiagent Learning Method
HAN Wei1,2, CHEN YouGuang2, JIANG ChangHua2
1.Information Science and Engineering College, Nanjing University of Financial and Economics, Nanjing 210046
2.Information Science and Technology College, East China Normal University, Shanghai 200062

全文: PDF (422 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 多agent环境下agent的最优策略取决于其它agent的策略,这使得学习目标不易被清晰定义.基于客观观察行为建模的方法并不能很好体现智能体的个体理性.本文提出基于内省推理方法的多智能体环境下智能体高效在线学习方法,将基于对手模型的客观观察行为与基于换位思考推理的主观意图推测结合起来,智能体通过内省推理能够更多地得到对手的信息.针对经典协调博弈进行仿真实验,结果表明能取得较好的协调性能.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
韩伟
陈优广
姜昌华
关键词 多智能体系统在线学习内省推理电子市场    
Abstract:In multiagent environment, the optimal policy of an agent depends on the policies of the others, which makes the learning more problematic. Previous algorithms based on the observed behavior of opponents can not fully present individual rationality. An efficient online learning algorithm based on the internal inference is proposed, which integrates the observed objective behavior and the subjective inferential intention of the opponents. By the internal inference, agents can obtain more information about opponents, and thus learn more efficiently. Simulations results prove that the proposed algorithm performs well in classical coordination game.
Key wordsMultiagent System    OnlineLearning    Internal Inference    Electronic Market   
收稿日期: 2005-05-16     
ZTFLH: TP181.1  
作者简介: 韩伟,男,1975年生,博士,主要研究方向为多智能体系统、自治计算.Email:dallashw@gmail.com.陈优广,男,1971年生,博士,主要研究方向为模式识别与图像处理.姜昌华,男,1973年生,博士,主要研究方向为智能算法.
引用本文:   
韩伟,陈优广,姜昌华. 基于内省推理的多agent在线学习方法[J]. 模式识别与人工智能, 2007, 20(2): 254-260. HAN Wei , CHEN YouGuang , JIANG ChangHua. An InternalInference Based Multiagent Learning Method. , 2007, 20(2): 254-260.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2007/V20/I2/254
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn