一种结合TileCoding的平均奖赏强化学习算法*
王巍巍,陈兴国,高阳
An Average Reward Reinforcement Learning Algorithm with Tile Coding
WANG Wei-Wei, CHEN Xing-Guo, GAO Yang
模式识别与人工智能 . 2008, (4): 446 -452 .