|
|
|
基于谱图理论的强化学习研究 |
|
论文目录 |
|
致谢 | 第1-5页 | 摘要 | 第5-7页 | Abstract | 第7-10页 | Extended Abstract | 第10-13页 | 目录 | 第13-17页 | 图清单 | 第17-20页 | 表清单 | 第20-21页 | 变量注释表 | 第21-22页 | 1 绪论 | 第22-40页 | ·研究背景 | 第22-23页 | ·课题来源 | 第23页 | ·国内外研究现状 | 第23-36页 | ·论文研究思路、方法及内容 | 第36-38页 | ·论文的结构和内容 | 第38-40页 | 2 强化学习和谱图理论 | 第40-53页 | ·强化学习理论 | 第40-45页 | ·谱图理论及其应用 | 第45-48页 | ·流形学习和距离度量学习 | 第48-50页 | ·基于拉普拉斯特征映射的强化学习 | 第50-52页 | ·小结 | 第52-53页 | 3 基于谱图理论的 Option 自动生成 | 第53-76页 | ·基于谱图理论的 Option 方法 | 第54-57页 | ·基于谱图分割的 Option 自动生成算法 | 第57-58页 | ·基于多路谱图分割的 Option 自动生成算法 | 第58-66页 | ·仿真实验与分析 | 第66-75页 | ·小结 | 第75-76页 | 4 基于谱图理论的启发式回报函数设计 | 第76-97页 | ·基于距离度量学习的启发式强化学习 | 第77-78页 | ·启发式回报函数设计概述 | 第78-80页 | ·基于拉普拉斯特征映射的距离度量法 | 第80-84页 | ·基于多路谱图分割的抽象模型法 | 第84-87页 | ·两类方法的对比分析 | 第87-90页 | ·仿真实验与分析 | 第90-96页 | ·小结 | 第96-97页 | 5 基于谱图理论的启发式策略选择和 Dyna 规划 | 第97-109页 | ·探索和利用平衡问题 | 第97-98页 | ·基于谱图理论的启发式策略选择 | 第98-103页 | ·Dyna 学习框架 | 第103-104页 | ·基于谱图理论的 Dyna_Q 算法 | 第104-107页 | ·小结 | 第107-109页 | 6 基于谱图理论的强化学习迁移 | 第109-123页 | ·强化学习迁移概述 | 第110-111页 | ·基于谱图理论的强化学习迁移 | 第111-112页 | ·基于谱图理论的强化学习混合迁移方法 | 第112-116页 | ·算法步骤和适用范围 | 第116-117页 | ·仿真实验与分析 | 第117-122页 | ·小结 | 第122-123页 | 7 总结与展望 | 第123-125页 | ·总结 | 第123-124页 | ·展望 | 第124-125页 | 参考文献 | 第125-140页 | 附录 1:线性插值所得基函数的线性无关性证明 | 第140-141页 | 作者简历 | 第141-144页 | 学位论文数据集 | 第144页 |
|
|
|
|
论文编号BS1843703,这篇论文共144页 会员购买按0.35元/页下载,共需支付50.4元。 直接购买按0.5元/页下载,共需要支付72元 。 |
|
|
我还不是会员,注册会员!
会员下载更优惠!充值送钱! |
我只需要这篇,无需注册!
直接网上支付,方便快捷! |
|
|
|
版权申明:本目录由www.jylw.com网站制作,本站并未收录原文,如果您是作者,需要删除本篇论文目录请通过QQ或其它联系方式告知我们,我们承诺24小时内删除。 |
|
|