logo
教育论文中心  教育论文中心   广告服务  广告服务   论文搜索  论文搜索   论文发表  论文发表   会员专区  会员专区   在线购卡   在线购卡   服务帮助  服务帮助   联系我们  联系我们   网站地图  网站地图   硕士论文  会员专区   博士论文
当前位置:教育论文中心首页--博士论文--基于一致性与事件驱动的强化学习研究
博硕论文分类列表
工业技术 交通运输 农业科学
生物科学 航空航天 历史地理
医学卫生 语言文字 环境科学
综合图书 政治法律 社会科学
马列主义、毛泽东思想 艺术
数理科学和化学 文学
天文学、地理科学 军事
文化科学、教育体育 经济
自然科学总论 哲学
查看更多分类
 
论文搜索
 
 
相关论文
大规模知识图谱服务的系统与应用研
无线传感器网络入侵检测关键技术研
基于谱图理论强化学习研究
拟周期驱动圆周系统分类
基于身份公钥密码系统研究
基于强化学习卫星规模化在线调度
解决强化学习中维数灾问题方法研
基于强化学习多机器人围捕策略
基于性能势改进平均奖赏强化学习
基于动作空间划分分层强化学习
强化学习维数灾问题解决方法研究
JZJ站位间转运策略强化学习方法
基于视觉听觉语义相干性强化学习
基于模糊聚类分层强化学习方法研
鸽子视觉—行为抉择强化学习研究
基于强化学习磁导航AGV控制方
基于模型科学学习及其学习环境设
移动自组网决策支持系统中数据缓存
网络事件背后群体狂欢--从郭美
心理打击性事件乳腺癌患病相关
面向MES基于事件驱动架构信息
面向SOA事件信息组件
基于情境认知英语教学模式研究
中国私募股权投资中估值问题研究
针刺土工织物垂直渗透率理论研究
多区域时域伪谱算法在电磁分析中
名字路由协议研究实现
基于能量调度信息物理系统远程估
基于图像点云模型建造及其在环境
基于双线性配对公钥加密和签密方
基于身份公钥体系安全电子邮件系
基于属性密码技术研究
农资电子商务智能推荐模型研究
基于内容视频拷贝检测算法研究
基于任务和角色加密CAD模型
通用图像检索系统和高维索引技术
面向涉密企业数字内容安全管理系统
现代企业工资制度比较分析合理选
多授权中心基于属性签名及加密算
钢筋混凝土框架结构整体概率抗震
存在事件断裂辩证法—巴迪乌《
微博空间中突发公共事件谣言消解
大学生积极事件分享事件价值效应
离散事件系统可诊断性判定和高阶
强化学习及其在MAS协同概念设计
面向定题领域事件驱动和协议驱动
事件驱动机制下适时商务智能模型
基于信息技术企业战略管理平台理
基于模型动态分层强化学习算法研
客户驱动项目管理及其在汽车零配
研究学习主题网站“滕阁之风”
基于实例颜色处理新技术研究
PDP显示驱动电路设计
基于摩擦驱动包件分拣机驱动技术
加速器驱动次临界系统(ADS)
虚拟未建模动态驱动一类欠驱动
水情电报翻译研究
面向对象软件测试技术研究
基于强化学习PSS最优控制策略
电力批发市场中基于强化学习参与
 
科目列表
市场营销 管理理论 人力资源
电子商务 社会实践 先进教育
伦理道德 艺术理论 环境保护
农村研究 交通相关 烟草论文
电子电气 财务分析 融资决策
电影艺术 国学论文 材料工程
语文论文 数学论文 英语论文
政治论文 物理论文 化学论文
生物论文 美术论文 历史论文
地理论文 信息技术 班主任
音乐论文 体育论文 劳技论文
自然论文 德育管理 农村教育
素质教育 三个代表 旅游管理
国际贸易 哲学论文 工商管理
证券金融 社会学 审计论文
会计论文 建筑论文 电力论文
水利论文 园林景观 农林学
中医学 西医学 心理学
公安论文 法学法律 思想汇报
法律文书 总结报告 演讲稿
物业管理 经济学 论文指导
计算机 护理论文 社会调查
军事论文 化工论文 财政税收
保险论文 物流论文 语言教育
教育教学 给水排水 暖通论文
结构论文 综合类别 硕士论文
博士论文    
 
 
基于一致性与事件驱动的强化学习研究
 
     论文目录
 
摘要第5-6页
Abstract第6-7页
主要符号对照表第11-12页
第1章 绪论第12-18页
    1.1 课题的背景及意义第12-13页
    1.2 多智能体的协调与协作第13-14页
    1.3 不确定环境下的多智能体系统第14-15页
    1.4 强化学习的策略空间与收敛速度第15页
    1.5 论文的主要研究内容及章节安排第15-18页
第2章 多智能体协作与学习模型第18-39页
    2.1 引言第18页
    2.2 强化学习原理第18-26页
        2.2.1 MonteCarlo算法第20-21页
        2.2.2 瞬时差分法第21-22页
        2.2.3 Q-学习第22-24页
        2.2.4 Sarsa算法第24-25页
        2.2.5 Actor-Critic学习算法第25页
        2.2.6 R-学习算法第25-26页
    2.3 分布式强化学习原理第26-29页
        2.3.1 分布式强化学习模型第26-28页
        2.3.2 研究现况及存在的问题第28-29页
    2.4 分布式马尔科夫决策模型第29-34页
        2.4.1 分布式马尔科夫模型第29页
        2.4.2 局部可观测的马尔科夫模型第29-30页
        2.4.3 分布式局部可观测的马尔科夫模型第30-32页
        2.4.4 研究现状与存在的问题第32-34页
    2.5 多智能体一致性原理第34-35页
        2.5.1 图论第34页
        2.5.2 Gossip一致性算法第34-35页
        2.5.3 离散一致性算法第35页
    2.6 启发式强化学习原理第35-38页
        2.6.1 盲目搜索与启发式搜索第36-37页
        2.6.2 启发式强化学习第37-38页
    2.7 本章小结第38-39页
第3章 基于一致性的多智能体强化学习研究第39-57页
    3.1 引言第39页
    3.2 基于一致性的DEC-POMDP强化学习框架第39-43页
        3.2.1 强化学习中的局部观测性和不确定性分析第39-40页
        3.2.2 分布式多智能体强化学习模型设计第40-42页
        3.2.3 多智能体强化学习一致性方案设计第42-43页
    3.3 基于一致性的多智能体强化学习算法第43-48页
        3.3.1 基于一致性的多智能体强化学习算法设计第43-47页
        3.3.2 基于一致性的策略化简设计第47-48页
    3.4 收敛性分析第48-49页
    3.5 仿真实验第49-56页
    3.6 本章小结第56-57页
第4章 基于事件驱动的多智能体强化学习研究第57-75页
    4.1 引言第57页
    4.2 事件驱动原理第57-60页
    4.3 强化学习的事件驱动模型与触发规则设计第60-64页
        4.3.1 基于事件驱动的强化学习模型设计第60-62页
        4.3.2 触发规则设计第62-64页
    4.4 基于事件驱动的强化学习第64-68页
        4.4.1 基于事件驱动的强化学习算法设计第64-66页
        4.4.2 计算资源消耗分析第66页
        4.4.3 算法收敛性分析第66-68页
    4.5 仿真实验第68-74页
    4.6 本章小结第74-75页
第5章 基于事件驱动的启发式强化学习研究第75-109页
    5.1 引言第75页
    5.2 启发式加速强化学习方法第75-80页
        5.2.1 启发式加速Q-学习第76-77页
        5.2.2 基于状态回溯代价分析启发式Q-学习第77-78页
        5.2.3 基于CaseBasedReasoning的启发式加速Q-学习第78-80页
    5.3 基于事件驱动的启发式Q-学习设计第80-108页
        5.3.1 基于事件驱动的HAQL算法第81-90页
            5.3.1.1 触发函数设计第81-82页
            5.3.1.2 算法设计第82-86页
            5.3.1.3 仿真实验第86-90页
        5.3.2 基于事件驱动的HASB-QL算法第90-99页
            5.3.2.1 触发函数设计第90-91页
            5.3.2.2 算法设计第91-93页
            5.3.2.3 启发式函数分析第93-95页
            5.3.2.4 仿真实验第95-99页
        5.3.3 基于事件驱动的CB-HAQL算法第99-108页
            5.3.3.1 触发函数设计第99-100页
            5.3.3.2 案例设计第100页
            5.3.3.3 算法设计第100-102页
            5.3.3.4 仿真实验第102-108页
    5.4 本章小结第108-109页
结论第109-111页
致谢第111-112页
参考文献第112-123页
攻读博士学位期间发表的论文及科研成果第123-125页

 
 
论文编号BS3940678,这篇论文共125
会员购买按0.35元/页下载,共需支付43.75元。        直接购买按0.5元/页下载,共需要支付62.5元 。
我还不是会员,注册会员
会员下载更优惠!充值送钱!
我只需要这篇,无需注册!
直接网上支付,方便快捷!
 您可能感兴趣的论文
版权申明:本目录由www.jylw.com网站制作,本站并未收录原文,如果您是作者,需要删除本篇论文目录请通过QQ或其它联系方式告知我们,我们承诺24小时内删除。
 
 
| 会员专区 | 在线购卡 | 广告服务 | 网站地图 |
版权所有 教育论文中心 Copyright(C) All Rights Reserved
联系方式: QQ:277865656 或写信给我