logo
首页 首页 教育论文中心 教育论文中心 广告服务 广告服务 论文搜索 论文搜索 论文发表 论文发表 汇款确认 汇款确认 会员专区 会员专区 在线购卡 在线购卡 服务帮助 服务帮助 联系我们 联系我们 网站地图 网站地图 快速搜索 会员专区 硕士论文 会员专区 博士论文
当前位置:教育论文中心首页--硕士论文--基于深度强化学习的路口自适应控制
博硕论文分类列表
工业技术 交通运输 农业科学
生物科学 航空航天 历史地理
医学卫生 语言文字 环境科学
综合图书 政治法律 社会科学
马列主义、毛泽东思想 艺术
数理科学和化学 文学
天文学、地理科学 军事
文化科学、教育体育 经济
自然科学总论 哲学
查看更多分类
论文搜索
 
相关论文
淡水湖泊沉积物质量基准研究及风险
Fe(Ⅱ)/Fe(0)活化过硫酸
挠力河中下游湿地生态需水量研究
基于氧化石墨烯—适配体传感检测食
矿井高温高湿环境人员热应激反应实
低介电损耗、高导热系数聚合物基复
葫芦岛乐高体验中心体验营销策略研
牡丹江市土地利用时空变化特征分析
我国电子商务与快递业联动发展实证
基于“基本型”的中考数学压轴题的
滨海城市生态系统服务价值变化研究
施洞苗族服装刺绣图案研究与设计应
我国融资租赁公司利率风险管理研究
Cap-and-Trade管制下
悲剧意识、客观必然性与自由意志荷
时间驱动作业成本法在X物流公司的
妊娠期肝内胆汁淤积症(ICP)终
《幼儿园教师专业标准(试行)》视
生态环境修复责任实施研究
微博用户转发行为预测研究
微博舆情热点发现及趋势预测研究
科目列表
市场营销 管理理论 人力资源
电子商务 社会实践 先进教育
伦理道德 艺术理论 环境保护
农村研究 交通相关 烟草论文
电子电气 财务分析 融资决策
电影艺术 国学论文 材料工程
语文论文 数学论文 英语论文
政治论文 物理论文 化学论文
生物论文 美术论文 历史论文
地理论文 信息技术 班主任
音乐论文 体育论文 劳技论文
自然论文 德育管理 农村教育
素质教育 三个代表 旅游管理
国际贸易 哲学论文 工商管理
证券金融 社会学 审计论文
会计论文 建筑论文 电力论文
水利论文 园林景观 农林学
中医学 西医学 心理学
公安论文 法学法律 思想汇报
法律文书 总结报告 演讲稿
物业管理 经济学 论文指导
计算机 护理论文 社会调查
军事论文 化工论文 财政税收
保险论文 物流论文 语言教育
教育教学 给水排水 暖通论文
结构论文 综合类别 硕士论文
博士论文    
 
 
基于深度强化学习的路口自适应控制
 
     论文目录
 
摘要第4-5页
Abstract第5页
1 绪论第8-13页
    1.1 研究背景第8-9页
    1.2 研究目的及意义第9页
    1.3 国内外研究现状第9-11页
    1.4 论文的主要内容与组织结构第11-13页
2 深度强化学习背景知识研究第13-22页
    2.1 马尔可夫决策过程第13-15页
        2.1.1 部分可观测MDP第14-15页
    2.2 Q学习算法第15-16页
        2.2.1 表格式Q学习第15-16页
        2.2.2 函数逼近Q学习第16页
    2.3 卷积神经网络第16-18页
    2.4 优化算法第18-21页
        2.4.1 梯度下降法第18-19页
        2.4.2 优化算法第19-21页
    2.5 本章小结第21-22页
3 基于深度强化学习的单路口信号控制第22-33页
    3.1 交通信号控制基础第22-23页
        3.1.1 交通信号控制基本概念第22页
        3.1.2 交通控制性能评价指标第22-23页
    3.2 深度Q网络第23-27页
        3.2.1 算法描述第23-26页
        3.2.2 DQN算法的两点改进第26-27页
    3.3 DQN在交通控制中的应用第27-31页
        3.3.1 状态空间(State Space)第27-29页
        3.3.2 动作空间(Action Space)第29-30页
        3.3.3 奖励(Reward)第30-31页
        3.3.4 Agent第31页
    3.4 单Agent场景第31-32页
    3.5 本章小结第32-33页
4 基于Agent合作的多路口信号控制第33-42页
    4.1 多Agent系统第33-34页
        4.1.1 多Agent系统的概念第33-34页
        4.1.2 多Agent系统体系结构第34页
    4.2 多Agent强化学习第34-38页
        4.2.1 基于合作的多Agent系统第34-35页
        4.2.2 协作图第35-36页
        4.2.3 协作图的算法第36-37页
        4.2.4 基于合作的序列决策第37-38页
    4.3 方案迁移第38-40页
    4.4 多Agent场景第40-41页
        4.4.1 两个Agent场景第40页
        4.4.2 三个Agent场景第40-41页
    4.5 本章小结第41-42页
5 实验结果及分析第42-50页
    5.1 实验仿真平台介绍第42页
    5.2 单路口实验结果及分析第42-48页
        5.2.1 实验参数设置第42-43页
        5.2.2 实验结果及分析第43-48页
    5.3 多路口实验结果及分析第48-49页
        5.3.1 两路口实验结果与分析第48-49页
        5.3.2 三路口实验结果与分析第49页
    5.4 本章小结第49-50页
结论第50-51页
参考文献第51-55页
攻读硕士学位期间发表学术论文情况第55-56页
致谢第56页

 
论文编号BS3168758,这篇论文共56
会员购买按0.35元/页下载,共需支付19.6元。        直接购买按0.5元/页下载,共需要支付28元 。
  • 我还不是会员,我要注册会员
  • 会员下载论文更优惠!充值还送钱!
  • 我只需要这一篇论文,无需注册!
  • 直接网上支付,方便快捷!
  •  您可能感兴趣的论文
    版权申明:本目录由www.jylw.com网站制作,本站并未收录原文,如果您是作者,需要删除本篇论文目录请通过QQ或其它联系方式告知我们,我们承诺24小时内删除。
     
     
    | 会员专区 | 在线购卡 | 广告服务 | 网站地图 |
    版权所有 教育论文中心 Copyright(C) All Rights Reserved
    联系方式: QQ:277865656 或写信给我