logo
教育论文中心  教育论文中心   广告服务  广告服务   论文搜索  论文搜索   论文发表  论文发表   会员专区  会员专区   在线购卡   在线购卡   服务帮助  服务帮助   联系我们  联系我们   网站地图  网站地图   硕士论文  会员专区   博士论文
当前位置:教育论文中心首页--博士论文--扩展Markov决策过程的性能灵敏度分析与优化
博硕论文分类列表
工业技术 交通运输 农业科学
生物科学 航空航天 历史地理
医学卫生 语言文字 环境科学
综合图书 政治法律 社会科学
马列主义、毛泽东思想 艺术
数理科学和化学 文学
天文学、地理科学 军事
文化科学、教育体育 经济
自然科学总论 哲学
查看更多分类
 
论文搜索
 
 
相关论文
昆明鼠孕期人巨细胞病毒原发感染对
米根霉L-乳酸高产菌株的选育及发
Markov链调控风险模型研
高集成阀控缸位置控制系统参数灵敏
基于梯度逼近方法Markov
连续时间统一MAXQ算法及其应用
命名数据网络转发策略拥塞控制
策略梯度增强学习理论、算法及应
无线传感器网络能量高效传输策略
线性规划灵敏度分析&运输问题
基于组合模型技术子午线轮胎胎圈
单电源线路纵差保护灵敏度分析
变压器差动保护单相接地灵敏度分析
结构不确定分析全局及区域灵敏
基于马尔可夫决策过程AUV路径
单层网壳结构风振响应参数灵敏度
磁流变液阻尼器振动灵敏度分析
折扣和平均准则下SMDP基于性能
在概率阈值准则下马尔可夫策略
面向P2PMarkov模型
基于马尔科夫理论不确定性规划和
离散事件系统Markov模型在
基于Markov过程电网资产全
Markov决策在网级路面管理系
线性Markov切换系统随机微
基于Markov网络模型复述自
具有Markov切换参数随机脉
具有Markov跳跃参数离散时
大规模Markov系统基于性能
药物敏感性试验中不同方法灵敏度
饱和度对粉土灵敏度影响室内试验
基于灵敏度分析风力发电系统电
业务过程管理实施方法理论及应用
三种染色方式下四种核酸染料灵敏
灵敏度化学发光磁酶免疫法检测人
电桥灵敏度研究
冷战后美国外交决策过程新变化-
带扩散干扰风险模型中破产概率分布
临界下临界多物种分支过程家谱
半马氏环境下逆向强化学习算法研
机械振动传递路径系统传递性研究
钢筋混凝土核心筒抗震性能及其设计
 
科目列表
市场营销 管理理论 人力资源
电子商务 社会实践 先进教育
伦理道德 艺术理论 环境保护
农村研究 交通相关 烟草论文
电子电气 财务分析 融资决策
电影艺术 国学论文 材料工程
语文论文 数学论文 英语论文
政治论文 物理论文 化学论文
生物论文 美术论文 历史论文
地理论文 信息技术 班主任
音乐论文 体育论文 劳技论文
自然论文 德育管理 农村教育
素质教育 三个代表 旅游管理
国际贸易 哲学论文 工商管理
证券金融 社会学 审计论文
会计论文 建筑论文 电力论文
水利论文 园林景观 农林学
中医学 西医学 心理学
公安论文 法学法律 思想汇报
法律文书 总结报告 演讲稿
物业管理 经济学 论文指导
计算机 护理论文 社会调查
军事论文 化工论文 财政税收
保险论文 物流论文 语言教育
教育教学 给水排水 暖通论文
结构论文 综合类别 硕士论文
博士论文    
 
 
扩展Markov决策过程的性能灵敏度分析与优化
 
     论文目录
 
摘要第1-5页
Abstract第5-11页
第一章 绪论第11-23页
   ·性能优化问题的研究方法第11-12页
   ·基于灵敏度观点的优化第12-14页
   ·半Markov决策过程的研究现状第14页
   ·部分可观Markov决策过程的研究现状第14-19页
   ·本文的研究目的第19-20页
   ·本文的内容第20-21页
   ·本文的主要贡献第21-23页
第二章 Markov决策过程基于灵敏度的性能优化第23-42页
   ·Markov决策过程(MDPs)第23-28页
     ·离散时间和连续时间MDPs第23-24页
     ·决策时刻、历史与策略第24-25页
     ·转移概率矩阵、无穷小矩阵和优化准则第25-27页
     ·MDPs的研究现状第27-28页
   ·Markov过程的灵敏度分析第28-31页
     ·实现因子和性能势第28-29页
     ·性能势的估计第29-30页
     ·性能差与性能导数公式第30-31页
     ·MDPs的最优性方程第31页
   ·性能梯度与基于梯度的优化第31-35页
     ·梯度的估计第32-34页
     ·基于梯度的优化算法第34-35页
   ·策略迭代算法第35-37页
     ·基于理论值的策略迭代第35-36页
     ·基于样本轨道的策略迭代第36-37页
   ·MDPs基于事件的优化第37-42页
第三章 半Markov决策过程与性能灵敏度分析第42-63页
   ·Markov更新过程、半Markov过程及其决策过程第42-46页
     ·Markov更新过程第42-44页
     ·半Markov过程第44-45页
     ·半Markov决策过程第45-46页
   ·平均准则下的灵敏度分析和优化第46-51页
     ·基于离散时间Markov过程的灵敏度分析和优化第46-49页
     ·基于连续时间Markov过程的灵敏度分析和优化第49-51页
   ·折扣准则下的灵敏度分析和优化第51-63页
     ·连续时间Markov过程在折扣准则下的灵敏度分析与优化第51-56页
     ·半Markov决策过程在折扣准则下的灵敏度分析和优化第56-63页
第四章 离散时间POMDP与性能灵敏度分析第63-93页
   ·POMDP的定义及其应用第63-65页
   ·基于观测的策略下的POMDP的灵敏度分析和优化第65-78页
     ·基于观测的策略下的POMDP的灵敏度分析第66-70页
     ·性能灵敏度公式的直观理解第70-71页
     ·POMDP关于基于观测的策略的梯度估计第71-75页
     ·基于观测的策略的策略迭代算法第75-78页
   ·POMDP基于内部状态的灵敏度分析和优化第78-93页
     ·有限状态控制机第78-81页
     ·POMDP基于内部状态的灵敏度分析第81-86页
     ·策略梯度计算与估计第86-89页
     ·策略迭代算法第89-93页
第五章 连续时间POMDP的策略梯度估计第93-100页
   ·连续时间部分可观Markov决策过程第93-94页
   ·连续时间部分可观Markov决策过程的梯度第94-97页
   ·连续时间部分可观Markov决策过程的策略梯度估计第97-100页
第六章 随机切换过程第100-106页
   ·随机切换过程的引入第100-101页
   ·随机切换的连续时间Markov过程第101-103页
   ·随机平稳策略下的连续时间MDPs第103-105页
   ·小结第105-106页
第七章 总结与展望第106-109页
   ·总结第106-107页
   ·展望第107-109页
参考文献第109-117页
致谢第117-118页
攻读博士学位期间的研究成果第118-119页

 
 
论文编号BS1288310,这篇论文共119
会员购买按0.35元/页下载,共需支付41.65元。        直接购买按0.5元/页下载,共需要支付59.5元 。
我还不是会员,注册会员
会员下载更优惠!充值送钱!
我只需要这篇,无需注册!
直接网上支付,方便快捷!
 您可能感兴趣的论文
版权申明:本目录由www.jylw.com网站制作,本站并未收录原文,如果您是作者,需要删除本篇论文目录请通过QQ或其它联系方式告知我们,我们承诺24小时内删除。
 
 
| 会员专区 | 在线购卡 | 广告服务 | 网站地图 |
版权所有 教育论文中心 Copyright(C) All Rights Reserved
联系方式: QQ:277865656 或写信给我