|
|
|
面向CPU/GPU异构体系结构的并行计算关键技术研究 |
|
论文目录 |
|
目录 | 第1-8页 | 表目录 | 第8-9页 | 图目录 | 第9-11页 | 摘要 | 第11-13页 | Abstract | 第13-15页 | 第一章 绪论 | 第15-25页 | ·研究背景 | 第15-21页 | ·CPU/GPU 异构高性能计算系统 | 第15-18页 | ·GPU 高性能计算应用 | 第18-19页 | ·并行计算研究面临的挑战 | 第19-21页 | ·主要研究内容和贡献 | 第21-23页 | ·论文结构 | 第23-25页 | 第二章 并行计算关键技术研究综述 | 第25-47页 | ·并行计算机体系结构 | 第25-31页 | ·Flynn 分类法 | 第26-27页 | ·并行计算机体系结构模型 | 第27-29页 | ·并行计算机体系结构的发展趋势 | 第29-31页 | ·并行计算模型 | 第31-37页 | ·PRAM 类模型 | 第31-33页 | ·BSP 类模型 | 第33-35页 | ·LogP 类模型 | 第35-37页 | ·异构并行计算模型 | 第37页 | ·并行编程模型 | 第37-42页 | ·数据并行模型 | 第38-39页 | ·消息传递模型 | 第39-40页 | ·共享变量模型 | 第40-41页 | ·一些新兴编程模型 | 第41-42页 | ·并行可扩展性模型 | 第42-45页 | ·加速比模型 | 第42-43页 | ·可扩展性度量指标 | 第43-45页 | ·本章小结 | 第45-47页 | 第三章 HLognGPM:面向 GPU 集群的并行计算模型 | 第47-73页 | ·引言 | 第47-48页 | ·相关工作 | 第48-49页 | ·HLognGPM 通用并行计算模型 | 第49-56页 | ·模型定义 | 第51-52页 | ·模型应用 | 第52-56页 | ·HLog3GPM 并行计算模型 | 第56-62页 | ·参数测定方法 | 第56-58页 | ·映射到 TH-1A 系统 | 第58-62页 | ·模型的验证 | 第62-70页 | ·实验方案 | 第62-64页 | ·测试案例 NPB-EP | 第64-66页 | ·测试案例 NPB-CG | 第66-70页 | ·讨论 | 第70-71页 | ·本章小结 | 第71-73页 | 第四章 几种混合编程模型在 GPU 集群上的性能比较 | 第73-95页 | ·引言 | 第73-74页 | ·相关工作 | 第74-76页 | ·编程模型 | 第74-75页 | ·NPB 基准测试程序集 | 第75-76页 | ·大型 GPU 集群的混合编程模型 | 第76-78页 | ·MPI+CUDA(MC)混合编程模型 | 第76-77页 | ·MPI+OpenMP/CUDA(MOC)混合编程模型 | 第77-78页 | ·NPB 内核的高效混合实现 | 第78-86页 | ·EP 程序的混合实现 | 第78-80页 | ·CG 程序的混合实现 | 第80-84页 | ·MG 程序的混合实现 | 第84-86页 | ·混合模型的性能对比 | 第86-92页 | ·性能评价准则 | 第86-87页 | ·实验设计 | 第87页 | ·性能分析 | 第87-90页 | ·讨论 | 第90-92页 | ·本章小结 | 第92-95页 | 第五章 并行算法—GPU 集群组合的可扩展性研究 | 第95-111页 | ·引言 | 第95-96页 | ·相关工作 | 第96-97页 | ·协同感知可扩展性模型 | 第97-104页 | ·GPU 集群体系结构模型 | 第97-98页 | ·模型的定义 | 第98-100页 | ·可扩展性分析 | 第100-102页 | ·可扩展模型使用方法 | 第102-104页 | ·实验验证 | 第104-110页 | ·实验设计 | 第104-105页 | ·EP-GC组合的可扩展性分析 | 第105-106页 | ·CG-GC组合的可扩展性分析 | 第106-108页 | ·MG-GC组合的可扩展性分析 | 第108-110页 | ·本章小结 | 第110-111页 | 第六章 RRTM 长波辐射方案在 GPU 集群上的高效实现 | 第111-129页 | ·引言 | 第111-112页 | ·长波辐射物理过程 | 第112-115页 | ·长波辐射过程 | 第112-113页 | ·RRTM 长波辐射传输方案 | 第113-115页 | ·异构混合并行算法设计 | 第115-119页 | ·RRTM 程序执行特点 | 第115-116页 | ·并行策略 | 第116页 | ·负载平衡策略 | 第116-118页 | ·异构混合并行算法 | 第118-119页 | ·高效混合实现 | 第119-122页 | ·GPU 程序优化 | 第119-121页 | ·MOC 混合实现 | 第121-122页 | ·数值实验及可扩展性分析 | 第122-127页 | ·负载平衡策略的验证 | 第122-124页 | ·RRTM 混合程序的计算效率 | 第124-126页 | ·可扩展性分析 | 第126-127页 | ·本章小结 | 第127-129页 | 第七章 结论与展望 | 第129-131页 | ·工作总结 | 第129-130页 | ·研究展望 | 第130-131页 | 致谢 | 第131-133页 | 参考文献 | 第133-151页 | 作者在学期间取得的学术成果 | 第151-152页 | 作者在学期间参加的科研项目 | 第152页 |
|
|
|
|
论文编号BS2023480,这篇论文共152页 会员购买按0.35元/页下载,共需支付53.2元。 直接购买按0.5元/页下载,共需要支付76元 。 |
|
|
我还不是会员,注册会员!
会员下载更优惠!充值送钱! |
我只需要这篇,无需注册!
直接网上支付,方便快捷! |
|
|
|
版权申明:本目录由www.jylw.com网站制作,本站并未收录原文,如果您是作者,需要删除本篇论文目录请通过QQ或其它联系方式告知我们,我们承诺24小时内删除。 |
|
|