非结构有限体积CFD计算的网格重排序优化

ZHANG Yong,ZHANG Xi, WAN Yun-bo,HE Xian-yao,ZHAO Zhong, LU Yu-tong

wf(2022)

引用 0|浏览0
暂无评分
摘要
网格重排序是提升流体力学CPU和GPU并行计算效率的重要手段之一.对于非结构网格,由于其数据存储无规律,数据的间接访问会导致访存延迟,尤其是在GPU并行计算时,数据的间接访问将引起内存的非对齐访问,放大了访存延迟的影响.对此,采用Reverse Cuthill-Mckee网格重排序方法优化了非结构网格的数据局部性,并设计了一种面向编号重排序方法.算例测试表明,网格重排序不影响最终计算结果.对比分析了网格重排序对非结构求解器在CPU和GPU上的性能影响:对CPU计算,可以使部分热点函数运行时间降低约20%,整体运行时间降低15%~20%;对GPU计算,大部分热点函数运行时间可降低35%~60%,程序整体运行时间降低约40%.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要