LDLT分解协处理器的并行结构研究

Computer Engineering(2011)

引用 23|浏览8
暂无评分
摘要
为提高LDLT分解协处理器的性能,基于FPGA平台,研究其并行结构。分析循环片间的数据依赖关系,提出LDLT分解细粒度并行算法,并在可扩展一维阵列处理器中加以实现,利用主机、算法加速器组成单精度浮点LDLT分解协处理器的并行结构。实验结果表明,与运行在2.50 GHz Pentium微处理器上的C代码相比,该协处理器可获得32.03倍~43.25倍的性能提升。
更多
查看译文
关键词
Field Programmable GateArray(FPGA),fine grit parallel,LDLT decomposition,coprocessor
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要