以编译为导向的Matrix-DSP程序分析与优化

Computer Engineering and Science(2020)

引用 0|浏览4
暂无评分
摘要
数字信号处理器(DSP)在图像处理、自动化控制、信号处理等多个领域具有广泛应用.自主研发的Matrix DSP采用了典型的单指令多数据SIMD+超长指令字VLIW的向量化架构,因此面向该架构如何实现高效的向量化编程与优化是一项重要挑战.基于Matrix DSP的体系结构特点,以编译器性能为导向,对内核级代码常用的分析优化手段进行梳理和总结,并结合一个通用矩阵乘的例子进行展示,其执行性能可最高提升1个数量级.最后,从编译器优化和程序员高效编程的角度提出了一些后续的思考与讨论.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要