谷歌浏览器插件
订阅小程序
在清言上使用

基于卷积神经网络图像识别算法的加速实现方法

Aerospace Control(2019)

引用 2|浏览1
暂无评分
摘要
针对当前卷积神经网络算法日趋复杂,基于通用处理器的软件实现方案运算性能难以满足实际应用实时性要求,而基于GPU的实现方案则存在高能耗、无法应用于嵌入式系统等问题,本文提出了一种使用高层次综合(HLS)实现的基于FPGA卷积神经网络加速器设计方案,采用SDSoC开发环境,在实现所需性能的同时节省了大量开发时间,实验结果表明,在输入图像为64*64*3情况下,本文提出的软硬件协同设计方案识别速度达到1.86ms,相比CPU实现方案的识别速度266ms,加速比可达143,节约了88倍功耗.
更多
查看译文
关键词
image recognition algorithm,convolutional neural network,neural network,implementation method
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要