新闻中心

EEPW首页 > 嵌入式系统 > 设计应用 > ARM NEON技术在车位识别算法中的应用

ARM NEON技术在车位识别算法中的应用

作者: 时间:2013-12-04 来源:网络 收藏

  

  由优化后程序代码可见,循环跳转次数为原来的1 4 ,但是由于使用了NEON 相关的vld1q_u32 函数,一次可在NEON的128位寄存器中装入4个32位数值,调用vaddq_u32可对4个数据时同时进行加法运算,在一个指令周期就完成了4次加法运算,理论上加法运算次数为原来的1 4 ,大大提高了运算性能。

  对于第二个for循环也可以采用类似方法优化,只是调用的函数略有不同,具体考参考GCC的技术文档,有详细的使用说明。

  其他函数如预处理、角点、相关度函数的优化和此方法类似,重点针对循环和可以并行运算的代码进行优化。

  表3 中给出了Cortex-A8 平台使用NEON 技术优化后与11测试时间的对比。

  

  4 结语

  通过使用 NEON 技术,对于图像处理这类矩阵运算进行并行优化,可大大提高处理速度,进行优化后,速度较优化前提升了达2倍之多,较11提升了8 倍的速度。ARM COTEX-A 系列所使用的NEON 技术,不仅使车位图像检测算法的速度有很大提升,在信号处理等多媒体处理算法中,也有广阔的应用前景。


上一页 1 2 3 下一页

评论


相关推荐

技术专区

关闭