新闻中心

EEPW首页 > 消费电子 > 设计应用 > 嵌入式视频图像系统压缩算法的实现和优化

嵌入式视频图像系统压缩算法的实现和优化

作者:张春光 吉林市人民广播电台 刘化彤 长春光学科技发展有限责任公司时间:2009-03-17来源:收藏

  DOPTPU4是个计算 4对 8位数据乘积求和的运算。两个 DOPTPU4可在单周期内并行 , 所以可极大地提高 SAD的计算速度。具体步骤如下:

本文引用地址:http://www.eepw.com.cn/article/92476.htm

  1)两个 LDNDW指令从当前帧和参考帧取 8个像素;

  2)两个 SUBABS4计算 8个像素的差值;

  3)两个 DOTPU4计算 8个像素乘积求和。

  像素插值也是个计算量大的模块。AVG4指令可执行 4个 8位数值平均值计算。AVG2可以执行 2个 16位数据的平均计算。SHRMB(Shift Right andMerge Byte) 右移第 2个寄存器 , 把第 1个寄存器的低位作为高字节。AVG4计算平均值,SHRMB处理结果。

  此外笔者参考 提供的 IMGLIB支持库 该库中还包括了许多常用的图像和视频处理的函数 ,以完成 DCT、 IDCT (Inverse Direct Cosine Transform)、中值滤波等功能 , 这些函数都是经过汇编。完全能够实现软件流水, 执行效率很高。采用标准序列 Coastguard.yuv编码 5帧数据,主要函数前后性能比较,如表 1所示。

  表 1 各个函数性能比较

 

  Tab1Performance of functions by analysis

  利用 EDMA进行数据搬移, 提高存储速度

  TMS320C6455DSP支持 EDMA功能 , 是在没有 CPU介入的情况下 , 访问存储器的一种工作方式。它可以直接通过 EDMA通道 , 提前把外设或片外存储器中的数据直接搬移到片上内存。对 CPU来说 , 所访问的数据总是在片内的 , 没有阻塞的情况发生 , 减少了 CPU等待时间[8]。

  使用 的 CSL (Chip SupportLibrary )支持功能[9,10]。它有专门的 DMA模块 , 便于对 DMA的各个存储器控制。主要使用 DAT函数 , 进行 DMA存储器间数据传送。其中使用 DAT copy ( )和DAT fill ( )。



评论


相关推荐

技术专区

关闭