新闻中心

EEPW首页 > 模拟技术 > 设计应用 > 基于PC主机北桥的长时间不间断高速采集和存储的系

基于PC主机北桥的长时间不间断高速采集和存储的系

作者:时间:2012-09-26来源:网络收藏

系统与桥

本文引用地址:http://www.eepw.com.cn/article/185722.htm

  透明桥系统是指整个系统中只含一个设备,其余所有设备都是以端点设备的形式出现。所有下游设备不能自发进行数据传输,只有在上位机引导下进行数据传输。采集卡可以通过DMA等方式将数据传输到上位机的内存中的某个区域,然后再将内存中的数据到磁盘阵列中。由于和读取同一块内存,因此在软件上可以多开辟几块内存,利用多线程规避系统顺序执行所带来的延迟,提高传输和的速度。

  

  图3 基于PCI-E Switch的非透明桥系统

  PEX8616提供非透明桥,非透明端口保持处理器的电气及逻辑隔离,可以防止列举端口后面的设备,从而隔离其后的处理器及内存空间。非透明端口允许打开窗口以交换数据,通过地址转换,数据从端口的一侧中传输另外一侧。每个处理器把非透明端口的另一端当作一个下游设备,并把它映射到自己的地址空间。利用非透明端口的地址翻译能力,处理器之间可以通过PCI-E总线进行通信。因此系统构建可以考虑引入非透明桥,在上位机存在的情况下,让采集卡或者存储卡也作为一个端,数据在采集存储过程中可以直接绕开PC主机进行,当数据进行反演时,上位机再作为上游,对磁盘阵列进行操作和控制。

  图3为一种非透明桥的系统,其中包含两个Host Bridge和PCI-E Root Complex,其中本地设备系统中的Root Complex连接到PCI-E Switch的一个NT端口上,从而在主系统的PCI结构中把它作为一个下游设备。PCI-E Switch连接两个独立的处理器域,本地设备的资源和地址对主系统是不可见的。允许本地处理器独立地配置和控制其子系统。主系统和本地系统的时钟完全独立。主系统和本地系统的地址完全独立,在主系统和本地系统之间可以进行地址翻译。增加了隔离主系统、本地系统总线之间地址域的功能。

  在构建采集存储系统的过程中可以将采集模块或者存储模块以构建本地系统的方式实现,从而可以在采集数据后直接对数据进行预处理然后再送到PCI-E总线进行存储或者可以在存储之后直接在本地系统进行回放或者提供网口访问存储数据等功能。

  采集存储系统的实现

  系统结构

  系统由PC主机、PCI-E Switch背板、采集卡和RAID存储卡组成。在完成背板设计后,先利用一块PEX8311接口芯片的采集卡,Rocket RAID 2680磁盘阵列卡,实现一种存储的系统。然而因为普通的PC机箱的空间有限,如果将PCI-E Switch背板与上位机的接口直接以PCI-E金手指的形式,则当背板接入主机后,很难创造一个空间可以容纳其他板卡插到背板上。并且由于磁盘阵列是由多个Western Digest WD3200AAJS的硬盘构成,发热量也成为一个很显著的问题。

  因此本方案考虑通过引入Cable PCI-E来改善系统。Cable PCI-E是基于PCI-E用于服务器、台式机和笔记本的下一代外围总线,它具有以下的优点:

  • 成本较低,由于PCI-E广泛用于各种主机;

  • 高带宽,Gen1 ×4 Cable的带宽即达到1GB/s;

  • 低延迟,300ns~700ns;

  • 兼容性强,系统软件上完全兼容PCI模式;

  • Cable PCI-E至少由15种标准形成;

  • 唯一可以同时应用于Chip-to-Chip、board-to-board和box-to-box的标准。

  PCI-SIG标准组织将Cable PCI-E定义为一种基于PCI-E的基本规范的扩展,通过线缆化将PCI-E协议扩展到box-to-box应用和实现长距离的传输是产生Cable PCI-E标准的目的。Cable PCI-E提供一种简单而且具有高性能的总线,方便扩展PC以及测试I/O等设备。本方案就是利用Cable PCI-E方便扩展设备的特点,将整个采集存储系统完全分离到PC机箱外,最终可以独立构建成一个机箱形成一种box-to-box的模式,使得整个系统的可扩展性很强,PCI-E ×4及其以下的COST采集板卡和存储卡均可以很好的应用于本系统中。独立的机箱也为磁盘阵列中的硬盘提供足够的空间,系统的散热也能得到很好的保障。

  系统的结构图如图4所示,整个系统围绕PCI-E Switch构建而成,通过两个Cable PCI-E将系统的各个模块独立开来。由于采集卡采用的为PEX8311,故采集卡与PCI-E Switch连接的通道数为1,在后续的研究中可以升级采集的采集和接口速度从而实现整个系统的升级。磁盘阵列卡是一款消费类产品,Rocket RAID 2680不能提供HOST功能,因此本案构建的是一个透明桥系统。

  

  图4 PCI-E Switch采集存储系统结构图

  数据的采集、传输和存储

  数据采集

  采集板AD采用TI ADS6145芯片,采样位数为14bit,最高采样频率为125Mbps。AD采集后的数据接入到Xilinx公司Spartan-3ADSP系列的FPGA芯片XC3SD3400A。因为PEX8311接口芯片可支持8位、16位、32位数据的传输,为了提高数据传输的效率,同时也为了使得数据采集速率获得相对提升。本设计中PEX8311中采用32位数据传输。所以在本方案FPGA数据流逻辑控制中,不仅要完成数据的缓存以及数据传输逻辑的控制,还要进行数据位的变换扩展,由14位数据扩展为32位数据。

  数据传输和存储

  数据传输是指的从PEX8311到主机内存的过程。本方案选择DMA方式进行,由于PEX8311内建两个DMA通道。本方案使用其中的一个,DMA通道0。在安装PLX提供的SDK以及驱动后,可以通过其提供的API开发包中的函数对PEX8311和PEX8616进行控制和访问。一般的DMA传输过程是无需CPU的参与的,但是含Burst的DMA操作还是要通过CPU的参与的,与单独的一次读写操作相比,Burst只需要提供一个起始地址就行了,以后的地址依次加1,而非Burst操作每次都要给出地址,以及需要中间的一些应答、等待状态等等。如果是对地址连续的读取,Burst效率高得多,但如果地址是跳跃的,则无法采用Burst操作。PEX8311的DMA传输支持Single Burst 、Burst-4LW和Infinite Burst三种突发方式,表1为三种突发方式在不同单次传输字节数的情况下的传输速度对比。

  表1 DMA传输在三种突发方式下的速度对比(MB/s)

  

  由表1数据可观察出,采用后两种突发方式进行DMA传输时,速度较普通DMA传输方式有明显的提高,因此本方案采用Infinite Burst突发方式进行DMA传输,使用连续的地址,以提高DMA传输的速度。

  PLX公司SDK中提供的函数可对PEX8311和PEX8616进行一系列控制和操作,DMA通道的参数设置在打开DMA通道的时候一并完成,通过设置函数PlxPci_DeviceOpen()中的PLX_DMA_PROP结构体可以设置DMA传输的突发方式、本地总线带宽和传输方向等参数。在系统初始化过程中设置以上参数。当整个采集存储过程完成时,则需要进行对整个工程的关闭工作,同样是通过SDK中的函数PlxPci_DeviceClose()来关闭DMA通道。然后释放开辟的所有内存块空间,并将指针赋NULL值。系统连续存储的整个过程从开始到结束,虽然进行了很多个DMA传输的操作,但是只进行了一次DMA通道的打开和关闭,从而尽可能低的减小由于这部分时间带来的速度影响。软件流程如图5所示。

  

  图5 采集存储系统软件流程图

  根据图5可以观察到系统引入了多线程技术,多线程技术的实现是通过分别创建两个函数,一个控制DMA控制器进行连续的数据传输,另一个用于将内存中的数据快速的存储到磁盘阵列中,然后创建成为两个线程。当准备开始进行数据传输的时候,首先是设置DMA传输的参数并打开DMA通道。在此过程中还需要申请多块内存空间进行缓存数据,由于使用多线程技术,因此一块内存空间不能同时供两个函数同时读写,因此创建多个内存块,然后将两个线程同时打开,对开辟的多个内存块依次进行读写操作,但是由于整个过程只包含一个极短的时间延迟,因此完全可以将整个读写内存的过程近似的看成一个同时进行读写操作,因此达到提高存储的速度的目的。

p2p机相关文章:p2p原理




评论


相关推荐

技术专区

关闭