新闻中心

EEPW首页 > 光电显示 > 设计应用 > 双主机冗余显示系统的分析和设计

双主机冗余显示系统的分析和设计

—— 大大提高系统运行的可靠性
作者: 时间:2010-12-24 来源:电子产品世界 收藏

本文引用地址:https://www.eepw.com.cn/article/115730.htm


  冗余系统结构

  冗余显示系统采用了双主机备份系统,一个主机在工作时候出现致命问题不能恢复时候,则由另外一台主机接管其所有的业务。系统的结构采用目前通用的工业计算机平台PICMG1.3规范,将一块置于系统底板中,同时在底板设计2个符合PICMG1.3规范的插槽和16个PCIe×4的插槽。视频输入卡可以兼容多种视频信号的输入,包括了RGB、Video等信号;视频输出采用GPU卡进行硬件加速等各种图象处理,支持多通道输出。系统的架构框图如图2,采用了目前常用的PCIe扩展技术,将PCIe总线扩展出16个×4的PCIe通道,其中8个×4通道供视频数据输入用,8个×4通道供GPU(图像处理单元)处理显示用。上行端口采用了两个×16的PCIe通道连接了HOST1和HOST2,两个主机通过桥芯片的门铃寄存器互通信息。当HOST1出现致命错误不能正常工作时候,可以在程序中预先设置流程,通过门铃寄存器将此信息传递到HOST2;HOST2接收到此信息后,启动复位操作,对桥芯片进行重新配置,届时原来由HOST1控制的所有视频输入和GPU卡等将通过通道的重新配置进入HOST2的监管,同时也就实现了系统的高可靠性。

  主机的状态转移图见图3[3]。任一主机上电时,进人竞争及检测状态,竞争原则是先启动者为主机;后启动者为备机。状态转换方法包括:

  (1)通过自检,若主机发现自身有故障,在心跳寄存器和备机正常的条件下,经过门铃寄存器通知备机升为主机,本身转人故障状态;

  (2)若主机发生故障,不能在规定时间内向备机发心跳信息及有关信息,备机经核实主机已放弃主用状态条件下,自动转入主机状态;

  (3)备机自检发现故障,转入故障状态;

  (4)进入故障状态的设备给出报警信息,经修复后进入再次竞争状态。

  中有一些比较特殊的寄存器功能,包括了门铃寄存器和心跳消息。门铃寄存器被用来从的一边向另一边发送中断。的两边一般都有软件可以控制的中断请求寄存器和相应的中断屏蔽寄存器。这些寄存器在的两边都是可以被访问的。心跳消息一般来自主设备端往从设备端的主机,可用来指示它还活着。从设备主机可监控主设备主机的状态,如果发现出错,它就可以采取一些必要的措施。通过门铃寄存器可以传送心跳消息。当从设备主机没有收到一定数量预先规定好的心跳消息时,就可以认为主设备的主机出错了。本系统中就是采用了上述寄存器的特殊功能来实现对主机的监控和工作状态的转换的,下面将对系统出现故障后,主机2接管主机1的过程进行详细描述。

  当主机1工作时候,主机2处于待机模式。两个主机之间通过心跳消息通信。正常工作过程中,主机处理器完成所有的正常职责,因为它要主动管理系统。此外,它还需要定时发送心跳消息给备份处理器。心跳消息是发起消息的处理器健康与否的标志。心跳消息在该系统设计中同时也保护了一些特定的数据,以减少误报警的可能性。心跳消息承担了为备份处理器验证主机处理器功能是否正常的工作,同时,这一数据也提供所有外围设备的最新活动和状态。如果备份主机不能及时地接收到心跳消息[4],它将开始承担控制。首先,它将主机1中的端口降为下行端口,以防止已经发送故障的处理器与系统的其他部分交互。该变换是通过使用非透明桥端口中的BAR(基地址寄存器 )提供的寄存器CSR(空间配置寄存器)存储器进行地址映射[5],以重新编程交换器的CSR来完成;接着,需要将主机2的端口配置成上行端口,把主机1的端口配置成非透明桥端口,同时拆除主机1的链路;然后,主机2通过操作桥控制寄存器,对原理主机1中的设备进行重启操作;最后,在清除了队列中遗留的所有事务或者由于主机1发生故障而遗留的非完成状态之后,主机2重新对所有设备进行枚举,经过枚举后,系统开始正常运行。

  结语

  本文主要针对目前在医疗、监控等领域的高可靠性高清大屏的应用,专门设计了一套双主机冗余系统。该系统采用了目前最新的PCIe总线技术,结合PLX公司提供高灵活性的透明桥芯片以及非透明桥技术,在不改变常规视频显示系统内部设计的情况下,使得系统的稳定性大幅度提高,系统故障率降低到原来的50%;同时该系统采用了具有96个PCIe通道的桥芯片,大大减少了桥芯片的使用,降低了系统的成本。


上一页 1 2 下一页

评论


技术专区

关闭