新闻中心

EEPW首页 > 测试测量 > 设计应用 > 在高精度时间间隔测量中隔离位误码率突发事件

在高精度时间间隔测量中隔离位误码率突发事件

作者:时间:2011-11-24来源:网络收藏

发现、识别和隔离罕见定时事件(rare timing event)、竞争状态和非确定性抖动效应通常十分困难。随着业界采用各种经验规则和近似方法来判断设计方案的统计特性何时达到“足够好”的水平,这一点在今天变得尤为突出。更重要的是,这个问题还很容易掩盖潜在的重大设计缺陷。本文介绍一个简单的案例研究,它不注重理论分析,而是尝试展示如何通过逐周期的波形分析来大幅提高工程人员的能力,使他们对罕见事件更加了解,进而捕捉这些罕见事件并分析其实质,隔离其来源。

我们需要测试串行数据流的组成,它们与高性能数字视频应用中的信号有些类似。我们采用HP 8133A精密数字信号发生器和取样速率达20GSa/sec的安捷伦54855A实时示波器来激励和捕捉一系列单次数字波形。8133A发生器广泛用来产生数字信号流和时钟。这种脉冲发生器的一些新款型功能更强,为用户对已知数字信号进行精密抖动测量提供了最大的裕度。图1显示了8133A的抖动测试性能,在ASA公司的M1上测量时,小于800fs RMS。

可以想象,当某天发现8133A产生类型稍有不同的测量结果时,我们会有多么惊讶。图2中左侧图形是一个很不寻常的结果,数据信号中的规则抖动应当与右侧图形相似才对。

实际上,我们在最初以及进行的所有研究取样中从未见过这种“四模式”柱状图。这个柱状图是如此罕见,以至于在使用眼图和柱状图进行数百次取样(经历好几天时间)和查找之后,我们再也没有见到过与之相似的柱状图。当我们决心要找到和显示同样的柱状图,并为此做出了一番精心策划的努力之后,对它的看法也相应发生了改变。

不过,假设在研究试验中偶然捕捉到了类似“四模式”柱状图的一个瞬时、单次出现的波形取样。果真如此,可能会想:“嗯,这可真是怪事,一定是哪儿出错了,才会出现这种情况!”之后,我们很可能按下“运行/停止”按钮再次取样,特别是当觉得自己的设备吞吐率高、更新快速、非常令人满意时。由于上面的“四模式”柱状图实际上是一个罕见事件时,因此下一个以及下几百个取样几乎肯定不会再出现类似的结果。

事实上,在查找过程中我们一直没有发现这种“四模式”柱状图。当我们认识到自己遇到的问题时,我们就必搜索这个图形。但是,在搜索之前,我们必须知道它确实存在。而且,由于罕见事件如此稀少,捕捉它们的最佳途径就是一开始就秉持正确的态度。

了解罕见事件

在ASA公司,我们很少认为统计方法能够帮助找到罕见定时或抖动事件。我们相信罕见事件要比人们想象的普通得多。罕见事件有多种不同的形式,有些真正是非常难得发生一次的差错,其他的是一些长周期事件,有些是以短时突发形式发生的。我们也了解所有测试设备的一些基本局限,人们应该具备相应的洞察力,可以理解测试设备表明的有关罕见事件的意义。本文后面将简要概述一下测试设备的部分局限性。实时、逐周期的波形捕捉要远比欠采样方法好得多,我们倾向于取样一次随即就对它进行分析;而不是大量取样,再通过运用测量算法对波形数据进行处理来得出结果。我们相信,查找罕见定时事件成功的一半在于如何设计查找方法。

发现罕见事件

不过,如何才能发现这种稍纵即逝的“四模式”柱状图呢?我们在串行数据流上测量RjDj。无论是RjDj数值本身,还是眼图或波形都无法识别出这个罕见错误。在一次连续取样过程中观察M1时,注意到有时单次采样的Rj/Dj/Tj数值突然“跳动”一个相当大的幅度,即使累加了 100次采样之后仍然如此。这种现象非常特别,因为被测系统据信是非常稳定的。这个现象也在收敛指示器上得到了证实,它们一直显示处于收敛状态,只在罕见情况下才出现发散。这种现象令我们感到奇怪,测量仪器告诉我们发生了问题。

起初,我们分析肯定是自己在测量时出错了,但在使用新的54850系列示波器时,感觉和使用8133A一样。而这种示波器性能非常优秀,不可能自己产生这种现象。一定是软件中有什么错误!但是,我们什么也没找到,于是开始审视自己的测量方法,但是也没有找到想象中的错误。我们尝试再次进行测量,却无法复现先前的结果。

我们利用M1的“记录到磁盘”特性,记录下了20分钟左右过程中进行的500次连续取样所获得的带时间标记的数据。同时,利用M1的Rj/Dj ASM(针对特定应用的测量)屏幕上的“保存”功能,将每次取样的Rj/Dj/Tj值保存到了一个文本文件。这个文本文件被加载到Excel,根据取样序号绘出了Rj/Dj/Tj曲线,如图3所示。Tj图至少显示出了三个明显的“跳变”,对应的取样序号约为63、106和280。

这时,我们开始意识到出现了一些奇怪的情况。毫无道理,Tj的值会在一次取样中剧烈增加,一定是数据中出现了什么问题。

识别罕见事件

利用M1 的“自动加载”特性和早前保存的时间标记数据,我们可以按多种视图查看数据,以便了解在两次取样之间它们是如何改变的,或者有无改变。查看信号沿抖动柱状图时,我们发现某些取样的柱状图分布形状与其他大部分取样显著不同,参见本文前面的头两幅柱状图。找到那些特定的取样后,发现它们正是使Tj值发生跳变的那几个取样。

这时,我们开始把这三个事件看作罕见定时事件。我们认识到在500个取样中只发现3了个奇怪的取样,而且每个取样记录了大约3万个周期的波形,总共有约1500万个周期的波形信息。显然,这是一个虚假事件,如果不是罕见事件的话。但它不是那种经过15天数据传输之后才出现一个位误码的罕见事件。另外一点需要注意的是,柱状图的形状很不相同,表明不止一位数据出现异常,而是有一系列数据位都发生了错位。这次错误不是一个单独的错误,而是偶然出现的一组错误。更专业的表述是,这次错误看来是罕见的、偶然性的和突发性的。

考察问题取样数据所绘出的信号沿抖动图和脉宽抖动图中的尖峰位置时,可发现以下二者的位置之间有着很强的关联性:1. 已知跳变位置;2. 与问题取样相关的筛选信号沿抖动中的明显变化。残差与平均单位间隔时间的影响并不是根本性的。通过这个分析,有关M1的疑问基本上被排除了。因此我们得到的结论是,在发生跳变的取样位置上很可能确实存在BER突发。

分离罕见事件

为了确定上述特性是确实存在于信号本身,还是M1或示波器所带来的,我们用不同的示波器、不同的脉冲发生器和不同的抖动分析工具进行了很多次测试。结果表明,只有这个特定的信号发生器表现出了“跳变”的特性。这给了我们很大信心,问题应当出在信号源本身,或是某种环境因素对信号源产生了影响。

由此可见,一个简单的方法就是将脉冲发生器与其所在的环境隔离开来。事实上,多年来ASA公司已经发现有许多环境不适合进行精确的定时和抖动测量。一些日常的办公环境会成为引起位误码的来源。有时,这些环境问题会影响信号发送源,就象本例中的情况一样。大多数时候,它们影响的是接收器。

我们并不关心是8133A脉冲发生器对耦合进来的环境因素过于敏感,还是仪器本身产生了错误。我们关心的是,到现在可以推断,我们多年来一直信赖的标准脉冲发生器看来至少容易受到一些(内部或外部)激励所引起的BER突发的影响。这是一个首先需要抓住的事实。

发现罕见事件的其他方法图3:Tj图至少显示出了三个明显的“跳变”。(点击看大图)

发现罕见事件的方法很多。最常用的方法就是让示波器以无限制持续模式整晚运行。这样有可能在眼图或柱状图中捕获一些蛛丝马迹。当然,我们同样也有可能忽略这些数据。归根到底,人们不可能真正知道在整个夜晚期间环境中到底发生了什么情况。更重要的是,许多示波器,尤其是那些不执行逐周期波形取样并在屏幕上显示取样存储器中每一个周期数据的那些仪器,要以小于100波形/秒的更新速率在宽度为两个周期的时间窗口中发现一个罕见事件(如10-12 BER)不是一件容易的事情,即使连续工作10小时也未必能做到。而且就算捕捉到了罕见事件,“四模式”柱状图又表明了误码来源的什么信息呢?回顾一下,现在已经得到了“四模式”柱状图,但仍然无法确定仅凭这个柱状图本身能表明问题起源的任何信息。不过它确实表明出现了问题。

如果用PRBS波形通过硬件或软件方式来进行同步,有些示波器可以追溯错误图案的位置。这种方法使用方便,但实际上它只适用于示波器能够与信号发生器进行同步的激励/响应应用。这种系统无法用于实时设计中的真实数据。另外,使用PRBS信号源来调试设备对于查找由确定性时不变错误(如符号之间的干扰)引起的误码可能非常有帮助。但是,重复性的PRBS图案测试对于实时信号并不足够,除非采用一个很长的PRBS图案,并且使用一个既能查看确定性时不变定时错误又能查看非确定性时变定时错误的实时示波器来捕捉这个图案。一种理想的方法是使用一台实时示波器和一个长PRBS图案或一个由实际设计环境中部件的实时应用所产生的实时随机数据流。

我们本来可以利用一个位误码率测试器(BERT)来帮助表征异常现象,它们对表征设计非常有益,但也非常昂贵(即使租用一个月也是代价不菲)。而且,虽然我们知道通过这种方法可以判定系统是否存在一些问题,但位误码率数值又表明了什么信息呢?位误码率测试器确实具有许多优秀的功能可用来表征多种不同情形下的位误码率,但是在实践中,我们很少看见系统设计人员用它来对设计方案进行调试。

本文小结

本文介绍了很多技巧,特别是在罕见事件的捕捉方面。首先,发现一个特殊的柱状图、一个无法解释的测量结果,或者一个统计上的罕见曲线之后,你应该立即停止正在进行的工作,并相信它是真实的。不要再次按下示波器的“运行/停止”按钮,希望消除这个现象。相反,你应该立即将波形保存到硬盘。这有可能是一个罕见事件。其次,在这个例子中,不考虑抖动特征中的非确定性现象可能是不对的。BER突发不是某种容易通过一次重复测试来表征的现象。第三,有些方法会忽略罕见事件,如欠采样、等时波形捕捉、完全只注意RjDj的数值大小而忽视其在时间上的收敛性等,这些方法都会掩盖潜在的罕见事件。

本例中的BER突发是在比较净化的环境中发现的。在实时应用中,很少会有净化的环境。实际系统的电路板上有许多不确定的抖动和虚假电子信号。ASA公司发现,许多工程人员使用堆叠式装置而希望产生或测量皮秒级的定时,这是不切实际的。

某些部件对于虚假外部激励的影响具有较好的耐受性。可惜很少有部件设计人员(甚或使用这些零部件的系统设计人员)花时间来了解外部虚假激励的敏感性,这可能会给系统设计人员带来后续的问题。

回头再看,几乎所有工具都可能遇到这些错误,任何方法也都可能发生这些错误。重要的是,在本例中,M1的几项功能帮助我们更加迅速地掌握到了罕见事件的实质。首先,我们采用了一种非统计的方法。M1的RjDj提取法建立在逐周期数据分析的基础之上,它使非确定性BER的效果得以迅速地呈现出来。其次,我们使用M1的抖动频域视图来将取样转化到频域,以了解问题采样中是否有任何频率分量导致误码发生。本例中虽然没有出现这种情况,但在其他情况下,这是另一项特别有用的调试工具。再次,M1的“记录到磁盘”功能以及全新的“自动加载”特性也对分析极其有用。新的RjDj文本保存特性也是如此。最后,在本例的调试过程中,通过绘出各个周期的RjDj曲线和观察RjDj的收敛/发散情况来查看RjDj值的跳变情况也非常重要。相对任何欠取样方法而言,实时、逐周期的取样并不是一个微不足道的优点。基于这一分析,我们强烈推荐你采用M1,这不仅是为了表征串行数据设计方案,同时也是了解和调试它的需要。

作者:Greg Walz


产品市场经理


Amherst Systems Associates


Email: greg_walz@amherst-systems.com



评论


技术专区

关闭