新闻中心

EEPW首页 > 设计应用 > 网络并行计算在多层快速多极子法中的应用

网络并行计算在多层快速多极子法中的应用

作者:时间:2014-05-30来源:网络收藏

本文引用地址:http://www.eepw.com.cn/article/259432.htm

1 引言

近几十年来,计算机技术飞速发展,计算速度不断提高,内存容量不断增大;但同时,在科学研究和工程应用中越来越需要对大型舰只、车辆、航空航天器等目标进行电磁散射特性分析。这些目标电尺寸非常巨大,求解问题所含未知量动辄以百万、千万计,现有水平下单台PC机很难应对如此庞大的计算量。鉴于此,越来越多的科研、工程人员希望在改进算法的同时能够拥有高效的并行计算环境。巨型并行计算机存储容量大、运算速度快,但价格昂贵。应运而生,它是近几年国内外计算机科学研究与应用领域中最引人注目的前沿课题之一。以网络为基础,这种并行计算环境的显著优点是投资较少、灵活性强等。

作为数值方法,()具有数值误差可控、计算精度高、通用性强和应用范围宽的优点。它们对软硬件环境要求低,在一般的PC机即可开展复杂目标电磁仿真。目标散射分析能力主要受限于计算机内存大小。

一般情况下,单机处理的未知量数目最大为40万左右。因此,降低并行单机的内存需求,计算更大未知量的问题就成为我们的主要目的。MLFMA的内在并行性包括不变项求解中含有的内在并行性。我们很容易发现平移因子、聚合因子以及配置因子的计算都是独立的,可在多台计算机上异步进行。另外,用MLFMA求解矩阵矢量乘法时也存在内在并行性。

1997年,美国伊利诺依大学W.C. Chew教授与Demaco公司联合推出高效高精度电磁数值分析软件FISC,在伊利诺依大学超级计算机应用中心的SGI Cray Origin 2000型计算机上求解了203万未知量的散射问题,而且成功求解了VFY218模型飞机在8GHz平面波照射下的双站RCS,未知量高达999万。FISC正是基于MLFMA技术的。其后,S.V. Velamparambil、J.M. Song和W.C. Chew还开发了FISC的并行版本ScaleME,并行MLFMA得到了迅猛发展。在这种大趋势下,本文研究了技术在MLFMA中的应用,给出含240万未知量金属球的双站RCS曲线,初步测试、验证了并行求解大未知量问题的可行性与准确性。

2 并行多极子技术

我们依据如下步骤进行设计(可参见表1):

A. 读入数据,并对其分层分组

各计算进程同时读入RWG网格剖分信息,并为目标结构上的RWG单元建立八叉树结构。

建立八叉树结构的过程是:首先,选择能够包含该结构的最小立方体,即第0层盒子;然后,将这个盒子均分成8个子立方体,即第1层盒子;再将第1层盒子均分8部分得到第2层盒子;如此反复,直到最小盒子的边长为0.25λ~0.45λ。在各层盒子中,不包含基函数的盒子将被抛弃。

B. 划分任务

在保留原串行算法中八叉树结构的基础上,在适当层上将整棵树划分为多个子树,并以子树为基本单位划分任务给各个从机。

例如,我们将第1层的8个盒子分配给8个从机分别进行处理,此时我们区分出各个从机所要各自处理的各层非空盒子,并单独编号,完成其与全局各层非空盒子之间的相互索引。

C. 近场矩阵填充及远场不变项处理

初始化各从机处理的近场矩阵,给出各从机近场矩阵的大小及非零元素位置的索引。

用MLFMA生成的近场矩阵一般都是稀疏化的,如果直接存储会造成内存的浪费,所以要把稀疏化矩阵压缩存储。稀疏化矩阵压缩存储一般有两种方法:行压缩存储和列压缩存储.,我们采用行压缩存储。

远场不变项的处理主要涉及当前层的转移因子,父子层之间的平移因子。由于它们占用内存相对较小,我们可以预先计算这些远场不变项,需要时即可直接调用。

表1 并行MLFMA的主机及从机流程比较

主计算机

从计算机

开始

开始

各进程同时读入RWG信息,并为目标结构上的RWG单元建立八叉树结构

各进程同时读入RWG信息,并为目标结构上的RWG单元建立八叉树结构

在保留原串行算法中八叉树结构的基础上,在适当层上将整棵树划分为多个子树,并以子树为基本单位划分任务给各个进程

区分出各个进程所要各自处理的各层非空盒子,并单独编号,完成及其与全局各层非空盒子之间的标号相互索引

管理协调各进程之间的数据交换

生成各进程的压缩格式近场矩阵,以及远场的平移项、转移项、汇聚项等

进入迭代求解,协调各进程之间的数据交换

计算属于各自进程的矩阵矢量乘部分

接收从机结果,输出

将结果发送给主机

结束

结束

D. 矩阵矢量乘的处理

首先,各从机计算本地存储的近场矩阵与电流未知量的乘积,再发送至主机汇总进行处理比较,然后进行其他运算。


上一页 1 2 下一页

评论


技术专区

关闭