轮轨系统动力学分析的并行计算研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
随着科学研究与工程技术的不断发展,出现了许多大型复杂结构的力学分析问题。基于有限元方法的轮轨系统动力学理论就是一种较为复杂的数值计算问题,其复杂性主要表现在自由度多、并且伴随列车的运行不断地基于时间步长进行数值积分求解。特别是随着轮轨系统动力学在道岔动力学中的应用,处理的问题更加复杂,计算时间长的问题,已成为实际应用中的一大障碍。提高其计算速度的一个有效方法就是采用并行计算技术。
     本论文对轮轨系统动力学的原有串行程序结构进行了剖析,以寻求并行处理的可行方法。首先从有限元模型建立着手,提出了按轨枕序号编排自由度,可将系数矩阵中非零元素按近似带状排列,使振动方程组的求解易于并行。随后在公式级对轮轨系统动力学振动方程组的组建进行了优化,将组建刚度矩阵、阻尼矩阵和荷载列阵模块化。
     通过对串行程序中各功能模块计算工作量的分析,线性方程组的求解在该串行程序中占有75%的工作量,并行求解线性方程组是本论文的一项主要工作。针对轮轨系统振动方程组系数矩阵的特点,分析了现有各种求解线性方程组并行算法的优缺点,选择高斯消去法、LU分解、LDR分解和WZ分解法作比较,采用循环带状划分的方法将系数矩阵的各行分配到各进程,由各个处理器完成所分配矩阵行的消元和分解。同时将振动方程组的组建交给不同的处理器来完成。最后将并行程序与串行程序的计算结果相比较,验证了该并行程序的正确性。
     采用循环带状划分、计算与通信重叠、根据曙光2000机结点计算能力分配任务量、合并通信等技术有效地提高了并行算法效率。分析对比了各种并行算法的复杂性,大量的数值试验表明LU分解法具有较高的加速比,WZ分解法具有较高的计算速度。
     本文工作为本人今后从事更为复杂的轮轨系统动力学分析的并行化研究打下了一定的基础,论文最后为进一步深化研究指出了发展方向。
Many mechanics analysis computational problems of large-scale complicated structures arise with the development of science research and engineering technology.
    The dynamics theory of wheel/rail system based on the finite element principle is a complicated numerical solution. In the complex system, the number of freedom degree is very large and many numerical computations are needed with the running of the train. While the theory of wheel/rail system dynamics is applied in the points(switch) dynamics, the system is more complicated and computation time is longer, therefore the parallel computing technology is an effective method to increase computation speed.
    In this dissertation, the series program structure of wheel/rail system dynamics is analyzed to search the solutions to parallel processing. First, the serial number of freedom degree is arranged according to the sleeper number in the finite element model. So the nonzero elements in the coefficient matrix can be arranged according to approximate belt-style in order that the method is favorable to parallel computation. Then the vibration equations in the wheel/rail system dynamics are constituted again and the rigidity matrix, the damping matrix and the load matrix can be formed by different computer processor for the sake of increasing parallel computation efficiency.
    The analysis of computation time of different subroutines shows that the solution of linear equations account for 75 percent of total workload and it is also the main work in the study. The characteristics of different parallel algorithms are compared in accordance with the specialty of coefficient matrix of vibration equations of wheel/rail system. Then, four parallel algorithms are used to solve the linear equations, such as Gaussian elimination, LU decomposition, LDR decomposition and WZ decomposition. With the method of cyclic distribution, all rows of the coefficient matrix is allotted into different processes, then eliminated and decomposed by relevant processors. The computation result is identical to that of series program, and the correctness of the parallel program is verified.
    Some methods are used to increase the parallel computation efficiency, such as the data cyclic distribution, overlapping of communication and computation, load-balancing in accordance with the computation ability of the Dawn-2000 node, communication mergence and so on. Compared with the complexity of different algorithms, the numerical test shows that the LU decomposition has the largest speedup and WZ decomposition has the fastest computation speed.
    This dissertation lays a foundation for the study of more complicated wheel/rail system dynamics and its development direction is proposed in the thesis.
引文
[1]罗省贤,何大可编著.基于MPI的网络并行计算环境及应用.成都:西南交通大学出版社,2001.12
    [2]福斯特(Foster,I.)编著.并行程序设计.北京:人民邮电出版社,2002.9
    [3]都志辉编著.高性能计算并行编程技术.北京:清华大学出版社,2001.8
    [4]莫则尧,袁国兴编著.消息传递并行编程环境.北京:科学出版社,2001.11
    [5]Barry Wilkinson,Michael Allen著.陆鑫达等译.并行程序设计.北京:机械工业出版社,2002.1
    [6]刘学毅,王平,万复光.轮轨空间耦合振动分析模型及其应用.铁道学报.1998(3):102-108
    [7]翟婉明.车辆-轨道耦合动力学.北京:中国铁道出版社.2002
    [8]王平.道岔区轮轨系统动力学的研究.西南交通大学博士学位论文,成都.1997
    [9]李小珍.高速铁路列车-桥梁系统耦合振动理论及应用研究.西南交通大学博士学位论文,成都.2000
    [10]李晓梅,窦勇.并行计算模型及其算法设计.数值计算与计算机应用.1995.9;(3):224-232
    [11]胡凯,胡建平,王强.分布式并行计算网络体系结构研究.小型微型计算机系统.2002(2):113-115
    [12]许宏,蔡瑞英.PC集群技术与并行计算.南京化工大学学报.2001(5):100-104
    [13]饶文碧,张莉,李卓球,吴代华.网络分布式环境下的并行计算方法.武汉工业大学学报.2002(1):54-56
    [14]陈昌生,李志良,谭福平.基于高性能微机群集的并行计算环境的设计与实现.上海大学学报(自然科学版).2000(2):137-140
    [15]秦忠国,姜弘道.一种新的并行计算环境:PVM on Win32.计算机工程.1998(12):17-19
    [16]任晓明,杨大鉴,刘国权.网络并行计算系统模型.计算机工程与应用.2001(15):118-120
    [17]庄昌文,林晓东,刘心松.实现并行计算的群集系统.计算机应用.1998(6):11-13
    [18]胡亮,胡明,鞠九滨.工作站群的并行计算性能.吉林大学自然科学学报.1997(2):41-44
    [19]李仁发,李方敏.网络并行计算软件环境的分析与比较.计算机工程与应用,2001.22:73-74
    [20]莫则尧,李晓梅.工作站网络环境下的并行计算.计算机学报,1997.6;20(6):511-517
    
    
    [21]曙光信息产业有限公司.曙光2000用户手册.技术白皮书.1999年
    [22]程建刚,李明瑞,黄文彬.有限元分析的并行计算方法.力学与实践,1995;17(4):6-12
    [23]邹经湘,黄文虎,黄志东,李强.结构动力分析的并行计算.力学与实践,1994;16(5):1-7 .
    [24]周树荃,邓绍忠.有限元结构分析并行计算的若干研究进展.南京航空航天大学学报,1995.2;27(1):27-32
    [25]Saxena M, Perucchio R. Parallel FEM algorithms based on recursive spatial decomposition-Ⅰ:Automatic Mesh Generation. Comput. Struct, 1992, 45(5/6):817-831
    [26]饶文碧,程洪斌,吴代华,李卓球.基于网络并行计算的结构损伤动力有限元分析.武汉理工大学学报,2000.10;22(5):108-110
    [27]杨庚,王绍棣,沈金龙.基于曙光并行机的超大规模非线性方程组并行算法研究.计算机学报,2002.4;25(4):397-402
    [28]王建波.“曙光1000”三对角方程组的并行求解.西南交通大学研究生学位论文.1998
    [29]王思群,魏紫銮.CHOLESKY分解求解大型稀疏线性方程组的并行算法。数值计算与计算机应用,1996.6;(2):104-111
    [30]韩莉,车晓松,胡义.一类稀疏线性方程组的并行求解方法.吉林化工学院学报.1996(4):46-50
    [31]舒继武,赵金熙,张德富.解大型稀疏线性方程组的一种有效并行ICCG法.计算机工程与应用,1999.7;30-31
    [32]刘青昆,舒继武,张德富.Krylov子空间方法解线性方程组的并行性能分析及应用.计算机工程与应用,1999.6;33-36
    [33]迟学斌.应用嵌套排序的并行CHOLESKY分解算法.数值计算与计算机应用.1995(4):241-246
    [34]裴伟东.求解稠密线性方程组的并行算法.天津师范大学计算机系.1998.9;18(3):20-25
    [35]李晓梅,迟利华.并行求解大型稀疏线性方程组的研究概况.指挥技术学院学报.1999.6;10(3):1-8
    [36]同济大学计算数学教研室编.数值分析基础.上海:同济大学出版社,1998.12
    [37]H. H. Wang. A parallel method for tridiagonal equations. ACM Trans. On Math. Soft.,1981(2):170-183
    [38]H. Stone, An efficient parallel algorithm for the solution of a tridiagonal lineal system of equations, J. ACM 1973(20):27-38
    [39]Saad Y. GMRES:A generalized minimal resdual algorithm for solving nonsymmetric linear systems. SIAM J. Sci. Statist. Comput, 1986
    
    
    [40]Lanczos C. Solution of systems of linear equations by minimized iterations. J. of research of the national bureau of standards, 1952
    [41]Sonneveld p. CGS:A fast lanczos-type solver for nonsymmetric linear systems. SIAM journal on scientific and statistical computing, 1989
    [42]Mannelback p. Solving irregular sparse linear systems on a multicomputer using the CGNR method, the intermational journal of supercomputer applications and high performance computing, 1997
    [43]刘兴平,莫则尧,雷光耀,张宝琳,张景琳等.高效并行算法的设计与实现.高技术通讯,1998;15-18
    [44]孙安香,宋君强,伍湘君.并行计算的数据分配.计算机工程与科学,1997.5;19(5):59-62
    [45]刘芳,翁惠玉,杨传厚.局域网上并行计算中的通信问题.计算机工程与应用,1999.8;87-89
    [46]孙安香,张理论,宋君强.并行计算的数据重分配.国防科技大学学报,2002;24(4):33-36
    [47]戴光明,孟永良.网络并行计算中动态负载平衡的实现.计算机工程与应用.1998(10):19-20
    [48]肖侬,卢宇彤,卢锡城.一个基于网络并行计算环境的动态负载分配算法.计算机研究与发展.1999.2,36(2):238-241
    [49]肖侬,黄金锋,卢宇彤.网络并行计算的动态负载平衡策略.计算机工程与科学,1998.8;20(3):13-17
    [50]赵玉林.H.26L视频编码器并行性算法研究与实现.西南交通大学研究生学位论文.2003.3
    [51]Eager D L, Lazowska E D, Zahorjan J. Adaptive load sharing in homogeneous distributed systems. IEEE Trans on Software Engineering, 1986, SE-12(5):662-675
    [52]乔香珍.并行计算时间模型和并行机系统性能.计算机学报,1998.5;21(5):413-418
    [53]党华锐.关于并行计算机加速比公式的辨析.西北大学学报,1996.12;26(6):481-490
    [54]陆军,王正华,李晓梅.并行计算中性能评估方法的研究.计算机工程,1998.12;24(12):20-22
    [55]戴光明,陶加祥.并行计算中的时间获取.计算机与现代化,1999;60(2):7-10
    [56]Sun X. and Ni L. Scalable problems and memory-bounded speedup. Journal of Parallel and Distributed Computing, 1993,19:27-37
    [57]刘杰,迟利华,胡庆丰.优化并行计算的性能评价.计算机工程与设计.2000.12;21(6):4-7
    
    
    [58]迟学斌.分布式系统矩阵并行计算.数值计算与计算机应用.1997.2;(4):271-275