每页:
搜索

COMSOL 最新动态 博客文章

批处理扫描中任务并行的附加值

2014年 3月 20日

到目前为止,我们在混合建模系列博客中还没有详细讨论的一件事是,当向我们的计算中增加更多计算资源时,我们可以期待怎样程度的加速。今天,我们考虑一些解释并行计算局限性的理论研究,并将介绍如何使用 COMSOL 软件的批处理扫描 选项。这是一个内置的、易并行计算功能,可在达到极限时提高性能。 Amdahl 定律和 Gustafson-Barsis 定律 我们之前已经提到过的如何通过增加计算单元来提高速度是基于算法的(在这篇文章中我们将使用术语 进程,但添加的计算单元也可以是 线程 )。一个严格的串行算法,像计算Fibonacci 数列的元素,完全不能从增加过程中受益,而并行算法,如向量加法,可以利用与向量中的元素一样多的处理器。实际中的大多数算法都介于这两者之间。 为了分析一个算法可能的最大加速,我们将假设它由一小部分完全并行化的代码和一小部分严格串行化的代码组成。我们调用并行代码 \varphi 的分数,其中,\varphi 是介于(包括) 0 和 1 之间的一个数字。这自动意味着我们的算法有一个等于 (1-\varphi) 的串行代码片段。 考虑 P 个活动进程的计算时间 T(P),从 P=1 开始,我们可以使用表达式 T(1) = T(1) \cdot(\varphi + (1-\varphi))。当运行 P 个进程时,代码的串行部分不受影响,但完全并行化的代码的计算速度将提高P倍。因此,P进程的计算时间为 T(P)=T(1) \cdot (\varphi / P + (1 -\varphi)),加速度为 S(P):=T(1)/T(P)=1/(\varphi/P+(1-\varphi))。 Amdahl 定律 这个表达式是Amdahl 定律的核心。对于不同的值 \varphi 和 P 绘制图 S(P) ,我们现在在下图中看到一些有趣的东西。 为可并行化代码的不同部分增加进程数的加速比。 对于 100% 并行化代码,极限是不存在的。然而,我们发现对于 \varphi<1,渐近极限或理论最大加速比为 S{max}(\varphi):=\lim{P\to \infty} S(P)=1/(1-\varphi)。 对于 95% 并行化的代码,我们发现 S{max}(0.95)=20,即使我们有无限数量的进程,最大加速也是 20 倍。此外,我们有 S{max}(0.9)=10, S{max}(0.75)=4, 和 S{max}(0.5)=2。当减少并行化代码的比例时,理论最大加速比会迅速下降。 但不要现在就放弃回家! Gustafson-Barsis 定律 Amdahl 定律没有考虑到一件事,那就是当我们购买一台速度更快、内存更大的计算机来运行更多进程时,通常不是想更快地计算之前的小模型。相反,我们想要计算新的、更大(更酷)的模型。这就是Gustafson-Barsis 定律的全部内容。它基于这样一个假设,即我们要计算的问题的规模随着可用进程的数量线性增加。 Amdahl 定律假定问题的大小是固定的。当添加新的处理器时,它们处理的是最初由较少数量的进程处理的部分问题。通过添加越来越多的进程,我们并没有充分利用所添加进程的全部能力,因为最终它们能够处理的问题大小达到了下限。然而,假设问题的大小随着添加的进程数量的增加而增加,那么我们就将所有进程利用到假设的水平,并且执行计算的加速是无限的。 描述这种现象的方程是 S(P)=\phi\cdot P-(1-\phi),这为我们提供了一个更为乐观的结果,即所谓的 缩放加速(类似于生产力),如下图所示: 当考虑到工作的规模通常会随着可用进程的数量而增加时,我们的预测就更加乐观了。 通信成本 Gustafson-Barsis 定律意味着,我们拥有的能添加到进程中的资源才能限制我们可以计算的问题的大小。然而,还有其他因素会影响加速。到目前为止,我们在这个系列博客中试图强调的一点是,通信成本较高。但是我们还没有谈到它有多贵,所以让我们看一些例子。 […]

分布式内存计算入门:定义、目的及原理

2014年 2月 20日

在“混合建模”系列的上一篇文章中,我们讨论了有关共享内存计算的基础知识:什么是共享内存、为什么使用共享内存,以及 COMSOL 软件如何在计算中利用共享内存。今天,我们将讨论混合并行计算的另一个组成分支:分布式内存计算。

共享内存计算入门:定义、目的及原理

2014年 2月 6日

几周前,我们发布了“混合建模”系列的第一篇博客文章,介绍了混合并行计算的含义,以及它是如何提高 COMSOL Multiphysics 运算效率的。今天,我们将简要探讨混合并行计算的一个组成部分——共享内存计算。不过在此之前,我们首先会解释“应用程序并行运行”的意义。此外,我们还将讨论何时以及如何在 COMSOL 软件中使用共享内存。

利用混合并行计算技术加速物理场仿真

2014年 1月 23日

二十年前,配备了多达 1000 个处理单元的向量处理器超级计算机在超级计算机 500 强中占据了统治地位。随着时间推移,大规模并行计算集群不仅迅速取代了向量超级计算机成为了榜单中的新霸主,同时还促使了分布式计算的兴起。集群的每个计算节点上最初只有一个专用于高性能计算的单核处理器,很快,人们针对需要共享内存的节点,增加节点上的处理器数量,并以这种具备内存共享能力的并行计算机为基础,开发出了多核处理器,满足了各类计算应用对高效算法的需求。再看今天的超级计算机 500 强排名,我们会发现当中大多数集群均由数量众多的计算节点组成,每个节点又包含多个插槽(socket),每个插槽连接着最多可达八核的多核处理器。并行计算是一种适用于共享内存计算系统的技术,与基于分布式内存的集群采用的并行计算技术全然不同。为了实现高效率的并行计算,我们需要一种两者并用(混合)的机制。

石墨烯革命:第五部分

2013年 5月 8日

在一篇名为”选择石墨烯基晶体管的栅介质“的论文中,讨论了半导体形式石墨烯的应用。正如我们之前所了解的,单层石墨烯并非一种半导体,它是一种零带隙导体(半金属)。人们正尝试向石墨烯中引入带隙,这将使它变得半导电,室温迁移率将比硅高一个数量级。人们现在正积极思考在攻克剩余技术难题之后,如何应用这类材料。半导体石墨烯的应用之一是设计下一代快速切换金属氧化物半导体场效应晶体管(MOSFET)。

石墨烯革命:第四部分

2013年 5月 2日

石墨烯可以在高真空下利用热分解制造。为了设计和优化这些高真空系统,工程师可能转向仿真寻求帮助,不过目前还没有多少仿真工具能胜任这一工作。让我们来看一下真空系统如何与石墨烯的生产相关,为什么要模拟它们,以及如何模拟。

石墨烯革命:第二部分

2013年 3月 27日

我在之前的一篇博客中曾经介绍过石墨烯的一些奇异特性。石墨烯仅包含单层原子,这意味着任何石墨烯基结构都将有极高的纵横比;而高纵横比的几何也为模拟带来了各种挑战。 石墨烯的传热模拟 COMSOL 提供了多种工具来帮助模拟具有极高纵横比的几何及特征。最近,人们利用 COMSOL 对石墨烯“被子”进行了传热模拟,《Nature Communications》杂志的”用于高功率 GaN 晶体管热管理的石墨烯被子“一文介绍了该研究。论文作者使用 COMSOL Multiphysics 证实,可通过引入由薄层石墨烯 (FLG) 制作的额外散热通道,即顶面导热片,来显著提升 AlGaN/GaN 异质结场效应晶体管 (HFET) 的局部热管理。 COMSOL Multiphysics 的传热接口支持您使用薄层特征特征模拟极高纵横比的组件。这一特征仅求解表面切面处的传热方程,因此免去了在高纵横比层中使用极端细化网络的需求。使用此方法能够极大减少计算时间和内存使用。 薄层特征设定窗口。 石墨烯的电气模拟 从 2006 年开始,人们就已经使用 COMSOL 来研究石墨烯的电气特征。在这篇论文中,研究人员使用 COMSOL 来推导石墨烯基复合材料的面内和横向电导率。我们可以很轻松地在 COMSOL Multiphysics 中输入电导率的张量物理量。您仅需提供电导率张量元,它可以是温度或其他任何量的函数。 可以轻松在电流接口电流守恒特征的设定窗口中指定各向异性电导率。 石墨烯的结构力学模拟 COMSOL 也可以模拟石墨烯的结构力学应用。在这篇论文中,研究人员计算了石墨烯膜在压力差作用下产生的挠度和应变。可通过电气检测到带结构中的变化,这说明它可用于制造超灵敏压力传感器。结构力学模块的壳接口主要用于薄壁结构中的结构力学分析,因此非常适合此类应用。壳接口使用 Mindlin-Reissner 类公式,即考虑了横向剪切形变。这意味着我们无须对极薄结构进行网格剖分,就可以获得高精度的结果。 壳接口中材料模型的设定窗口。 相关示例模型 我们现在已经分析了热学、电气以及力学的模拟概念,您可能在想有什么模型能同时用到所有这些概念。确实有一个,您可以查看案例库中电路板加热模型,如下所示。 电路板加热模型演示了热学、电气以及力学模拟概念。 这一多物理场示例模拟了加热电路器件时电热的产生、传热,以及机械应力和变形。模型用到了传热模块的固体传热接口,AC/DC 模块的电流,壳接口,以及结构力学模块的固体力学和壳接口。


33–39 of 39
下一页
最后一页
浏览 COMSOL 博客