问题描述
COMSOL Multiphysics 6.2 版本中引入了专为优化 COMSOL 而设计的自定义 AOCL 版本(4.1.1 版本的 AMD® 优化 CPU 库 (AOCL))作为 BLAS 和 LAPACK 库的备选项;而 COMSOL Multiphysics 6.1 则包含 AOCL 3.2.1 版本。新版本的 AOCL 可以带来哪些性能改进?
解决方法
为了让配备 AMD Zen 处理器的计算机发挥最佳性能,COMSOL Multiphysics 6.2 版本附带了 AOCL 4.1.1 作为可用的 BLAS 和 LAPACK 库。此前,COMSOL Multiphysics 6.1 版本附带的是 AOCL 3.2.1 版本。我们为什么要做出这样的调整?
在 COMSOL Multiphysics 6.1 和 6.2 版本之间,配备 AMD 处理器的计算机的性能改进源于多个方面,而不仅仅是 AOCL 库的升级。为了清晰地突显从 AOCL 3.2.1 升级到 AOCL 4.1.1 的效果,我们在 COMSOL Multiphysics 6.2 上使用 AOCL 4.1.1 运行了各种模型,并与使用 AOCL 3.2.1 获得的性能进行了比较(除了 AOCL 版本外,其他方面都相同)。需要明确的是,AOCL 3.2.1 并没有随商用 COMSOL Multiphysics 6.2 版本一同发布。测试结果如下所示。
该测试是在运行 Linux 的 AMD Ryzen™ Threadripper™ PRO 7995WX 机器上完成的。下表显示了在批处理模式下求解模型的总运行时间(单位:秒)。请注意,这些模型使用 MUMPS,其预计性能改善最为显著。
案例下载模型名称 | AOCL 3.2.1 | AOCL 4.1.1 |
resonant_spiral_coil_2daxi | 400 | 84 |
piezoelectric_energy_harvester | 301 | 110 |
lumped_loudspeaker_driver_mechanical | 141 | 32 |
ring_impact | 127 | 72 |
insb_pfet_density gradient | 132 | 88 |
bipolar_transistor | 131 | 90 |
oxide_jacking | 106 | 90 |
这些结果表明,采用 AOCL 4.1.1 带来了显著的性能提升。
如需了解如何使用 AOCL,请参阅此页面。
AMD Ryzen Threadripper 是 Advanced Micro Devices, Inc. 的商标。
COMSOL 尽一切合理的努力验证您在此页面上查看的信息。本页面提供的资源和文档仅供参考,COMSOL 对其有效性不作任何明示或暗示的声明。COMSOL 对所披露数据的准确性不承担任何法律责任。本文档中引用的任何商标均为其各自所有者的财产。有关完整的商标详细信息,请参阅产品手册。