资讯详情

史上最全电磁仿真(HFSS、CST、FEKO)时域、频域精准配置推荐

1.电磁广泛应用于无线和有线通信、计算机、卫星、雷达、半导体、微波集成电路、航空航天等领域,从毫米波电路、射频电路封装设计验证到混合集成电路PCB板、无源板级设备、RFIC/MMIC设计、天线设计、微波腔、衰减器、微波转接头、波导录波器等。

0129d3b2c17c3cc776c0872922fa7f0c.png?

1.计算电磁学的电磁仿真算法分类(CEM)该方法大致可分为精确算法和高频近似方法两类。

(1)全波精确计算法

包括差分法(FDTD,FDFD)、有限元(FEM)、矩量法(MoM)以及基于矩量法的快速算法(如快速多极子)FMM多层快速多极子MLFMA)其中,解决大目标电磁问题最有效的方法是多层快速多极子。

(2)高频近似法

一般可分为两类:基于射线光学的一类,包括几何光学(GO)、几何绕射理论(GTD)以及在GTD 一致性绕射理论是在基础上发展起来的(UTD)等等;另一种基于波前光学的物理光学(PO)、物理绕射理论(PTD)、等效电磁流法(MEC)增量长度绕射系数法(ILDC)等。

?

?

算法计算特征汇总如下NO 关键项 时域算法 频域算法

1 主要算法 时域差异有限

FDTD 时域有限积分

FIT 有限元

FEM 矩量法

MOM

2 典型软件 EMPIRE XPU

XFDTD

EMPro CST HFSS

EMPro

JMAG

FLU FEKO

Momentum

Sonnet

3 计算特点 线性加速比高,高度多线程,

支持多核CPU

支持大型GPU

内存要求不高

回写很少 线性加速有限

支持多核CPU并行求解

内存要求高

回写有

?

总结1.时域算法是一种传统的显式算法CPU多核加速比好,核数越多计算越快。此外,并行性高,支持性高GPU加速计算,注意大多数求解器GPU要求主要是双精度计算,即需要双精度性能高GPU卡。

2.频域算法属于隐式算法,支持多核并行计算,但核数并行计算有限,不支持GPU计算和提高性能的手段是提高性能CPU内存的频率足够大,值得注意的是,当内存非常大(超过192GB),硬盘io性能非常关键。

?

1.分析如何配置并行计算求解过程CPU根据求解过程和算法特点,特别是时域和频域的紧密结合,使循环计算过程更高效、更合理。

?

从上图可以看出,CPU选型很重要,CPU瑞频足够高,大大缩短了阶段1的求解时间,整机有足够的核数 阶段2求解器的解决时间大大缩短

常规工作站卖家提供的机器往往忽略了瑞频的重要性,整个计算过程效率很低。

因此 硬件配置注:

1.如果主要是时域算法,例如 FDTD、FIT求解器由于并行性高,工作站配置尽可能多核,可以显著提高求解速度。同时,注意阶段1瑞频率高的处理器,如果是GPU以计算为主,可配置CPU频率高,核数少,整个过程明显改善。

2.如果主要是隐式算法,例如 FEM,MOM由于并行度有限,求解器必须尽可能高,并确保足够的核数并行,使整个求解过程无死角瓶颈。

三、若并用多种算法,CPU三种应用程序(时域算法、频域算法、混合算法)都可以确保工作站硬件计算性能的最大化。

考虑到上述计算特点,CPU选择对整个求解过程极其重要。以下是最新上市intel Xeon Schalable(可扩展)各种规格的处理器,UltraLAB选型分析:

??

1.3 CEM建议解决规模和硬件配置a)参考时域算法硬件配置(CPU类)NO 分类 规模划分 核数 全核频率 睿频 内存 并行存储

1 小规模 <50倍波长 14核 4.6GHz 4.6GHz 32GB

18核 4.5GHz 4.5GHz 64GB

2 中等规模 50~100倍波长 36核 3.1GHz 3.7GHz 64GB

40核 3.1GHz 3.7GHz 96GB

3 大规模 100~200倍波长 48核 3.5GHz 3.7GHz 96GB ?

56核 3.3GHz 3.8GHz 192GB 13*4TB

4 超大规模 >200倍波长 96核 2.8GHz 3.3GHz 512GB 13*4TB

b)参考基于频域算法的硬件配置

c)基于超大规模时域算法的求解GPU选型?

如果以GPU求解为主,可选GPU卡参考下表No 型号 显存(MB) CUDA核 显存带宽(GBs) 浮点计算指标TFlops -单精度 浮点计算指标TFlops -双精度 散热

1 Tesla V100 16GB HBM2 5120 900 14.90 7.45 服务器

2 Tesla P100 16GB HBM2 3584 721 9.52 4.76 服务器

3 Tesla P100 12GB HBM2 3584 721 9.52 4.73 服务器

4 Quadro GV100 32GB 5120 870 14.85 7.42 主动式

5 Quadro GP100 16GB HBM2 3584 717 10.25 5.13 主动式

6 Quadro K6000 12GB 2880 288 5.18 1.73 主动式

7 Quadro K5200 8GB 2304 192 3.07 1.03 主动式

?

2.介绍基于电磁仿真计算的型号 ? ? 以ultralab例2.1极速图形工作站H490

?

配置特点:(1)CPU高频适用于中小规模时域和频域解决?6核5.0GHz,8~10核4.8GHz,12~14核4.6GHz,16~18核4.4GHz(2)GPU支持双GPU超算架构的显著优势:与市场单路cpu架构工作站(单)Xeon E5v4,单Xeon W-2100系列,单Xeon Schalable与系列相比,具有超高频率,多核并行计算(尤其是频域求解)性能突出2.2高性能计算工作站EX620

配置特点:CPU支持双Xeon Schalable(可扩展)处理器具有较高的频率和较低的延迟,适用于中大型时域和频域求解的规格:24核*4GHz/4.2GHz

36核3.7GHz/3.7GHz

40核3.1GHz/3.7GHz

48核*3.5GHz/3.7GHz

56核*3.3GHz/3.8GHzGPU支持双GPU超级结构的显著优势:以及市场上常规的双路cpu工作站(双Xeon E5v4,双Xeon Schalable与系列相比,多核并行计算(时域、频域算法)频率更高,定位准确高效,显式计算(EX620i)、显式隐式计算通吃(EX620)2.3超大规模仿真计算机型Alpha720

配置特点:CPU支持4颗Xeon E7v4处理器(最高至96核)具有更高的频率和更低的延迟,适用于超大规模时域算法求解的规格:72核2.8GHz,96核2.7GHzGPU支持双GPU超算架构优势明显:时域求解(CPU工作站2.4图灵超算工作站GX490M或GX620M

?

GX490M配置特点:

CPU具有高频率,适合中小规模时域与频域求提供规格:10核4.8GHz,12~14核4.6GHz,16~18核4.4GHzGPU支持7块双槽GPU卡GX620M配置特点:CPU支持双Xeon Schalable(可扩展)处理器,频率更高,延迟更低,中大型时域和频域解决,24核44GHz,36核3.7GHz,40核3.1GHz,48核3.5GHz,56核3.3GHzGPU支持9块双槽GPU基于办公环境(静音级)的显著优势GPU超算性能时域求解计算系统兼顾各种模型的性能和差异对比表NO 机型 硬件配置特点 适合应用

1 H490 单CPU 双GPU

(14核4.7GHz,18核4.5GHz) 解决中小规模频域和时域算法

2 EX620i 双CPU(56核) 双CPU 解决大规模时域和频域算法

3 EX620 双CPU(56核) 双GPU 并行存储 大规模全能求解

4 GX490M 单CPU 7个GPU 并行存储 超大规模时域GPU超级

5 GX620M 双CPU(56核) 9个GPU 并行存储(16) 超大规模全能求解,时域GPU求解

6 Alpha720 四CPU(96核) 双GPU 并行存储 超大规模CPU构建时域求解

?

3.电磁仿真计算硬件配置(单机与集群)推荐3.基于多种算法(CPU计算单机工作站硬件配置方案No 产品系列 主要配置 价格 备注

1 UltraLAB H490 14632-S5BA intel第7代至尊处理器(14核4.6GHz+睿频4.6GHz) /32GB DDR4 2666/512GB SSD +2TBSATA企业级/QP600?2GB/23"图显 39,990 CPU全能高效、高性价比

2 UltraLAB H490 14464-S5TCA intel第7代至尊处理器(18核4.4GHz+睿频4.5GHz)/64GB DDR4 2666/500GB SSD+4TB SATA企业级/Quadro K6000?12GB/23"图显 72,000 CPU+GPU全能极致高性价比

3 UltraLAB EX620i 24096-SATCB 2*Xeon Gold6146处理器(24核4.0GHz,睿频4.2GHz) /96GB DDR4 2666/1TB SSD+6TB SATA /QP2000 5GB/23"图显 112,000 频域极致性能

4 UltraLAB EX620i 23196-SATCE 2*Xeon Gold6148处理器(40核3.1GHz+睿频3.7GHz) /96GB DDR4 2666/1TB SSD?+6TB SATA /Quadro K6000?12GB/23"图显 126,000 CPU+GPU时域全能求解

5 UltraLAB EX620 237192-SA28TB 2*Xeon Gold6154处理器(36核3.7GHz+睿频3.7GHz) /192GB DDR4 2666/1TB SSD+28TB并行存储/QP2000 5GB/23"图显 145,000 CPU全能高效

6 UltraLAB EX620 23596-MSATCC 2*Xeon Gold8168处理器(48核3.5GHz?+睿频3.7GHz) /96GB DDR4 2666 /1TB闪电二代+1TB SSD+6TB SATA/QP4000 8GB /23"图显 189,000 时域求解

7 UltraLAB EX620 23596-MSATCC 2*Xeon Gold8168处理器(48核3.5GHz?+睿频3.7GHz) /192GB DDR4 2666 /2TB SSD +28TB并行存储/QP4000 8GB /23"图显 215,000 CPU全能高效

8 UltraLAB EX620 233384-SB28TC 2*Xeon Platinum 8180(56核3.3GHz+睿频3.8GHz) /384GB DDR4/2TB SSD +28TB并行存储/QP4000/23"图显 285,000 CPU全能高效

9 UltraLAB Alpha720 427256-SB42TF 4*Xeon E7 8890v4(96核2.7GHz+睿频3.3GHz)/256GB DDR4/2TB SSD +42TB并行存储/Quadro GP100/32"-2K图显 399,990 超大规模CPU+GPU时域求解

备注:以上价格仅供参考

3.2基于时域求解(GPU计算架构)单机硬件配置方案No 产品系列 主要配置 价格 GPU指标

1 UltraLAB GX490M 14832-S5TB2E intel第7代至尊处理器

(10核4.8GHz+睿频4.8GHz) /32GB DDR4 2666/500GB SSD +4TB SATA企业级

/2*Quadro K6000 12GB/23"图显 87,500 3.46Tflops

2 UltraLAB GX490M 14464-S5TC4E intel第7代至尊处理器

(18核4.5GHz+睿频4.5GHz)

/64GB DDR4 2666/500GB SSD+4TB SATA企业级/4*Quadro K6000 12GB/23"图显 159,990 6.92Tflops

3 UltraLAB GX620M 23196-SATD2F 2*Xeon Gold6148处理器

(40核3.1GHz,睿频3.7GHz) /

96GB DDR4 2666/1TB SSD+6TB SATA /

2*Quadro GP100 16GB HBM2/23"图显 228,000 10.2Tflops

4 UltraLAB GX620M 234192-SB28T8E 2*Xeon Platium8168处理器

(48核3.4GHz+睿频3.7GHz) /

192GB DDR4 2666/

2TB SSD?+28T并行存储

/8*Quadro K6000?12GB/23"图显 365,000 13.8Tflops

5 UltraLAB Alpha720 427256-SB42T2F 4*Xeon E7 8890v4

(96核2.7GHz+睿频3.3GHz?)/

256GB DDR4/2TB SSD +42TB并行存储/

2*Quadro GP100/32"-2K图显 399,990 10.2Tflops

6 UltraLAB GX620M 233192-SB28T4F 2*Xeon Platinum 8180

(56核3.3GHz+睿频3.8GHz) /

192GB DDR4/2TB SSD +28TB并行存储/

4*Quadro GP100/32"-2K图显 499,990 20.4Tflops

7 UltraLAB GX620M 233384-SB36T8F 2*Xeon Platinum 8180

(56核3.3GHz+睿频3.8GHz) /

384GB DDR4/2TB SSD +36TB并行存储/

8*Quadro GP100/32-2K"图显 758,000 40.4Tflops

?备注:以上价格仅供参考

3.3基于分布式集群的硬件配置方案

方案1基于CPU计算的分布式集群方案

NO 货物名称 型号 数量 单价 小计

1 主计算节点 18核4.4Ghz/128GB?DDR4 2666 /NVS310/500GB SSD工作站级/4U机架式/无显示器 1 55000 55000

2 从计算节点 18核4.4Ghz/64GB?DDR4 2666 /NVS310/500GB SSD工作站级/4U机架式/无显示器 5 46500 232500

3 管理/

存储节点 4核4Ghz/32GB DDR4 ECC/集成显卡/256GB SSD+28TB单通道并行存储/4U机架式/23"图显 1 36500 36500

4 网络设备 16口万兆交换机 1 9500 9500

5 机柜 42U服务器机柜(含PDU机柜插座) 1 3500 3500

6 KVM 8口?HDMI KVM切换器 1 2800 2800

7 高速交换机 Mellanox 12口56Gbps交换机 1 39500 39500

8 IB卡 Mellanox IB卡56Gbps,含2米线 7 4500 31500

9

10

11

12

13

累计(人民币) ? ? ? 410800

安装调试费用(累计金额*10%) 41080

合计: ¥451,880备注:以上价格仅供参考

方案2基于CPU+GPU异构超算的分布式集群方案

NO 货物名称 型号 数量 单价 小计

1 主计算节点 18核4.4Ghz/128GB?DDR4 2666 /Quadro K6000/ 500GB SSD工作站级/4U机架式/无显示器 1 75500 75500

2 从计算节点 18核4.4Ghz/64GB?DDR4 2666 /Quadro K6000/ 500GB SSD工作站级/4U机架式/无显示器 5 67000 335000

3 管理/存储节点 4核4Ghz/32GB DDR4 ECC/集成显卡/256GB SSD+28TB单通道并行存储/4U机架式/23"图显 1 36500 36500

4 网络设备 16口万兆交换机 1 9500 9500

5 机柜 42U服务器机柜(含PDU机柜插座) 1 3500 3500

6 KVM 8口?HDMI KVM切换器 1 2800 2800

7 高速交换机 Mellanox 12口56Gbps交换机 1 39500 39500

8 IB卡 Mellanox IB卡56Gbps,含2米线 7 4500 31500

9

10

11

12

13

累计(人民币) ? ? ? 533800

安装调试费用(累计金额*10%) 53380

合计: ¥587,180

备注:以上价格仅供参考

说明:(1)上述报价仅仅是硬件系统,还需要作业调度系统及安装调试、培训、维护费用(2)该集群中,每个计算节点比市场上低频双Xeon架构配置,性能更高,保证循环过程中,每个环节计算性能发挥到极致。

?

专注高性能图形工作站定制

详询:微信/QQ596349281

?

标签: cem4953集成电路

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台