phasicFlow计算性能测试
摘要
分别使用知名离散元商业软件(如EDEM, Rocky等)和开源离散元软件phasicFlow(https://github.com/PhasicFlow/phasicFlow)对rotatingDrum案例进行了计算,测试了颗粒数量分别为250 k, 500 k, 1 m, 2 m, 4 m和8 m时计算耗时和内存使用情况。 phasicFlow的计算速度比知名离散元商业软件计算速度快20%左右。(由于没有linux的知名离散元商业软件安装包,性能测试未能考虑操作系统的差异性。)
分别在笔记本电脑和工作站电脑上进行了性能测试,笔记本电脑和工作站电脑配置信息如表1所示。
computer |
CPU |
GPU |
Operating system |
|---|---|---|---|
Laptop |
Intel i9-13900HX 2.2 GHz |
NVIDIA Geforce RTX 4050Ti 6G |
Windows 11 24H2 |
workstation |
Intel xeon 4210 2.2 GHz |
NVIDIA RTX A4000 16G |
Ubuntu 22.04 |
一共进行了6组工况测试,颗粒数量依次为250 k, 500 k, 1 m, 2 m, 4 m和8 m,每种工况下颗粒直径、转鼓长度和转鼓直径如表2所示。
Case name |
Particle diameter |
Particle numbers |
Rotating drum length |
Rotating drum radius |
|---|---|---|---|---|
250 k |
6 mm |
250,000 |
0.8 m |
0.2 m |
500 k |
5 mm |
500,000 |
0.8 m |
0.2 m |
1 m |
4 mm |
1,000,000 |
0.8 m |
0.2 m |
2 m |
3 mm |
2,000,000 |
1.2 m |
0.2 m |
4 m |
3 mm |
4,000,000 |
1.6 m |
0.2 m |
8 m |
2 mm |
8,000,000 |
1.6 m |
0.2 m |
表3和图3所示为phasicFlow和知名离散元商业软件在笔记本电脑上不同工况下的计算时间,由表可知,计算时间的增长与颗粒数量的增长呈现线性比例关系,phasicFlow的计算速度要比知名离散元商业软件计算速度快约20%。使用A4000显卡要比4050Ti计算速度快约30%。
Software |
250 k |
500 k |
1 m |
2 m |
4 m |
8 m |
|---|---|---|---|---|---|---|
phasicFlow-4050Ti |
54 min |
111 min |
216 min |
432 min |
||
commerical DEM-4050Ti |
68 min |
136 min |
275 min |
570 min |
||
phasicFlow-A4000 |
38 min |
73 min |
146 min |
293 min |
589 min |
1188 min |
表4和图4所示为phasicFlow和知名离散元商业软件在笔记本电脑上不同工况下的内存使用情况,由表可知,phasicFlow每百万颗粒使用约0.7 G内存,而知名离散元商业软件每百万颗粒使用约1.5 G内存。
Software |
250 k |
500 k |
1 m |
2 m |
4 m |
8 m |
|---|---|---|---|---|---|---|
phasicFlow-4050Ti |
252 MB |
412 MB |
710 MB |
1292 MB |
||
commerical DEM-4050Ti |
485 MB |
897 MB |
1525 MB |
2724 MB |
||
phasicFlow-A4000 |
344 MB |
480 MB |
802 MB |
1386 MB |
2590 MB |
4966 MB |