在今年的圆周率日(3月14日),StorageReview团队采取了一种极具极客精神的行动——挑战自我,更新圆周率计算的世界纪录。面对去年设立的100万亿位的圆周率记录,这次尝试无疑充满挑战。经过75天的努力,他们不仅成功打破了记录,还再次证明了自己的实力。
这次是借助一台装备了1.5TB DRAM内存和接近1PB Solidigm QLC SSD存储的双处理器128核心AMD EPYC 9754 Bergamo系统完成的。
从2023年12月14日起至2024年2月27日,团队历经75天,利用1988年提出的Chudnovsky算法计算出圆周率,此次运算共需1.36TiB的内存空间。
在刷新至105万亿位圆周率的记录途中,团队遭遇了一系列新挑战。他们不得不面对与性能相关的多个问题,深入探讨并行计算和硬件之间的相互作用。他们揭示了Zen4架构下一个特有的CPU问题,这涉及到超级对齐以及它对内存访问模式的影响。
在N63乘法算法的AVX512代码执行路径中,工程师们发现了一个关键的浮点算术错误。通过与开发者亚历山大·叶(Alexander Yee)的远程合作,团队成功定位并解决了此问题,最终完成了计算任务。
在总结此次经验时,StorageReview的Jordan Ranous表示:“走向105万亿位圆周率的道路比预期中更为复杂。在事后看来,我们确实应该预见到会遇到新的问题;毕竟,我们在完成一项前所未有的计算。尽管用一种更原始的‘临时拼凑’方式完成了之前的100万亿计算,我们误以为已经足够。最终,只有通过团队的共同努力,我们才能成功完成这次挑战。”
至于这次尝试的价值,Ranous进一步询问:“这一切意味着什么?”对于数学界而言,新增的五万亿位圆周率可能并不会带来重大改变。这一过程中,我们确实能够看到计算工作量与现代化硬件支持之间的紧密联系。本质上,这次尝试显示了合适的硬件设备对于完成任务至关重要,无论是企业级数据中心,还是大规模高性能计算项目。对于圆周率的计算而言,我们最终受到的限制是存储容量。虽然更快的CPU能够加速数学计算,但实现更多新纪录的关键还是设备内的存储容量。