|
y-cruncher——一种多线程Pi-Program |
|
从一个高中项目来看。。。
作者:Alexander J.Yee |
(上次更新时间:2024年8月7日)
第一个用于多核系统的可扩展多线程Pi-benchmark。。。
你的计算机计算Pi的速度有多快?
y-cruncher是一个可以计算Pi和其他数万亿位数的常数的程序。
它是第一个多线程并可扩展到多核系统的同类产品。自2009年推出以来,它已成为超频器和硬件爱好者常用的基准测试和压力测试应用程序。
y-cruncher已被用来创造数项Pi数字最多的世界纪录。
当前版本:
窗户:版本0.8.5建造9543(发布日期:2024年7月21日)
Linux操作系统:版本0.8.5建造9543(发布日期:2024年7月21日)
官方Mersenneforum分论坛.
官方HWBOT论坛线程.
新闻:
Zen5的AVX512拆卸:(2024年8月7日)-永久链接
AMD的Zen5已经正式推出。这意味着另一个AVX512的架构拆卸!
Zen5优化:(2024年7月20日)-永久链接
AMD即将推出的Zen5处理器已针对y-cruncher v0.8.5进行了优化。最新版本(9542)将是一个新的二进制文件“24-ZN5~Komari”。
此时,我只能说以下几点:
- 对于单线程计算,“24-ZN5”比“22-ZN4”的加速比多线程计算更大。
- BBP程序没有更改。“22-ZN4”和“24-ZN5”具有相同的BBP代码。
- 除了一个小的错误修复之外,所有现有二进制文件都没有更改。因此,使用它们完成的现有基准不会因此次更新而失效。
因此,如果您是将使用y-cruncher进行Zen5审查的硬件审查员,您将希望包括单线程和BBP基准测试。此外,我只希望在Granite Ridge桌面CPU上实现加速。我不认为Strix Point笔记本电脑CPU会因为AVX512的关闭而出现任何加速。
旧新闻
y-cruncher设置的记录:
y-cruncher已经被用于设置许多世界纪录大小的计算。
蓝色:当前世界纪录
绿色:前世界纪录
红色:未经验证的计算。只有使用替代配方进行验证,才有资格成为世界纪录。
发布日期 |
完成日期: |
资料来源: |
谁: |
常量: |
十进制数字: |
时间: |
计算机: |
2024年6月28日 |
2024年5月20日 |
来源 |
乔丹·拉努斯
凯文·奥布莱恩
布莱恩·比勒
(StorageReview) |
圆周率 |
202,112,290,000,000 |
计算:104天
验证:4天
验证文件 |
2 x Intel Xeon白金8592+ 1.0 TB 1.6 PB存储 |
2024年5月12日 |
2024年5月11日 |
|
德米特里·格里戈列夫 |
泽塔(5) |
260,000,000,000 |
计算:5.11天
验证:6.93天 |
英特尔至强W7-3465X 1 TB |
2024年3月14日 |
2024年2月27日 |
来源 |
乔丹·拉努斯
凯文·奥布莱恩
布莱恩·比勒
(StorageReview) |
圆周率 |
105,000,000,000,000 |
计算:75天
验证:4天
验证文件 |
2 x AMD Epyc 9754 1.5 TB 960 TB存储 |
2024年2月13日 |
2024年2月12日 |
|
乔丹·拉努斯 |
日志(2) |
3,000,000,000,000 |
计算:42.7小时
验证:58.3小时 |
2 x Intel Xeon铂金8460H 512 GB |
2024年1月17日 |
2023年12月12日 |
|
乔丹·拉努斯 |
伽马(1/4) |
1,000,000,000,000 |
计算:22.6小时
验证:22.8小时 |
2 x Intel Xeon铂金8450H 512 GB |
2023年12月26日 |
2023年12月24日 |
|
乔丹·拉努斯 |
e(电子) |
35,000,000,000,000 |
计算:94.5小时
验证:92.5小时 |
2 x Intel Xeon铂金8460H 512 GB |
2023年12月26日 |
2023年12月25日 |
|
乔丹·拉努斯 |
2的平方根 |
20,000,000,000,000 |
计算:29.2小时
验证:21.6小时 |
Intel Xeon铂金8450H 512 GB Intel Xeon铂金8460H 512 GB |
2023年12月26日 |
2023年12月22日 |
|
安德鲁·孙 |
泽塔(3)-阿佩里常数 |
2,020,569,031,595 |
计算:5.61天
验证:5.93天 |
Intel Xeon白金8347C 505 GB 英特尔至强白金8347C 507 GB |
2023年12月18日 |
2023年12月15日 |
|
乔丹·拉努斯 |
伽马(1/3) |
1,000,000,000,000 |
计算:17.5小时
验证:23.3小时 |
2 x Intel Xeon铂金8450H
512 GB |
2023年12月2日 |
2023年11月27日 |
|
乔丹·拉努斯 |
黄金比例 |
20,000,000,000,000 |
计算:76.1小时
验证:30.0小时 |
AMD Epyc 9654-1.5 TB
Intel Xeon铂金8450H |
2023年9月9日 |
2023年9月7日 |
|
安德鲁·孙 |
Euler-Mascheroni常数 |
1,337,000,000,000 |
计算:28.5天
验证:41.3天 |
Intel Xeon白金83470C
400 GB |
2022年7月17日 |
2022年7月15日 |
|
Seungmin Kim先生 |
柠檬酸盐 |
1,200,000,000,100 |
计算:32.2天
验证:46.5天 |
2 x Intel Xeon Gold 6140 377 GB |
2022年6月8日 |
2022年3月21日 |
|
艾玛·哈鲁卡·伊沃(Emma Haruka Iwao) |
圆周率 |
100,000,000,000,000 |
计算:158天
验证:12.6小时
验证文件 |
128 vCPU Intel Ice Lake(GCP) 864 GB 663 TB存储 |
2022年3月14日 |
2022年3月9日 |
|
Seungmin Kim先生 |
加泰罗尼亚常数 |
1,200,000,000,100 |
计算:48.6天
验证:47.3天 |
2 x Intel Xeon Gold 6140 2 x Intel XeonE5-2680版本3 |
2021年8月17日 |
2021年8月14日 |
来源 |
UAS格里森 |
圆周率 |
62,831,853,071,796 |
计算:108天
验证:34.4小时 |
AMD Epyc 7542公司 1 TB 34+4硬盘 |
2020年9月13日 |
2020年9月6日 |
|
Seungmin Kim先生 |
日志(10) |
1,200,000,000,100 |
计算:14.5天
验证:22.5天 |
2 x Intel Xeon E5-2699 v3 756 GB 2 x Intel Xeon Gold 5220 754 GB |
2020年1月29日 |
2020年1月29日 |
博客 |
蒂莫西·穆利肯 |
圆周率 |
50,000,000,000,000 |
计算:303天
验证:17.2小时
验证文件 |
4 x Intel Xeon E7-4880 v2
315 GB
48个硬盘驱动器 |
2019年3月14日 |
2019年1月21日 |
博客
1+2 |
艾玛·哈鲁卡·伊沃(Emma Haruka Iwao) |
圆周率 |
31,415,926,535,897 |
计算:121天
验证:20.0小时
验证文件 |
2 x未公开的Intel Xeon >1.40 TB DDR4 >240 TB固态硬盘 |
2016年11月15日 |
2016年11月11日 |
博客
赞助商 |
彼得·特鲁布 |
圆周率 |
22,459,157,718,361 |
计算:105天
验证:28小时
验证文件 |
4台Xeon E7-8890 v3 1.25 TB DDR4 20 x 6 TB 7200 RPM希捷 |
2014年10月8日 |
2014年10月7日 |
|
桑登·范·内斯
(houkounchi) |
圆周率 |
13,300,000,000,000 |
计算:208天
验证:182小时
验证文件 |
2台Xeon E5-4650L 192 GB DDR3@1333 MHz 24 x 4 TB+30 x 3 TB |
2013年12月28日 |
2013年12月28日 |
来源 |
近藤茂 |
圆周率 |
12,100,000,000,050 |
计算:94天
验证:46小时 |
2个至强E5-2690 128 GB DDR3@1600 MHz 24 x 3 TB |
请参阅完整列表包括其他显著的大型计算。如果你想自己设置一个记录,规则就在这个链接中。
特征:
y-cruncher的主要计算特征是:
- 能够计算Pi和其他数万亿位数的常数。
- 对于大多数常量,有两种算法可用。一个用于计算,一个用于验证。
- 多线程-多线程可以用来充分利用现代多核处理器,而不会显著增加内存使用。
- 量化的-能够充分利用大多数处理器的SIMD功能。(SSE、AVX、AVX512等)
- 交换空间管理需要比可用内存更多的大型计算。
- 多硬盘驱动器-多个硬盘驱动器可用于更快的磁盘交换。
- 半故障容差-能够检测并纠正可能由硬件不稳定或软件错误引起的微小错误。
下载:
示例屏幕截图:1万亿位Pi
|
核心i7 5960X@4.0 GHz-64 DDR4@2400 MHz-16个HD |
最新版本:(2024年7月21日)
下载任何这些文件都构成对许可协议.
也可以找到下载在GitHub上。如果您喜欢HTTPS,请使用此选项。
Linux版本有静态链接版本和动态链接版本。静态版本应该适用于大多数Linux发行版,但缺少TBB和NUMA绑定。动态版本支持所有功能,但由于DLL依赖关系地狱.
HWBOT公司提交随此版本返回。所以我希望很快能改写排行榜。
系统要求:
窗户:
- Windows 7或更高版本。
- HWBOT提交程序需要Java 8 Runtime。
Linux操作系统:
- 需要64位Linux。不支持32位。
- 动态版本已经在Ubuntu 24.04上进行了测试。
所有系统:
不满足这些要求的非常旧的系统可能能够运行较旧版本的y-cruncher。支持一直追溯到Windows XP之前。
版本历史记录:
其他下载(适用于C++程序员):
高级文档:
基准:
比较图:(上次更新时间:2024年7月8日)
计算各种尺寸的Pi。所有时间均以秒为单位。所有计算都完全在ram中完成。
计时包括将数字转换为十进制表示所需的时间,但不包括将数字写入磁盘所需的次数。
蓝色:基准是最新版本的y-cruncher。
绿色:基准测试是用一个旧版本的y-cruncher完成的,其性能与当前版本相当。
红色:由于使用的是旧版本的y-cruncher,无法与当前版本相比,因此基准测试已经过时了。
紫色:基准测试来自未发布的内部构建,其速度无法与当前版本相比。
笔记本电脑+低功耗:
处理器: |
酷睿i3 8121U |
芯i7 11800H |
Ryzen 9 7940HS公司 |
生成: |
英特尔加农湖 |
英特尔老虎湖 |
英特尔Zen4 |
芯线/螺纹: |
2/4 |
8/16 |
8/16 |
处理器速度: |
~2.5-3.2 GHz(库存) |
~2.5-2.8 GHz(60W PL) |
约4.1-4.8 GHz(50W PL) |
内存: |
8 GB@2400 MT/s |
64 GB@3200 MT/s |
96 GB-5600 MT/s |
程序版本: |
v0.8.5(18-CNL) |
v0.8.5(18-CNL) |
v0.8.5(22-ZN4) |
指令集: |
x64 AVX512-VBMI |
x64 AVX512-VBMI |
x64 AVX512-GFNI |
25,000,000 |
1.951 |
0.490 |
0.410 |
50,000,000 |
4.279 |
1.083 |
0.910 |
100,000,000 |
9.272 |
2.372 |
2.041 |
250,000,000 |
26.129 |
6.585 |
5.662 |
500,000,000 |
62.364 |
14.750 |
12.486 |
1,000,000,000 |
142.219 |
32.271 |
27.654 |
2,500,000,000 |
|
92.021 |
79.921 |
5,000,000,000 |
|
203.953 |
199.153 |
10,000,000,000 |
|
446.934 |
501.327 |
学分: |
|
|
|
处理器: |
核心i7 6820HK |
芯i7 11800H |
芯i7 11800H |
生成: |
英特尔天湖 |
英特尔老虎湖 |
英特尔老虎湖 |
芯线/螺纹: |
4/8 |
8/16 |
8/16 |
处理器速度: |
3.2 GHz(库存) |
~2.5 GHz(45W PL) |
约3.0 GHz(60瓦PL) |
内存: |
64 GB@2133 MT/s |
64 GB@3200 MT/s |
64 GB@3200 MT/s |
版本: |
v0.8.1(14-BDW) |
v0.8.1(18-CNL) |
v0.8.1(18-CNL) |
指令集: |
x64 AVX2+ADX |
x64 AVX512-VBMI |
x64 AVX512-VBMI |
25,000,000 |
1.500 |
0.655 |
0.530 |
50,000,000 |
3.307 |
1.406 |
1.125 |
100,000,000 |
7.238 |
3.005 |
2.447 |
250,000,000 |
20.596 |
8.576 |
6.855 |
500,000,000 |
45.967 |
19.747 |
15.356 |
1,000,000,000 |
102.885 |
42.727 |
34.308 |
2,500,000,000 |
290.824 |
123.523 |
96.918 |
5,000,000,000 |
640.506 |
247.705 |
218.782 |
10,000,000,000 |
1,391.204 |
526.212 |
480.197 |
学分: |
|
|
|
主流台式机:
处理器: |
Ryzen 7 1800X型 |
瑞森9 3950X |
瑞森9 7950X |
生成: |
AMD禅宗1 |
AMD禅宗2 |
AMD禅宗4 |
芯线/螺纹: |
8/16 |
16/32 |
16/32 |
处理器速度: |
股票 |
股票 |
股票 |
内存: |
64 GB-2866 MT/s |
32 GB-3200 MT/s |
128 GB-5200 MT/s |
程序版本: |
v0.8.5(17-ZN1) |
v0.8.5(17-ZN2) |
v0.8.5(22-ZN4) |
指令集: |
x64 AVX2 |
x64 AVX2 |
x64 AVX512-GFNI |
25,000,000 |
1.092 |
0.527 |
0.287 |
50,000,000 |
2.393 |
1.112 |
0.615 |
100,000,000 |
5.337 |
2.387 |
1.365 |
250,000,000 |
15.340 |
6.302 |
3.813 |
500,000,000 |
34.074 |
13.519 |
7.985 |
1,000,000,000 |
76.415 |
29.470 |
16.841 |
2,500,000,000 |
218.467 |
84.116 |
45.703 |
5,000,000,000 |
495.367 |
187.272 |
100.214 |
10,000,000,000 |
1,112.598 |
412.102 |
218.732 |
25,000,000,000 |
|
|
615.070 |
学分: |
|
|
|
处理器: |
Ryzen 5 7600型 |
核心i9 11700K |
瑞森9 3950X |
瑞森9 5950X |
核心i9 13900KS |
瑞森9 7950X |
生成: |
AMD禅宗4 |
英特尔火箭湖 |
AMD禅宗2 |
AMD禅宗3 |
英特尔猛禽湖 |
AMD禅宗4 |
芯线/螺纹: |
6/12 |
8/16 |
16/32 |
16/32 |
24/32 |
16/32 |
处理器速度: |
|
股票 |
股票 |
股票 |
5.7/4.5千兆赫 |
股票 |
内存: |
32 GB |
32 GB-3200 MT/s |
128 GB-2666 MT/s |
64 GB-3200 MT/s |
96 GB-8000 MT/s |
128 GB-4400 MT/s |
128 GB-5200 MT/s |
程序版本: |
v0.8.1(22-ZN4) |
v0.8.1(18-CNL) |
v0.8.1(19-ZN2) |
v0.8.1(19-ZN2) |
v0.8.1(14-BDW) |
v0.8.1(22-ZN4) |
指令集: |
x64 AVX512-GFNI |
x64 AVX512-VBMI |
x64 AVX2+ADX |
x64 AVX2+ADX |
x64 AVX2+ADX |
x64 AVX512-GFNI |
25,000,000 |
0.439 |
0.501 |
0.588 |
0.490 |
0.241 |
0.312 |
0.307 |
50,000,000 |
|
1.114 |
1.257 |
1.090 |
0.525 |
0.679 |
0.654 |
100,000,000 |
|
2.223 |
2.685 |
2.345 |
1.132 |
1.517 |
1.410 |
250,000,000 |
|
6.220 |
7.251 |
6.371 |
3.185 |
4.157 |
3.820 |
500,000,000 |
13.378 |
13.573 |
15.556 |
13.395 |
7.065 |
8.883 |
8.062 |
1,000,000,000 |
29.497 |
30.415 |
33.925 |
29.301 |
15.901 |
18.542 |
17.039 |
2,500,000,000 |
83.421 |
86.119 |
96.695 |
82.204 |
44.888 |
50.743 |
46.467 |
5,000,000,000 |
181.647 |
193.718 |
215.333 |
181.355 |
99.566 |
110.379 |
101.345 |
10,000,000,000 |
|
|
473.958 |
399.012 |
|
241.162 |
220.522 |
25,000,000,000 |
|
|
1,361.732 |
|
|
680.344 |
623.493 |
学分: |
乔尔·鲁芬 |
奥利弗·克鲁斯 |
|
奥利弗·克鲁斯 |
曾铮 |
|
|
处理器: |
核心i7 920 |
FX-8350型 |
核心i7 4770K |
Ryzen 7 1800X型 |
Ryzen 7 3800倍 |
生成: |
英特尔Nehalem |
AMD Piledriver公司 |
处理器 |
AMD禅宗1 |
AMD禅宗2 |
芯线/螺纹: |
4/8 |
8/8 |
4/8 |
8/16 |
8/16 |
处理器速度: |
3.5千兆赫 |
股票 |
4.0千兆赫 |
股票 |
股票 |
内存: |
12 GB-1333 MT/s |
32 GB-1600 MT/s |
32 GB-2133 MT/s |
64 GB-2866 MT/s |
32 GB-3600 MT/s |
程序版本: |
v0.8.1(08-NHM) |
v0.8.1(11-BD1) |
v0.8.1(13-HSW) |
v0.8.1(17-ZN1) |
v0.8.1(19-ZN2) |
指令集: |
x64不锈钢4.1 |
x64 FMA4型 |
x64 AVX2 |
x64 AVX2+ADX |
x64 AVX2+ADX |
25,000,000 |
7.032 |
3.677 |
1.546 |
1.150 |
0.654 |
50,000,000 |
17.174 |
7.703 |
3.259 |
2.527 |
1.415 |
100,000,000 |
36.164 |
16.576 |
6.987 |
5.555 |
3.028 |
250,000,000 |
105.789 |
46.597 |
19.588 |
15.760 |
8.404 |
500,000,000 |
236.096 |
103.165 |
43.197 |
34.659 |
18.440 |
1,000,000,000 |
531.676 |
230.780 |
96.845 |
78.690 |
41.097 |
2,500,000,000 |
|
669.594 |
274.336 |
220.278 |
117.788 |
5,000,000,000 |
|
1,460.714 |
606.605 |
493.388 |
266.719 |
10,000,000,000 |
|
|
|
1,078.187 |
|
25,000,000,000 |
|
|
|
|
|
学分: |
|
|
|
|
奥利弗·克鲁斯 |
高端台式机:
处理器: |
核心i7 5960X |
芯i9 7900X |
核心i9 10980XE |
生成: |
处理器 |
英特尔天湖X |
英特尔蛋糕湖 |
芯线/螺纹: |
8/16 |
10/20 |
18/36 |
处理器速度: |
4.0千兆赫 |
约3.6 GHz(200瓦PL) |
3.3千兆赫(AVX512) |
内存: |
64 GB-2400 MT/s |
128 GB-3000 MT/s |
128 GB-3600 MT/s |
程序版本: |
v0.8.5(13-HSW) |
v0.8.5(17-SKX) |
v0.8.5(17-SKX) |
指令集: |
x64 AVX2 |
x64 AVX512-DQ |
x64 AVX512-DQ |
25,000,000 |
0.727 |
0.409 |
0.286 |
50,000,000 |
1.626 |
0.885 |
0.567 |
100,000,000 |
3.524 |
1.916 |
1.245 |
250,000,000 |
10.089 |
5.488 |
3.541 |
500,000,000 |
22.546 |
12.419 |
7.976 |
1,000,000,000 |
50.538 |
27.822 |
17.822 |
2,500,000,000 |
146.103 |
78.850 |
50.888 |
5,000,000,000 |
314.891 |
174.063 |
113.511 |
10,000,000,000 |
681.296 |
380.010 |
245.876 |
25,000,000,000 |
|
1,064.718 |
676.923 |
学分: |
|
|
|
处理器: |
核心i7 5960X |
裂线器1950X |
芯i9 7900X |
芯i9 7940X |
螺纹裂土器3990X |
至强W7-2495X |
Xeon W9-3475X公司 |
生成: |
处理器 |
AMD Zen 1型 |
英特尔天湖X |
英特尔天湖X |
AMD禅宗2 |
英特尔Sapphire Rapids |
英特尔Sapphire Rapids |
芯线/螺纹: |
8/16 |
16/32 |
10/20 |
14/28 |
64/128 |
24/48 |
36/72 |
处理器速度: |
4.0千兆赫 |
股票 |
约3.6 GHz(200瓦PL) |
3.6 GHz(AVX512) |
2.9千兆赫 |
4.1-4.9千兆赫 |
4.2-4.9千兆赫 |
内存: |
64 GB-2400 MT/s |
64 GB-2800 MT/s |
128 GB-3000 MT/s |
128 GB-3466 MT/s |
~141 GB-2666 MT/s |
64 GB-6400 MT/s |
128 GB-6400 MT/s |
程序版本: |
v0.8.1(13-HSW) |
v0.8.1(17-ZN1) |
v0.8.1(17-SKX) |
v0.8.1(17-SKX) |
v0.8.1(19-ZN2) |
v0.8.1(18-CNL) |
v0.8.3(18-CNL) |
指令集: |
x64 AVX2 |
x64 AVX2+ADX |
x64 AVX512-DQ |
x64 AVX512-DQ |
x64 AVX2+ADX |
x64 AVX512-VBMI |
x64 AVX512-VBMI |
25,000,000 |
0.807 |
0.756 |
0.522 |
0.404 |
0.584 |
0.170 |
0.201 |
50,000,000 |
1.743 |
1.579 |
1.028 |
0.721 |
1.181 |
0.340 |
0.321 |
100,000,000 |
3.647 |
3.273 |
2.048 |
1.451 |
2.409 |
0.726 |
0.586 |
250,000,000 |
10.088 |
8.990 |
5.752 |
4.056 |
5.724 |
2.068 |
1.413 |
500,000,000 |
22.075 |
19.604 |
12.830 |
9.017 |
10.881 |
4.588 |
2.627 |
1,000,000,000 |
49.232 |
43.014 |
28.906 |
20.518 |
21.496 |
10.190 |
5.924 |
2,500,000,000 |
139.404 |
121.645 |
82.764 |
60.636 |
58.009 |
28.881 |
16.345 |
5,000,000,000 |
311.388 |
271.983 |
186.233 |
137.906 |
126.513 |
64.158 |
36.139 |
10,000,000,000 |
669.736 |
613.450 |
401.820 |
302.121 |
274.050 |
124.826 |
78.816 |
25,000,000,000 |
|
|
1,125.775 |
843.498 |
768.212 |
|
225.482 |
学分: |
|
奥利弗·克鲁斯 |
|
|
保罗·安德伍德 |
曾铮 |
多处理器工作站/服务器:
由于高岩芯数和NUMA的影响(非统一内存访问),多处理器系统上的性能对各种设置极为敏感。因此,这些基准可能不能完全代表硬件的能力。
处理器: |
Xeon铂8375C
(AWS x2iedn.32x大) |
至强白金8488C
(AWS m7i.48x大) |
Epyc 9R14型
(AWS m7a.48x大) |
Epyc 9R14型
(AWS hpc7a.96x大) |
Epyc 9754公司 |
生成: |
英特尔Sapphire Rapids |
英特尔Sapphire Rapids |
AMD热那亚 |
AMD贝加莫 |
芯线/螺纹: |
64/128 |
96/192 |
192/192 |
128/256 |
128/128 |
处理器速度: |
2.9千兆赫 |
2.4千兆赫 |
2.6千兆赫 |
2.25-3.1千兆赫 |
内存: |
4 TB |
744 GB |
740 GB |
768 GB-4800 MT/s |
程序版本: |
v0.8.1(18-CNL) |
v0.8.1(18-CNL) |
v0.8.1(22-ZN4) |
v0.8.1(22-ZN4) |
指令集: |
x64 AVX512-VBMI |
x64 AVX512-VBMI |
x64 AVX512-GFNI |
x64 AVX512-GFNI |
25,000,000 |
0.250 |
0.163 |
0.216 |
0.213 |
0.245 |
0.229 |
50,000,000 |
0.454 |
0.289 |
0.285 |
0.279 |
0.350 |
0.433 |
100,000,000 |
0.844 |
0.531 |
0.642 |
0.635 |
0.853 |
0.876 |
250,000,000 |
1.976 |
1.288 |
1.776 |
1.716 |
2.224 |
2.133 |
500,000,000 |
3.794 |
2.499 |
3.728 |
3.621 |
4.186 |
3.850 |
1,000,000,000 |
7.650 |
5.149 |
6.547 |
6.265 |
7.063 |
6.495 |
2,500,000,000 |
20.425 |
13.633 |
13.554 |
12.500 |
15.338 |
14.477 |
5,000,000,000 |
45.675 |
29.655 |
25.334 |
22.377 |
29.072 |
28.133 |
10,000,000,000 |
101.468 |
64.026 |
51.134 |
44.059 |
58.797 |
59.007 |
25,000,000,000 |
297.622 |
182.920 |
140.286 |
120.282 |
156.797 |
164.281 |
50,000,000,000 |
678.016 |
410.842 |
321.970 |
275.297 |
350.391 |
368.548 |
100,000,000,000 |
1,549.991 |
943.182 |
771.266 |
672.558 |
829.957 |
853.717 |
250,000,000,000 |
4,488.317 |
|
|
|
|
|
500,000,000,000 |
9,685.971 |
|
|
|
|
|
学分: |
格雷格·霍根 |
蒂姆·韦斯利 |
处理器: |
Xeon铂金8124M |
Xeon金6148 |
至强白金8175M |
Xeon铂8275CL |
Epyc 7742公司 |
Epyc 7B12型 |
Epyc 7742公司 |
生成: |
英特尔天湖Purley |
英特尔天湖Purley |
英特尔天湖Purley |
英特尔级联湖 |
AMD罗马 |
AMD罗马 |
AMD罗马 |
插座/芯线/螺纹: |
2/36/72 |
2/40/40 |
2/48/96 |
2/48/96 |
2/128/256 |
2/112/224 |
2/128/256 |
处理器速度: |
3.0千兆赫 |
2.4千兆赫 |
2.5千兆赫 |
3.0千兆赫 |
|
2.25千兆赫 |
2.25千兆赫 |
内存: |
137 GB-?? |
188 GB-?? |
~756 GB-?? |
192 GB |
约504 GB |
约882 GB |
2 TB |
程序版本: |
v0.7.5(17-SKX) |
v0.7.6(17-SKX) |
v0.7.6(17-SKX) |
v0.7.8(17-SKX) |
v0.7.7(17-ZN1) |
v0.7.8(19-ZN2) |
v0.7.8(19-ZN2) |
指令集: |
x64 AVX512-DQ |
x64 AVX512-DQ |
x64 AVX512-DQ |
x64 AVX512-DQ |
x64 AVX2+ADX |
x64 AVX2+ADX |
x64 AVX2+ADX |
25,000,000 |
0.540 |
0.329 |
0.294 |
0.283 |
0.534 |
0.439 |
0.513 |
50,000,000 |
0.981 |
0.683 |
0.617 |
0.544 |
1.027 |
0.838 |
0.920 |
100,000,000 |
1.905 |
1.456 |
1.305 |
1.169 |
2.298 |
1.796 |
1.887 |
250,000,000 |
5.085 |
3.737 |
3.591 |
3.125 |
5.854 |
4.509 |
4.650 |
500,000,000 |
10.372 |
7.750 |
7.293 |
6.309 |
10.502 |
8.196 |
8.066 |
1,000,000,000 |
21.217 |
16.550 |
15.041 |
13.042 |
17.836 |
14.252 |
13.246 |
2,500,000,000 |
55.701 |
45.693 |
39.329 |
34.028 |
35.485 |
30.592 |
27.011 |
5,000,000,000 |
118.151 |
99.078 |
83.601 |
71.777 |
62.432 |
58.405 |
49.940 |
10,000,000,000 |
247.928 |
212.984 |
176.695 |
153.169 |
115.543 |
116.900 |
98.156 |
25,000,000,000 |
|
599.653 |
491.988 |
425.442 |
307.995 |
314.907 |
258.081 |
50,000,000,000 |
|
|
1,081.181 |
|
690.662 |
741.633 |
598.716 |
100,000,000,000 |
|
|
|
|
|
1715.123 |
1,370.714 |
250,000,000,000 |
|
|
|
|
|
|
3,872.397 |
学分: |
雅各布·科尔曼 |
奥利弗·克鲁斯 |
纽亚历克斯 |
新余苗 |
卡斯滕·斯皮尔 |
格雷格·霍根 |
宋鹏飞 |
处理器: |
至强E5-2683 v3 |
至强E7-8880 v3 |
至强E5-2687W v4 |
至强E5-2686 v4 |
至强E5-2696 v4 |
Epyc 7601公司 |
Xeon黄金6130F |
生成: |
处理器 |
处理器 |
英特尔Broadwell |
英特尔Broadwell |
英特尔Broadwell |
AMD那不勒斯 |
英特尔Skylake Purley |
插座/芯线/螺纹: |
2/28/56 |
4/64/128 |
2/24/48 |
2/36/72 |
2/44/88 |
2/64/128 |
2/32/64 |
处理器速度: |
2.03千兆赫 |
2.3千兆赫 |
3.0千兆赫 |
2.3千兆赫 |
2.2千兆赫 |
2.2千兆赫 |
2.1千兆赫 |
内存: |
128 GB-??? |
2 TB??? |
64 GB |
504 GB-??? |
768 GB-??? |
256 GB-?? |
256 GB-?? |
程序版本: |
v0.6.9(13-HSW) |
v0.7.1(13-HSW) |
v0.7.6(14-BDW) |
v0.7.7(14-BDW) |
v0.7.1(14-BDW) |
v0.7.3(17-ZN1) |
v0.7.3(17-SKX) |
指令集: |
x64 AVX2 |
x64 AVX2 |
x64 AVX2+ADX |
x64 AVX2+ADX |
x64 AVX2+ADX |
x64 AVX2+ADX |
x64 AVX512-DQ |
25,000,000 |
0.907 |
1.176 |
0.490 |
0.494 |
0.715 |
2.459 |
1.150 |
50,000,000 |
1.745 |
2.321 |
1.072 |
0.982 |
1.344 |
4.347 |
1.883 |
100,000,000 |
3.317 |
4.217 |
2.303 |
2.193 |
2.673 |
6.996 |
3.341 |
250,000,000 |
8.339 |
8.781 |
6.196 |
6.044 |
6.853 |
14.258 |
7.731 |
500,000,000 |
17.708 |
15.879 |
13.046 |
12.582 |
14.538 |
24.930 |
15.346 |
1,000,000,000 |
37.311 |
32.078 |
27.763 |
26.852 |
31.260 |
47.837 |
31.301 |
2,500,000,000 |
102.131 |
78.251 |
76.202 |
73.596 |
84.271 |
111.139 |
82.871 |
5,000,000,000 |
218.917 |
164.157 |
165.046 |
160.094 |
192.889 |
228.252 |
179.488 |
10,000,000,000 |
471.802 |
346.307 |
356.487 |
346.305 |
417.322 |
482.777 |
387.530 |
25,000,000,000 |
1,511.852 |
957.966 |
1,006.131 |
980.784 |
1,186.881 |
1,184.144 |
1,063.850 |
50,000,000,000 |
|
2,096.169 |
2,202.558 |
2,156.854 |
2,601.476 |
|
|
100,000,000,000 |
|
4,442.742 |
|
|
6,037.704 |
|
|
250,000,000,000 |
|
17,428.450 |
|
|
|
|
|
学分: |
近藤茂 |
雅各布·科尔曼 |
卡梅隆·吉斯布雷希特 |
纽亚历克斯 |
“悠悠” |
戴夫·格雷厄姆 |
最快时间:
每个尺码的完整排名表如下:
这些最快的时间可能包括未发布的beta。
有更快的时间吗?让我知道:a-yee@u.northwestern.edu
请注意,我通常不会回复这些电子邮件。我只是将它们放入我定期更新的图表中(通常在2周内)。
性能提示:
Pi的十进制数字-以秒为单位
内核i9 7940X@3.7 GHz AVX512 |
记忆频率: |
2666公吨/秒 |
3466公吨/秒 |
25,000,000 |
0.839 |
0.758 |
50,000,000 |
1.424 |
1.338 |
100,000,000 |
2.701 |
2.425 |
250,000,000 |
6.489 |
5.877 |
500,000,000 |
13.307 |
11.917 |
1,000,000,000 |
27.913 |
24.915 |
2,500,000,000 |
76.837 |
68.322 |
5,000,000,000 |
168.058 |
148.737 |
10,000,000,000 |
365.047 |
322.115 |
25,000,000,000 |
1,037.527 |
916.039 |
众所周知,高内核数的Skylake X处理器受到内存带宽的严重限制。
内存带宽:
由于计算Pi和其他常量的内存密集性,y-cruncher需要大量内存带宽才能正常运行。事实上,自2012年以来,几乎所有高端台式机上都明显存在该程序的内存限制,至少自2006年以来,大多数多插槽系统上都存在该程序。
建议:
- 确保填充了所有内存通道。这是迄今为止最重要的,因为带宽几乎与信道数成线性关系。
- 以尽可能高的频率运行内存,以最大化带宽。
- 记忆计时通常不那么重要。超线程可以很好地隐藏长内存延迟。
- 在Skylake X处理器上,L3缓存带宽也是一个瓶颈。因此,尽可能多地超频缓存。
如果y-cruncher暴露出其他应用程序和压力测试所没有的不稳定性,不要感到惊讶。y-cruncher的与众不同之处在于它同时给CPU和整个内存子系统带来了沉重的负载。
并行性能:
y-cruncher有很多用于调整并行性能的设置。默认情况下,它会尽力分析硬件并选择最佳设置。但是,由于处理器拓扑的组合几乎是无限的,因此y-cruncher很难为所有东西选择最佳设置。因此,有时只有手动设置才能实现最佳性能。
- 尝试Push Pool和Cilk Plus框架。虽然Push Pool在大多数情况下都更快,但Cilk Plus可能更适合于非常小的计算以及具有多个(>64)内核的机器*
- 尝试使用较大的任务分解大小。这可能会缓解负载不平衡的问题*
- 在Windows上,如果系统有64个以上的逻辑内核,请确保在BIOS中禁用节点交错。否则,将导致处理器组不平衡,从而导致负载不平衡。
*如果您在控制台UI中使用基准选项,则无法更改这些高级设置。要更改它们,您需要从命令行运行基准模式或使用自定义计算菜单。
负载不平衡是y-cruncher中常见的故障问题。通常的原因是:
- 逻辑核心的数量不是二的幂。
- 岩芯不均匀。常见原因包括:
- 核心以不同的速度计时。
- 由于NUMA拓扑不平衡,内核可以访问不同数量的内存带宽。
- 核心是隐藏在虚拟机后面的不同代核心。
- CPU密集型后台进程正在干扰y-cruncher使用所有硬件的能力。这适用于所有形式的系统抖动。
大页面:
过去,大页面并不重要,但现在在后Spectre/Mealtdown世界中却很重要。缓解措施熔化漏洞y-cruncher的性能可能会显著下降(已观察到高达5%)。事实证明,打开大页面可以减轻这种减轻的代价。(意在双关语)
请参阅内存分配指南如何打开大页面。
交换模式:
这可能是y-cruncher中最复杂的功能之一。
- 阅读指南所以你知道如何使用它。
- 根据系统的CPU能力,您可能需要多个NVMe SSD或许多的硬盘驱动器以避免磁盘I/O瓶颈。
- 不要使用硬件或软件RAID。如果你让y-cruncher单独管理每个驱动器,它通常会做得更好。
- 如果你关心SSD的寿命,就不要使用它们。y型压榨机能够并将摧毁SSD如果你坚持足够长的时间。
已知问题:
本节中的所有内容都正在重新验证并移至:https://github.com/Mysticial/y-cruncher/issues网站
性能问题:
- 在最新的Ubuntu(15.10)上进行交换计算,可能还有其他内核版本相同的东西,在交换模式下性能很差。这是因为操作系统对页面文件进行了过多且不必要的磁盘交换。解决方案是禁用交换文件,这样就不可能进行分页。将“交换”值设置为零也就足够了。y-cruncher还将尝试将页面锁定在内存中,以防止操作系统通过分页进行自拍。
算法和发展:
常见问题解答:
Pi和其他常量:
程序使用:
硬件和超时钟:
学术界:
编程:
其他:
链接:
以下是一些专门用于计算Pi和其他常数的有趣站点:
问题或评论
通过联系我电子邮件。我回复得很好,除非它被学校的垃圾邮件过滤器捕获。
你也可以在推特上找到我@神秘的.