英特尔在即将举行的2018年超级计算机贸易展之前发布了几项声明,其中包括其新的Xeon Cascade Lake-AP(高级性能)处理器系列,该系列具有多达48个内核,支持12通道DDR4内存。
Intel使用多芯片封装(MCP)架构设计了这一新的数据中心芯片系列,这意味着每个处理器都由多个芯片组成,与AMD的EPYC和Threadripper处理器非常相似。这最终为英特尔提供了一个答案,以应对AMD凭借其32核EPYC数据中心处理器所拥有的核心计数优势。Intel还宣布了一系列用于入门级服务器的Xeon E-2100处理器。
Cascade Lake-AP系列标志着英特尔数据中心处理器设计的一个根本性转变,尽管该公司对Kentsfield处理器。这一新的处理器系列每个芯片最多有48个内核,支持12个DDR4通道,在双插槽(2P)服务器中最多有96个内核和24个DDR5通道。英特尔尚未确认这些处理器是否具有“超线程”功能,即每个芯片96个线程。
英特尔声称,这些处理器为HPC、AI和IAAS工作负载提供了最高的性能。处理器还提供了所有数据中心处理器中最多的内存通道,因此可以访问最高的内存带宽。这里的目标是性能密度、高内存容量和极高的内存吞吐量,这对HPC人群来说很好。
作为快速复习,Xeon瀑布湖-SP系列即将上市。英特尔还没有发布具体的模型细节,但我们知道新处理器的基本设计将与Intel Xeon可扩展处理器(此处查看)这意味着Cascade Lake是另一个14nm刷新,与之前的Ggen模型具有类似的核心计数(最多28个)、缓存容量和I/O调节。
这些新的Cascade Lake-SP型号将于今年上市,英特尔将与AMD的32核EPYC处理器展开竞争,后者拥有更多的内核和线程可供选择。AMD也表示7nm EPYC处理器据称将配备更多内核明年年初发货收入.
由于英特尔将在2020年推出10nm冰湖数据中心处理器,因此,将工艺和性能领先地位拱手让给AMD,这将为2019年的长期发展奠定基础,从而推出具有异国情调的Cascade Lake-AP处理器。
英特尔声称,新款Cascade Lake-AP处理器在以下方面击败了旗舰产品AMD EPYC 7601基准Intel将公开的AMD测试结果用于Steam Triad测试结果,但在其实验室中进行了Linpack测试。英特尔选择在EPYC 7601上禁用SMT,从而禁用了一半的线程。我们已经联系英特尔,了解测试配置背后的基本原理(EDIT-我们在文章末尾包含了英特尔的评论)。
·Linpack比Intel Xeon Scalable 8180处理器高1.21倍,比AMD EPYC 7601高3.4倍
·与Intel Scalable 8180处理器相比,流媒体Triad最高可达1.83倍,与AMD EPYC 7601相比,流式Triad最高为1.3倍
英特尔还声称,与发布时的Xeon Scalable 8180相比,这些处理器提供的AI/深度学习推理性能高出17倍。
将模具粘合在一起
我们期望所有-SP模型的体系结构改进以进入新的Cascade Lake-AP模型。但是,MCP(多芯片封装)设计的加入,虽然与英特尔最近的声明一致,即多芯片架构是其前进道路的一部分,但令人惊讶的是公司发表的声明关于AMD过去的多芯片EPYC设计。
英特尔著名地宣称EPYC设计由“四个粘合在一起的桌面模具”组成粘合逻辑英特尔谴责AMD的多芯片方法提供了不一致的性能(在其他感知故障中).
当被问及其方法与AMD的不同之处时,英特尔代表回答说,该公司并不“反对”多芯片设计。相反,它看到了SOC已经走上的道路的价值。英特尔还声称其设计优于AMD基于Infinity Fabric的架构(如上图所示)。
英特尔认为AMD的方法会产生不一致性和性能可变性,而其设计不会受到同样的怪癖影响。英特尔正在使用其UPI(Ultra Path Interconnect)接口在包装内的模具之间。该协议具有极强的可扩展性;英特尔已经使用它在多达八个套接字服务器的处理器之间进行通信,因此它显然能够正确适应复杂的拓扑结构,以及成熟的调度和节能算法。
如上图所示,UPI也已内置于Intel的Xeon Scalable XCC芯片中。每个芯片有三个UPI连接,用于与驻留在其他插槽上的处理器(及其连接的内存)通信。使用现有的第三个UPI端口在同一处理器包内的芯片之间进行通信是有意义的,同时让其他两个UPI连接空闲,以便连接到双插槽服务器中的另一个处理器。
Intel可能会使用NUMA或某种类型的高级处理器来分隔每个AP处理器内不同的资源池Sub-NUMA聚类(SNC)。可以将其视为双插槽服务器中的四(或更多)插槽拓扑。
Intel表示,Cascade Lake-AP型号只能扩展到两个插槽,而旗舰Xeon处理器具有八个插槽的可扩展性,因此可以合理地假设Intel只是对其现有XCC芯片进行了复杂的调整,以适应多芯片设计。每个Cascade Lake-AP芯片还使用12个内存通道,这与将两个六通道XCC芯片组合成一个单独的包很好地吻合。
但英特尔尚未确认该芯片仅带有两个芯片,而Cascade Lake-AP型号最多只有48个内核。这意味着该公司可能已经设计了一个全新的管芯,或者禁用了每个28芯XCC管芯四个芯,以适应热限制。英特尔确实透露,它没有使用EMIB连接模具之间,可能是由于功率较大的模具之间的热膨胀和收缩,但没有提供互连的额外细节。
英特尔没有公布具体细节,包括这些处理器是否需要一个新的插槽(据传它们将放入LGA5903插槽)。我们预计英特尔将发布多个SKU,跨越28核SP机型和48核AP旗舰机型之间的核心数量差距。
我们还知道,英特尔并不反对对其“性能领先”产品收取额外费用,而当前的28核Xeon建议单处理器客户价格为10000美元,因此这些产品的价格可能会很高。英特尔尚未透露定价,但该公司表示,新处理器将于2019年“上半年”上市。
Intel Xeon E-2100系列
英特尔还宣布推出Xeon E-2100系列处理器。这些处理器的基本设计与该公司今年早些时候为工作站发布的Xeon E处理器,但Intel为入门级服务器设计了新的附加组件。这使得它们非常适合中小型企业。Intel还增加了对其最新SGX技术的支持,云服务提供商喜欢微软和国际商用机器公司用于保护云中的数据。
英特尔采用与其咖啡湖处理器和在SKU中提供,范围从四核四线程到六核十二线程,但Xeon E机型最多支持40个PCIe Gen 3.0通道。Intel将通道划分为16条向用户开放的通道和四条连接到C246工作站系列芯片组的DMI 3.0通道,该芯片组提供额外的24条可用通道。
处理器插入LGA1551插槽,配备双通道内存控制器,支持高达128GB的DDR4-2666 ECC内存(是工作站型号的两倍)。除了E-2124之外,Intel的所有新E-2100机型都带有“G”修改器,这意味着它们配备了集成UHD Graphics P630引擎。TDP的范围为71W至95W。
Xeon E-2100系列处理器现已上市。
更新:为了进行性能比较,Intel禁用了AMD EPYC处理器上的同步多线程(SMT),禁用了芯片上一半的线程。英特尔回应了我们关于设置的询问:
在运行STREAM和LINPAK时,我们通常在处理器上禁用同步多线程,以获得最高性能,这就是为什么我们在所有基准处理器上禁用它的原因。
我们回顾了英特尔对同一款EPYC 7601处理器的内部性能基准今年早些时候它与我们分享了并且该公司没有为这些流测试禁用SMT。相反,该公司指定测试在每个内核中使用一个线程执行,这与禁用SMT的目的相同。