美洲

  • 美国

亚洲

卢卡斯·米里亚
高级报告员

英特尔公布其AI路线图,与英伟达竞争的芯片

新闻分析
2024年4月9日8分钟
人工智能CPU和处理器新兴技术

在该公司的年度Vision大会上,英特尔首席执行官帕特·盖辛格(Pat Gelsinger)表示,他认为该公司的未来植根于全人工智能概念。

英特尔周二正式在其2024年愿景会议并推出了一系列新产品和战略合作,以提高genAI的采用率。

该芯片制造商的战略涵盖了从数据中心到边缘设备(包括支持AI的PC)的所有硬件和云服务路线图。

在一次主题演讲中,英特尔首席执行官Pat Gelsinger宣布了人工智能的时代,其中包括将使用英特尔酷睿超处理器新系列的个人电脑。该芯片制造商预计2024年将出货4000万台AI PC处理器,明年将出货1亿台。

12月,英特尔最初宣布的即将发布的用于数据中心AI工作负载的Gaudi 3处理器,并预览了其第14代Gen Core Ultra“Meteor Lake”数据中心处理器和第5代Gen Xeon可扩展CPU。该公司于周二正式宣布了后两个处理器。

英特尔还宣布其下一代花岗岩山脊和塞拉森林处理器将被命名为“Xeon 6”,取代使用代名词的旧营销语言,如“第五代Xeon可扩展”模型。

英特尔芯片晶圆

英特尔首席执行官Pat Gelsinger持有即将推出的Xeon 6处理器晶圆。

英特尔

新的Xeon 6处理器将包含对MXFP4数据格式的软件支持,与使用FP16的第四代Xeon相比,该处理器可将下一代延迟减少6.5倍,并能够运行700亿参数的Llama-2大型语言模型。

在其现场演示中,英特尔提供了有关Gaudi 3架构、性能和OEM承诺将其推向市场的新细节,并招揽了许多新客户。该公司列举了十几个使用高迪3加速器的“合作伙伴”,其中包括Naver公司。,博世公司,尼尔森IQ、和搜索者.

从历史上看,英伟达凭借其GPU(图形处理单元)和TPU(张量处理单元)引领了人工智能硬件市场,旨在为其提供动力和训练大型语言模型和AI应用程序。英特尔将其高迪3定位为英伟达H100 GPU.

与Nvidia H100相比,Gaudi 3平均提供50%更好的推断,平均提供40%更好的能效-“成本很低,”Gelsinger说。根据Intel的说法,Gaudi 3加速器可以为计算机存储系统提供四倍的AI计算BF16型浮点格式和1.5倍于Gaudi 2的内存带宽;它还提供了两倍于其前身的网络带宽。

英特尔使用台积电的5nm工艺制造Gaudi 3芯片,这些芯片现在可用于原始设备制造商(OEM),包括戴尔、HPE、联想和Supermicro,用于人工智能数据中心市场。该芯片被设计成与数千个其他芯片串联在数据中心的机架中。

去年,英伟达控制了大约83%的数据中心芯片市场,剩下的17%大部分由谷歌的定制张量处理单元(TPU)控制。

宾夕法尼亚大学工程与应用科学学院(University of Pennsylvania’s School of Engineering and Applied Science)教授本杰明·李(Benjamin Lee)表示,英特尔的发展轨迹并非一帆风顺,与英伟达(Nvidia)竞争面临挑战。

Lee表示:“英特尔长期主导高性能CPU的设计和制造,但最近的挑战反映了计算领域的根本变化。”。“数据中心将继续大量部署CPU以支持互联网服务和云计算,但越来越多地部署GPU以支持AI,而英特尔一直在努力设计具有竞争力的GPU。”

英特尔的独特优势在于,它是唯一一家可能在制造最先进芯片方面与台积电竞争的国内芯片制造供应商,“这让它在与无晶圆厂的竞争对手英伟达(Nvidia)和AMD(AMD)的竞争中占据优势,”李说。“英特尔尚未成功建立和发展像台积电这样的代工业务。这对其未来至关重要,因为现在有很多科技公司都在设计自己的高性能处理器。”

Lee表示,英特尔在晶体管技术方面也没有跟上台积电的进步,也没有能力以与台积电铸造厂相当的精度和效率满足合同要求。英特尔目前缺乏满足自身制造需求和更大客户群的制造能力。

Lee指出,英特尔首席执行官制定的路线图是明智的,但“数百万美元的问题是,它能否利用来自CHIPS法案.”

2022年8月,国会通过了《芯片与科学法案》(芯片法案)以解决新冠肺炎疫情带来的处理器短缺问题。The 美国商务部提供的立法英特尔(DoC)将获得527亿美元,用于美国芯片计划下的一系列项目,以“重振”美国在半导体研发和制造领域的地位。英特尔准备获得其中约85亿美元的资金。

英特尔公司的盖辛格(Gelsinger)宣布,《芯片法案》(CHIPS Act)将使该公司第一批芯片从200亿美元的规模中脱颖而出奥科蒂略制造厂亚利桑那州钱德勒。,去年。

然而,目前,《芯片法案》几乎没有为芯片设计者提供直接支持,例如英伟达的GPU、苹果的NPU和谷歌的TPU,所有这些都在美国历史上蓬勃发展。

在Vision会议期间,Intel还提供了跨企业AI所有领域的新一代产品和服务的更新,包括可以运行的新Intel Xeon 6处理器检索增强生成过程,简称“RAG”

RAG通过使用组织的专有数据和信息,创建了一个更定制、更准确的genAI模型;这可以大大减少已知的人工智能问题,如错误输出和幻觉。

Gelsinger举例说明了genAI使用从互联网上刮来的未实时更新的数据是多么不可靠。

对于标准的LLM,“如果你真的很好,也许你正在更新和再培训……也许一周一次,也许一个月一次?”他说。“当您将(LLM)与通过矢量数据库、流式非结构化数据库传输的实时数据结合在一起时,我们认为这非常强大。”

英特尔还表示,本季度将为其下一代处理器发布一个新品牌,用于数据中心、云和边缘目的。与第二代Intel Xeon处理器相比,配备Efficient-cores(E-core,前代号为Sierra Forest)的Intel Xeon6处理器的每瓦性能将高达2.4倍,机架密度将高达2.7倍。 

他将英特尔过去十年的创新描述为平淡无奇,称该公司将PCIe速度提高了一点,对DDR内存进行了增量升级,并在芯片出货之前向芯片添加了“几个内核”。

“无聊,”盖辛格说。“人工智能让一切都变得激动人心,这是我们从未见过的。计算的基本方向是自互联网以来最大的技术变革,它将重塑我们和您的业务的各个方面。”

他说,预计到本世纪末,半导体的总目标市场将从现在的6000亿美元增长到1万亿美元以上。

为此,Gelsinger还宣布,该公司的下一代Core Ultra客户端处理器系列(代号为Lunar Lake)将于今年晚些时候推出。处理器将具有100多个平台每秒tera操作(TOPS)和45多个神经处理单元(NPU)TOPS,用于下一代AI PC。

盖辛格在亚利桑那州凤凰城的一个座无虚席的礼堂里说:“英特尔的使命是将人工智能带到世界各地。”。“我对下一个平台感到非常兴奋。你知道,在竞争对手推出第一款[人工智能]芯片之前,我们推出了第二款,即人工智能性能提高了3倍的月球湖。第三代正在[制造]中。”

Gelsinger将支持AI的个人电脑与Wi-Fi进行了比较,并表示没有AI功能的个人电脑终有一天会被视为过时。他说:“微软Copilot、人工智能开发人员、Zoom和团队总结、翻译、情境化。”。“每个应用程序都在经历人工智能的改造。你会错过的。简单地说,是时候刷新你的电脑了。”

Intel还致力于为AI结构创建开放式以太网网络模型,并推出了一系列AI优化以太网解决方案。该公司正在通过Ultra Ethernet Consortium(UEC)设计大规模扩展和扩展AI结构。

Intel表示:“这些创新使培训和推断能够用于日益庞大的模型,每代模型的规模都会扩大一个数量级。”在一份声明中说“该系列包括Intel AI NIC(网络接口卡)、用于集成到XPU的AI连接芯片、基于Gaudi的系统,以及Intel Foundry的一系列软硬件参考AI互连设计。”