1000+亿晶体管怪物 Intel GPU Max诞生一年半就被放弃

1000+亿晶体管怪物IntelGPUMax诞生一年半就被放弃据最新曝料，Intel已经告知合作伙伴，GPUMax系列将逐步停产退市，IntelAI加速器的重点将放在Guadi2/3系列，还有明年的第二代GPUMaxFalconShores。PonteVecchioGPUMax当年是RajaKoduri力推的项目，采用了5种不同制造工艺、47个不同模块，晶体管数量超过1000亿个，配备最多128个Xe-HPC高性能计算核心、128个光追核心、64MB一级缓存、108MB二级缓存、128GBHBM高带宽内存，满血功耗600W。Gaudi3则是独立的AI加速器，不久前刚刚发布，升级台积电5nm工艺，配备了8个矩阵引擎、64个张量核心、96MBSRAM缓存、1024-bit128GBHBM2E内存，满血功耗达900W。Intel声称，它相比上代拥有2倍的FP8AI算力、4倍的BF16AI算力、2倍的网络带宽、1.5倍的内存带宽，而对比NVIDIAH100LLM推理性能领先50％、训练时间快40％。针对中国市场，Gaudi3将提供特殊版本，功耗最高限制在450W。FalconShores最初规划融合CPU、GPU，就像AMDInstinctMI300A，但后来改为纯GPU方案，融合设计则后续再说。...PC版：https://www.cnbeta.com.tw/articles/soft/1430996.htm手机版：https://m.cnbeta.com.tw/view/1430996.htm

在Telegram中查看

相关推荐

450W功耗 Intel顶级GPU突然生变只为卖到中国？

450W功耗Intel顶级GPU突然生变只为卖到中国？顶级型号Max1550具备满血的128个Xe-HPC核心、128个光追核心、64MB一级缓存、408MB二级缓存、128GBHBM高带宽内存，最高功耗600W，最多八卡并联。本次取消的是次级型号Max1350，112核心，96GB内存，450W功耗。它下边还有个Max1100，56核心，48GB内存，300W功耗，最多四卡并联。Intel表示，Max1550原本是针对液冷设计的，但已经成功进行风冷部署，这就和Max1350的定位产生了冲突，因此将其取消，改为再推出一款新的Max1450，液冷、风冷均可，今年晚些时候正式推出。Intel没有透露Max1450的具体规格，但有趣的是，Intel特别提到它将会降低IO带宽。这不由得让我们想起美国对华禁售NVIDIAA100/HH100这样的高性能GPU之后，出现了削减带宽的版本A800、H800，可以正常卖给中国。难道，Intel是为中国市场特意准备的Max1450？另外值得一提的是，Intel原计划在今年推出下一代高性能GPURialtoBridge，2024年再发布全新XPUFalconShores，同时集成x86CPU、XeGPU，但最近决定取消RialtoBridge，改为在2025年直接发布FalconShores。AMD则会在今年发布InstinctMI300，首次集成CPU、GPU，5nm工艺，1460亿个晶体管，24个Zen4CPU核心，未知数量CDNA3GPU核心，8192-bit128GBHBM3内存。NVIDIA方面准备了超级芯片GraceHopper，前者基于Arm架构，也整合HBM内存。高性能计算GPU的竞争是越来越激烈了。...PC版：https://www.cnbeta.com.tw/articles/soft/1354161.htm手机版：https://m.cnbeta.com.tw/view/1354161.htm

Intel发布Gaudi 3 AI加速器：4倍性能提升、无惧1800亿参数大模型

Intel发布Gaudi3AI加速器：4倍性能提升、无惧1800亿参数大模型数据显示，预计到2030年，全球半导体市场规模将达1万亿美元，AI是主要推动力，不过在2023年，只有10％的企业能够成功将其AIGC项目产品化。Intel的最新解决方案，有望帮助企业应对推广AI项目时所面临的挑战，加速实现AIGC落地商用。Intel现有的Gaudi2诞生于2022年5月，并于2023年7月正式引入中国，拥有极高的深度学习性能、效率，以及极高的性价比。它采用台积电7nm工艺制造，集成24个可编程的Tenor张量核心(TPC)、48MBSRAM缓存、21个10万兆内部互连以太网接口(ROCEv2RDMA)、96GBHBM2E高带宽内存(总带宽2.4TB/s)、多媒体引擎等，支持PCIe4.0x16，最高功耗800W，可满足大规模语言模型、生成式AI模型的强算力需求。新一代的Gaudi3面向AI训练和推理，升级为台积电5nm工艺，带来了2倍的FP8AI算力、4倍的BF16AI算力、2倍的网络带宽、1.5倍的内存带宽。对比NVIDIAH100，它在流行LLM上的推理性能领先50％、训练时间快40％。Gaudi3预计可大幅缩短70亿和130亿参数Llama2模型、1750亿参数GPT-3模型的训练时间。在Llama70亿/700亿参数、Falcon1800亿参数大型语言模型上，Gaudi3的推理吞吐量和能效也都非常出色。Gaudi3提供多种灵活的形态，包括OAM兼容夹层卡、通用基板、PCIe扩展卡，满足不同应用需求。Gaudi3提供开放的、基于社区的软件，以及行业标准以太网网络，可以灵活地从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群，支持大规模的推理、微调和训练。Gaudi3AI加速器具备高性能、经济实用、节能、可快速部署等优点，能够充分满足复杂性、成本效益、碎片化、数据可靠性、合规性等AI应用需求。Gaudi3将于2024年第二季度面向OEM厂商出货，包括戴尔、慧与、联想、超威等。目前，IntelGaudi加速器的行业客户及合作伙伴有NAVER、博世(Bosch)、IBM、Ola/Krutrim、NielsenIQ、Seekr、IFF、CtrlSGroup、BhartiAirtel、LandingAI、Roboflow、Infosys，等等。此外，Intel还宣布联合Anyscale、DataStax、Domino、HuggingFace、KXSystems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、SAS、VMware、Yellowbrick、Zilliz等伙伴，共同创建一个开放平台，助力企业推动AI创新。该计划旨在开发开放的、多供应商的AIGC系统，通过RAG（检索增强生成）技术，提供一流的部署便利性、性能和价值。初始阶段，Intel将利用至强处理器、Gaudi加速器，推出AIGC流水线的参考实现，发布技术概念框架，并继续加强IntelTiber开发者云平台基础设施的功能。...PC版：https://www.cnbeta.com.tw/articles/soft/1426791.htm手机版：https://m.cnbeta.com.tw/view/1426791.htm

Intel Gaudi 3 AI加速器可以卖给中国但挥刀砍掉一半

IntelGaudi3AI加速器可以卖给中国但挥刀砍掉一半Intel声称，它相比上代拥有2倍的FP8AI算力、4倍的BF16AI算力、2倍的网络功耗为600W带宽、1.5倍的内存带宽，而对比NVIDIAH100LLM推理性能领先50％、训练时间快40％。Gaudi3的首发版本编号HL-325L，OAM形态，已经出货，功耗900W，风冷散热。它的中国特供版将在6月份推出，编号HL-328，功耗减半至450W，HMB内存、缓存、解码器等完全保留，但既然功耗少了一半，算力差不多也会被腰斩。10月份还会有个液冷版本HL-335，支持双路并联，但不能卖给中国，也没有特供版。PCIe扩展卡形态将在9月份出货，风冷，满血版编号HL-338，，中国特供版编号HL-388，功耗又被限制在450W。通用基板形态的编号为HLB-325，但具体规格和出货时间暂时不详。说起来，NVIDIA是最早做中国特供版AI加速器的，也就是H800、A800，后来也被禁售了，最近又拿出了H20、L20、L2、RTX4090D，都能卖。AMD也设计了特供版InstinctMI309、MI388X，但都被美政府以算力还是太强为由给打回，而年底将要升级到MI350。...PC版：https://www.cnbeta.com.tw/articles/soft/1427052.htm手机版：https://m.cnbeta.com.tw/view/1427052.htm

Intel GPU号称领先NVIDIA 2.5倍？细看尴尬了

IntelGPU号称领先NVIDIA2.5倍？细看尴尬了HotChips34大会史昂，Intel又公布了PonteVecchioGPU高性能计算卡的更多细节，包括性能数据。PonteVecchioGPU基于全新的XeHPC高性能计算架构，使用5种不同制造工艺(Intel7和台积电N7/N5等)、多种封装技术，整合了多达47个不同计算模块，晶体管数量超1000亿个。它一个模块有128个Xe核心、128个光追单元、64MB一级缓存、408MB二级缓存、128GBHBM2e高带宽内存，支持PCIe5.0，可以四路甚至八路并联。Intel给出的最新数据声称，PonteVecchioFP32单精度、FP64双精度性能可达52TFlops，TF3.2浮点性能可达419TFlops，BF16、PF16浮点性能可达839TFlops，INT8整数性能则可达1678Tops。DataParallelC++(DPC++)测试项目中，PonteVecchio的性能相比于NVIDIAA100可以领先1.4-2.5倍。另外，ExaSMROpenMC计算性能可领先2倍，NekRS性能则领先0.3-1.7倍。当然，NVIDIA新一代的H100都已经发布了……PonteVecchio的使命是将联合下一代可扩展至强SapphireRapids，用于美国的首批三台百亿亿次超算之一Aorura，但不幸的是，SapphireRapids一再推迟，预计明年第二季度才能发布，PonteVecchio也一直没有量产上市。相比之下，AMD三代霄龙处理器、InstinctMI250X加速卡组成的Frontier已经上线运行，并以1.6EFlops的性能，成为当今(公开的)超算之王。PC版：https://www.cnbeta.com/articles/soft/1307421.htm手机版：https://m.cnbeta.com/view/1307421.htm

1460亿晶体管超级APU AMD MI300下半年发布

1460亿晶体管超级APUAMDMI300下半年发布AMDCEO苏姿丰近日确认，InstinctMI300将在今年下半年正式推出。MI300采用多芯片、多IP整合封装设计，5nm先进制造工艺，晶体管数量多达疯狂的1460亿个！它同时集成CDNA3架构的GPU单元(具体核心数量未公开)、Zen4架构的24个CPU核心、大容量的InfinityCache无限缓存，还有8192-bit位宽、128GB容量的HBM3高带宽内存。技术方面支持第四代InfinityFabric总线、CXL3.0总线、统一内存架构、新的数学计算格式，号称AI性能比上代提升多达8倍，可满足百亿亿次计算需求。事实上，Intel一年前也宣布了类似的产品“FalconShores”(猎鹰海岸)，称之为XPU，同时集成至强CPU、XeHPCGPU，以及下一代封装、内存、IO技术，号称能效、x86计算密度、内存容量与带宽都比现在提升5倍。不过，Intel的要到明年才会出货。...PC版：https://www.cnbeta.com.tw/articles/soft/1342445.htm手机版：https://m.cnbeta.com.tw/view/1342445.htm

导入CDNA3架构、192GB记忆体，AMD新资料中心GPU来了

导入CDNA3架构、192GB记忆体，AMD新资料中心GPU来了https://www.ithome.com.tw/review/160523相较于上一代产品MI250X，MI300X的运算单元数量增加幅度逼近40％（304个对上220个），记忆体容量达到1.5倍（192GBHBM3对上128GBHBM2e），记忆体最大频宽为1.7倍（5.3TB/s对上3.2TB/s）；在资料型别上，MI300X可支援FP8与稀疏（sparsity）等数学计算，种种新增与强化特色，皆为了支撑AI与高效能运算类型的工作负载而来。———生成式AI就绪英特尔发布第五代至强可扩展处理器https://www.ithome.com/0/741/410.htm第五代英特尔®至强®可扩展处理器的核心数量增加至64个，配备了高达320MB的L3缓存和128MB的L2缓存。不论单核性能还是核心数量，它相比以往的至强都有了明显提升。在最终性能指标上，与上代产品相比，在相同功耗下平均性能提升21%,内存带宽提升高达16%,三级缓存容量提升到了原来的近3倍。；更为重要的是，第五代至强®可扩展处理器的每个内核均具备AI加速功能，完全有能力处理要求严苛的AI工作负载。与上代相比，其训练性能提升多达29%,推理能力提升高达42%。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人