1000+亿晶体管怪物 Intel GPU Max诞生一年半就被放弃

1000+亿晶体管怪物IntelGPUMax诞生一年半就被放弃据最新曝料,Intel已经告知合作伙伴,GPUMax系列将逐步停产退市,IntelAI加速器的重点将放在Guadi2/3系列,还有明年的第二代GPUMaxFalconShores。PonteVecchioGPUMax当年是RajaKoduri力推的项目,采用了5种不同制造工艺、47个不同模块,晶体管数量超过1000亿个,配备最多128个Xe-HPC高性能计算核心、128个光追核心、64MB一级缓存、108MB二级缓存、128GBHBM高带宽内存,满血功耗600W。Gaudi3则是独立的AI加速器,不久前刚刚发布,升级台积电5nm工艺,配备了8个矩阵引擎、64个张量核心、96MBSRAM缓存、1024-bit128GBHBM2E内存,满血功耗达900W。Intel声称,它相比上代拥有2倍的FP8AI算力、4倍的BF16AI算力、2倍的网络带宽、1.5倍的内存带宽,而对比NVIDIAH100LLM推理性能领先50%、训练时间快40%。针对中国市场,Gaudi3将提供特殊版本,功耗最高限制在450W。FalconShores最初规划融合CPU、GPU,就像AMDInstinctMI300A,但后来改为纯GPU方案,融合设计则后续再说。...PC版:https://www.cnbeta.com.tw/articles/soft/1430996.htm手机版:https://m.cnbeta.com.tw/view/1430996.htm

相关推荐

封面图片

450W功耗 Intel顶级GPU突然生变 只为卖到中国?

450W功耗Intel顶级GPU突然生变只为卖到中国?顶级型号Max1550具备满血的128个Xe-HPC核心、128个光追核心、64MB一级缓存、408MB二级缓存、128GBHBM高带宽内存,最高功耗600W,最多八卡并联。本次取消的是次级型号Max1350,112核心,96GB内存,450W功耗。它下边还有个Max1100,56核心,48GB内存,300W功耗,最多四卡并联。Intel表示,Max1550原本是针对液冷设计的,但已经成功进行风冷部署,这就和Max1350的定位产生了冲突,因此将其取消,改为再推出一款新的Max1450,液冷、风冷均可,今年晚些时候正式推出。Intel没有透露Max1450的具体规格,但有趣的是,Intel特别提到它将会降低IO带宽。这不由得让我们想起美国对华禁售NVIDIAA100/HH100这样的高性能GPU之后,出现了削减带宽的版本A800、H800,可以正常卖给中国。难道,Intel是为中国市场特意准备的Max1450?另外值得一提的是,Intel原计划在今年推出下一代高性能GPURialtoBridge,2024年再发布全新XPUFalconShores,同时集成x86CPU、XeGPU,但最近决定取消RialtoBridge,改为在2025年直接发布FalconShores。AMD则会在今年发布InstinctMI300,首次集成CPU、GPU,5nm工艺,1460亿个晶体管,24个Zen4CPU核心,未知数量CDNA3GPU核心,8192-bit128GBHBM3内存。NVIDIA方面准备了超级芯片GraceHopper,前者基于Arm架构,也整合HBM内存。高性能计算GPU的竞争是越来越激烈了。...PC版:https://www.cnbeta.com.tw/articles/soft/1354161.htm手机版:https://m.cnbeta.com.tw/view/1354161.htm

封面图片

Intel发布Gaudi 3 AI加速器:4倍性能提升、无惧1800亿参数大模型

Intel发布Gaudi3AI加速器:4倍性能提升、无惧1800亿参数大模型数据显示,预计到2030年,全球半导体市场规模将达1万亿美元,AI是主要推动力,不过在2023年,只有10%的企业能够成功将其AIGC项目产品化。Intel的最新解决方案,有望帮助企业应对推广AI项目时所面临的挑战,加速实现AIGC落地商用。Intel现有的Gaudi2诞生于2022年5月,并于2023年7月正式引入中国,拥有极高的深度学习性能、效率,以及极高的性价比。它采用台积电7nm工艺制造,集成24个可编程的Tenor张量核心(TPC)、48MBSRAM缓存、21个10万兆内部互连以太网接口(ROCEv2RDMA)、96GBHBM2E高带宽内存(总带宽2.4TB/s)、多媒体引擎等,支持PCIe4.0x16,最高功耗800W,可满足大规模语言模型、生成式AI模型的强算力需求。新一代的Gaudi3面向AI训练和推理,升级为台积电5nm工艺,带来了2倍的FP8AI算力、4倍的BF16AI算力、2倍的网络带宽、1.5倍的内存带宽。对比NVIDIAH100,它在流行LLM上的推理性能领先50%、训练时间快40%。Gaudi3预计可大幅缩短70亿和130亿参数Llama2模型、1750亿参数GPT-3模型的训练时间。在Llama70亿/700亿参数、Falcon1800亿参数大型语言模型上,Gaudi3的推理吞吐量和能效也都非常出色。Gaudi3提供多种灵活的形态,包括OAM兼容夹层卡、通用基板、PCIe扩展卡,满足不同应用需求。Gaudi3提供开放的、基于社区的软件,以及行业标准以太网网络,可以灵活地从单个节点扩展到拥有数千个节点的集群、超级集群和超大集群,支持大规模的推理、微调和训练。Gaudi3AI加速器具备高性能、经济实用、节能、可快速部署等优点,能够充分满足复杂性、成本效益、碎片化、数据可靠性、合规性等AI应用需求。Gaudi3将于2024年第二季度面向OEM厂商出货,包括戴尔、慧与、联想、超威等。目前,IntelGaudi加速器的行业客户及合作伙伴有NAVER、博世(Bosch)、IBM、Ola/Krutrim、NielsenIQ、Seekr、IFF、CtrlSGroup、BhartiAirtel、LandingAI、Roboflow、Infosys,等等。此外,Intel还宣布联合Anyscale、DataStax、Domino、HuggingFace、KXSystems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、SAS、VMware、Yellowbrick、Zilliz等伙伴,共同创建一个开放平台,助力企业推动AI创新。该计划旨在开发开放的、多供应商的AIGC系统,通过RAG(检索增强生成)技术,提供一流的部署便利性、性能和价值。初始阶段,Intel将利用至强处理器、Gaudi加速器,推出AIGC流水线的参考实现,发布技术概念框架,并继续加强IntelTiber开发者云平台基础设施的功能。...PC版:https://www.cnbeta.com.tw/articles/soft/1426791.htm手机版:https://m.cnbeta.com.tw/view/1426791.htm

封面图片

Intel Gaudi 3 AI加速器可以卖给中国 但挥刀砍掉一半

IntelGaudi3AI加速器可以卖给中国但挥刀砍掉一半Intel声称,它相比上代拥有2倍的FP8AI算力、4倍的BF16AI算力、2倍的网络功耗为600W带宽、1.5倍的内存带宽,而对比NVIDIAH100LLM推理性能领先50%、训练时间快40%。Gaudi3的首发版本编号HL-325L,OAM形态,已经出货,功耗900W,风冷散热。它的中国特供版将在6月份推出,编号HL-328,功耗减半至450W,HMB内存、缓存、解码器等完全保留,但既然功耗少了一半,算力差不多也会被腰斩。10月份还会有个液冷版本HL-335,支持双路并联,但不能卖给中国,也没有特供版。PCIe扩展卡形态将在9月份出货,风冷,满血版编号HL-338,,中国特供版编号HL-388,功耗又被限制在450W。通用基板形态的编号为HLB-325,但具体规格和出货时间暂时不详。说起来,NVIDIA是最早做中国特供版AI加速器的,也就是H800、A800,后来也被禁售了,最近又拿出了H20、L20、L2、RTX4090D,都能卖。AMD也设计了特供版InstinctMI309、MI388X,但都被美政府以算力还是太强为由给打回,而年底将要升级到MI350。...PC版:https://www.cnbeta.com.tw/articles/soft/1427052.htm手机版:https://m.cnbeta.com.tw/view/1427052.htm

封面图片

Intel GPU号称领先NVIDIA 2.5倍?细看尴尬了

IntelGPU号称领先NVIDIA2.5倍?细看尴尬了HotChips34大会史昂,Intel又公布了PonteVecchioGPU高性能计算卡的更多细节,包括性能数据。PonteVecchioGPU基于全新的XeHPC高性能计算架构,使用5种不同制造工艺(Intel7和台积电N7/N5等)、多种封装技术,整合了多达47个不同计算模块,晶体管数量超1000亿个。它一个模块有128个Xe核心、128个光追单元、64MB一级缓存、408MB二级缓存、128GBHBM2e高带宽内存,支持PCIe5.0,可以四路甚至八路并联。Intel给出的最新数据声称,PonteVecchioFP32单精度、FP64双精度性能可达52TFlops,TF3.2浮点性能可达419TFlops,BF16、PF16浮点性能可达839TFlops,INT8整数性能则可达1678Tops。DataParallelC++(DPC++)测试项目中,PonteVecchio的性能相比于NVIDIAA100可以领先1.4-2.5倍。另外,ExaSMROpenMC计算性能可领先2倍,NekRS性能则领先0.3-1.7倍。当然,NVIDIA新一代的H100都已经发布了……PonteVecchio的使命是将联合下一代可扩展至强SapphireRapids,用于美国的首批三台百亿亿次超算之一Aorura,但不幸的是,SapphireRapids一再推迟,预计明年第二季度才能发布,PonteVecchio也一直没有量产上市。相比之下,AMD三代霄龙处理器、InstinctMI250X加速卡组成的Frontier已经上线运行,并以1.6EFlops的性能,成为当今(公开的)超算之王。PC版:https://www.cnbeta.com/articles/soft/1307421.htm手机版:https://m.cnbeta.com/view/1307421.htm

封面图片

1460亿晶体管超级APU AMD MI300下半年发布

1460亿晶体管超级APUAMDMI300下半年发布AMDCEO苏姿丰近日确认,InstinctMI300将在今年下半年正式推出。MI300采用多芯片、多IP整合封装设计,5nm先进制造工艺,晶体管数量多达疯狂的1460亿个!它同时集成CDNA3架构的GPU单元(具体核心数量未公开)、Zen4架构的24个CPU核心、大容量的InfinityCache无限缓存,还有8192-bit位宽、128GB容量的HBM3高带宽内存。技术方面支持第四代InfinityFabric总线、CXL3.0总线、统一内存架构、新的数学计算格式,号称AI性能比上代提升多达8倍,可满足百亿亿次计算需求。事实上,Intel一年前也宣布了类似的产品“FalconShores”(猎鹰海岸),称之为XPU,同时集成至强CPU、XeHPCGPU,以及下一代封装、内存、IO技术,号称能效、x86计算密度、内存容量与带宽都比现在提升5倍。不过,Intel的要到明年才会出货。...PC版:https://www.cnbeta.com.tw/articles/soft/1342445.htm手机版:https://m.cnbeta.com.tw/view/1342445.htm

封面图片

导入CDNA3架构、192GB记忆体,AMD新资料中心GPU来了

导入CDNA3架构、192GB记忆体,AMD新资料中心GPU来了https://www.ithome.com.tw/review/160523相较于上一代产品MI250X,MI300X的运算单元数量增加幅度逼近40%(304个对上220个),记忆体容量达到1.5倍(192GBHBM3对上128GBHBM2e),记忆体最大频宽为1.7倍(5.3TB/s对上3.2TB/s);在资料型别上,MI300X可支援FP8与稀疏(sparsity)等数学计算,种种新增与强化特色,皆为了支撑AI与高效能运算类型的工作负载而来。———生成式AI就绪英特尔发布第五代至强可扩展处理器https://www.ithome.com/0/741/410.htm第五代英特尔®至强®可扩展处理器的核心数量增加至64个,配备了高达320MB的L3缓存和128MB的L2缓存。不论单核性能还是核心数量,它相比以往的至强都有了明显提升。在最终性能指标上,与上代产品相比,在相同功耗下平均性能提升21%,内存带宽提升高达16%,三级缓存容量提升到了原来的近3倍。;更为重要的是,第五代至强®可扩展处理器的每个内核均具备AI加速功能,完全有能力处理要求严苛的AI工作负载。与上代相比,其训练性能提升多达29%,推理能力提升高达42%。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人