NVIDIA自研4nm CPU跑分超越阿里128核CPU登顶第一

NVIDIA自研4nmCPU跑分超越阿里128核CPU登顶第一在自研CPU上,NVIDIA去年就公布了GraceCPU服务器处理器,这是一款高达144核的ARM处理器,日前在hotchips会议上NVIDIA又公布了Grace的架构细节及跑分,SPECrate2017_int_base最高可达740分,不仅超过了AMD及Intel的x86旗舰,也超过了前不久拿下第一的阿里倚天710处理器。GraceCPU之前说是5nm工艺,现在确认是5nm改良版的4nm定制版,单核心可达72核,双芯下可达144核,L3缓存117MB(双芯下234MB),内部芯片互联带宽可达3.2TB/s,支持68路PCIe5.0,支持16通道LPDDR5X内存,带宽超过1TB/s,C2C-NVlink总线带宽高达900GB/s,是PCIe5.0的7倍性能,5倍能效。此外,NVIDIA还公布了GraceCPU的性能,单芯72核的SPECrate2017_int_base性能是370分,双芯下可达740分,并行效率非常高,基本上是线性提升。这个性能是什么概念呢?hardwarexxx网站汇总了多个SPECrate2017_int_base分数,AMD及Intel的36核或者64核x86处理器,同时也超过了阿里的倚天710。740分的SPECrate2017_int_base性能是目前最高的,不仅遥遥领先倚天710是阿里自研的5nm128核ARM服务器处理器,之前以510分的成绩成为SPECrate2017_int_base第一,现在被NVIDIA的144核CPU超越了也是正常,毕竟在内存及互连架构上NVIDIA的设计更恐怖。PC版:https://www.cnbeta.com/articles/soft/1307053.htm手机版:https://m.cnbeta.com/view/1307053.htm

相关推荐

封面图片

NVIDIA Grace处理器详情公布:功耗500W、性能不及Zen2

NVIDIAGrace处理器详情公布:功耗500W、性能不及Zen2NVIDIA设计CPU产品已经有段时间了,不过Tegra从手机、平板到盒子折腾一番后,最终发现自己的归宿在汽车自动驾驶以及任天堂Switch游戏机上。抛开Tegra,NVIDIA在今年的GTC2022上还公布了名为Grace的处理器,主要用于服务器、高性能计算等领域。在本次HotChips34大会上,NV公布了Grace的更多详情,感兴趣的不妨了解下。据悉,Grace处理器采用台积电4nm工艺制造,72核ARMv9指令集架构。注意,NV不是直接套用的ARMCortex公版(比如X1/X2、A710等),而是和苹果一样,纯自行研制CPU核。因为NVIDIA只卖两种Grace处理器集成方案,一是两颗CPU的双芯平台,一是GraceCPU+HopperGPU的联合平台,所以一套系统就能做到144核规模。此外,处理器还支持最大512GB的LPDDR5X内存(ECC),提供68条PCIe5.0通道,三级缓存多达117MB。性能方面,72核在Spec_Int中可拿到370分,大约是AMDEPYC7742的一半水平(128核Zen2)。PC版:https://www.cnbeta.com/articles/soft/1308339.htm手机版:https://m.cnbeta.com/view/1308339.htm

封面图片

1.8万核心GPU、144核心CPU NVIDIA大杀器将揭开面纱

1.8万核心GPU、144核心CPUNVIDIA大杀器将揭开面纱HotChips年度芯片行业盛会将在本月底举行,Intel、AMD、NVIDIA和众多业内芯片巨头都将拿出各家的拳头产品,秀秀肌肉。NVIDIA这次会有多场分享,重点覆盖HopperGPU计算加速器、GraceCPU服务器处理器、NVLink高速总线,届时会有多位高级工程师分享内部架构设计、性能数据。HopperGPU采用定制版台积电4nm工艺、全新架构,集成多达800亿个晶体管、18432个CUDA核心、576个Tensor核心,支持6144-bit位宽的80GBHBM3/HBM2e高带宽内存,并支持PCIe5.0、第四代NVLIink,性能号称四倍于上代A100,功耗最高700W。GraceCPU采用双芯合体设计,攻击144个Arm架构核心,集成396MB缓存,支持LPDDR5XECC内存,带宽达1TB/s,同样支持PCIe5.0,功耗500W。NVIDIA还打造了一颗超级芯片,HopperGPU、GraceCPU二合一,通过NVLink-C2C高速总线互连,带宽达900GB/s。PC版:https://www.cnbeta.com/articles/soft/1306753.htm手机版:https://m.cnbeta.com/view/1306753.htm

封面图片

NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心

NVIDIA144核心超级CPU揭秘:3.5倍能效碾压AMD128核心GraceCPU二合一GraceCPU+HopperGPU二合一它通过NVLink-C2C芯片间互连总线,将两颗GraceCPU整合在一块基板上,彼此之间的双向带宽多达900GB/s。GraceCPU基于Armv9-A9.0架构、NeoverseV264位内核,以4个128-bit功能单元的方式配置了两组SIMD矢量指令集,一是SVE2(缩放矢量扩展第二版),二是NEON(高级SIMD)。它还支持LSE(大型系统扩展),可提供低成本的原子操作,改进CPU通信吞吐。NVIDIA声称,这种核心的能效,是如今服务器常见x86核心的2倍。GraceCPU单颗集成72个核心,互相通过3.2TB/s超高带宽的NVIDIA缩放一致性Fabric总线互连,而二合一的超级芯片上就是144个核心。每核心64KB一级指令缓存、64KB一级数据缓存、1MB二级缓存,一颗超级芯片的所有核心共享234MB三级缓存。内存整合封装了LPDDR5X,最大容量960GB,最高带宽1TB/s(每一颗500GB/s),还支持ECC。对比传统的八通道DDR5,这种设计不但带宽高出53%,单位功耗也只有1/8。对比海量带宽的HBM2e,单位成本只有1/3,容量则可达8倍。扩展支持八组PCIe5.0x16,总带宽1TB/s,还有用于管理的低速PCIe通道。性能方面,一颗超级芯片的FP64双精度峰值浮点性能可达7.1TFlops(每秒7.1万亿次计算),热设计功耗500W。NVIDIA对比了AMDZen3架构的霄龙776364核心,双路组成128核心,号称性能可领先1.5-2.5倍,能效可领先2.0-3.5倍!当然,AMD已经有了Zen4架构、最多96核心的霄龙9004系列,NVIDIAGrace依然还没有商用。...PC版:https://www.cnbeta.com.tw/articles/soft/1340283.htm手机版:https://m.cnbeta.com.tw/view/1340283.htm

封面图片

NVIDIA发布AI超算DGX GH200:144TB内存、1.8万核CPU

NVIDIA发布AI超算DGXGH200:144TB内存、1.8万核CPUAI运算对内存容量的要求更高,所以DGXGH200通过最新的NVLink、NVLinkSwitch等技术连接了256块GraceHooper超级芯片,实现了极为夸张的性能及内存。GraceHooper我们之前报道过,这是一块CPU+GPU合体的超级芯片,CPU是NVIDIA自研的72核处理器,NeoverseV2内核,拥有480GBLPDDR5内存,512GB/s带宽。GPU部分是H100,FP64性能34TFLOPS,但更强的是INT8性能,AI运算能力达到了3958TFLOPS,带96GBHBM3内存。GH200总计有256块GraceHooper芯片,因此总计18432个CPU核心,144TBHBM3内存,AI性能达到了1exaFLOPS,也就是100亿亿次。这是什么概念,当前最强的TOP500超算也就是百亿亿次性能,只不过这个性能是HPC计算的,NVIDIA的是百亿亿次AI性能。为了让256个超级芯片互联,GH200还使用了256块单口400Gb/sInfiniBand互联芯片,256个双口200Gb/sInfiniBand芯片,还有96组L1NVLink、36组L2NVLink开关等等,设计非常复杂。NVIDIA表示,谷歌、Meta及微软是首批获得DGXH200系统的公司,后续他们还会开放给更多客户,运行客户定制。不过DGXH200还不是最强的,NVIDIA今年晚些时候会推出名为NVIDIAHelios的AI超算系统,由4组GH200组成,总计1024个GraceHooper超级芯片,576TBHBM内存。...PC版:https://www.cnbeta.com.tw/articles/soft/1362277.htm手机版:https://m.cnbeta.com.tw/view/1362277.htm

封面图片

俄罗斯自研16nm 48核处理器成功装机

俄罗斯自研16nm48核处理器成功装机6路72bit存储接口,支持最大768GBDDR4-3200ECC内存,5路PCIe4.0x16,一个USB2.0控制器,两个千兆接口,还有SATA、U.2硬盘接口等。据了解,Baikal-S1000采用台积电16nm工艺制造,但因为地缘冲突,现在没有后续供货了。甚至这张主板上的处理器,还是非量产版本。...PC版:https://www.cnbeta.com.tw/articles/soft/1339473.htm手机版:https://m.cnbeta.com.tw/view/1339473.htm

封面图片

Intel CPU将实现10年来最大升级:首次128核+“3nm EUV”

IntelCPU将实现10年来最大升级:首次128核+“3nmEUV”在桌面级处理器上,AMD多年来一直在多核上有优势,不过12代酷睿开始,Intel通过P、E核异构实现了反超,13代酷睿做到了24核32线程,核心数已经超过了锐龙7000的最大16核。在服务器处理器上,AMD优势更大,64核128线程的都用了两代了,Zen4这一代的Genoa做到了96核192线程,明年还有Bergamo系列,最多128核256线程。PC版:https://www.cnbeta.com/articles/soft/1328399.htm手机版:https://m.cnbeta.com/view/1328399.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人