最新全球超级计算机TOP500：美国Frontier蝉联第一

最新全球超级计算机TOP500：美国Frontier蝉联第一据介绍，Frontier以1.194EFlop/s的HPL得分继续保持领先地位，期搭载了基于最新的HPECrayEX235a架构的AMDEPYC64C2GHz处理器，目前共有8699904个CPU和GPU核心。此外，Frontier还具有高达52.59GFlops/W的额定能效，并可借助于HPE的Slingshot11网络进行数据传输。位居第二的则是美国阿贡领导计算中心Aurora系统，其以585.34PFlop/s的HPL得分杀入榜单，Aurora目前共配备21248个英特尔Max系列CPU和63744个英特尔Max系列GPU。不过目前其仅部署了计划最终规模的一半，据称Aurora在建设完成后峰值性能可达2EFlop/s，超越Frontier。排名第三的则是安装于微软美国Azure云中的Eagle，其HPL分数为561.2PFlop/s，这也是云系统取得的最高排名，基于英特尔至强铂金8480C处理器和英伟达H100打造。来自中国的神威·太湖之光超级计算机排名第11，其HPL分数为93.01PFlop/s；天河二A超算也在本次榜单中排行第14。...PC版：https://www.cnbeta.com.tw/articles/soft/1396799.htm手机版：https://m.cnbeta.com.tw/view/1396799.htm

在Telegram中查看

相关推荐

未完工的英特尔Aurora超级计算机首次登上TOP500排行榜第2位

未完工的英特尔Aurora超级计算机首次登上TOP500排行榜第2位Aurora项目自成立以来一直在拖延，其目标是通过第四代至强可扩展Max"蓝宝石激流"处理器和英特尔数据中心GPUMax系列硬件的组合，实现峰值双精度计算能力超过两个exaFLOPS。但就其首次亮相而言，在系统尚未完全扩展的情况下，其峰值为585.34petaFLOPS...对于那些希望它能在秋季TOP500世界最快超级计算机排名中及时全面亮相的人来说，这远远达不到它的全部能力。Aurora由10624个计算刀片组成，共配备21248个英特尔至强Max系列CPU和63744个英特尔Max系列GPU。主要硬件已于今年早些时候在ANL安装完毕，但英特尔及其工程合作伙伴仍在继续努力扩大系统规模并对软件进行微调。由于今年秋季提交给TOP500榜单的并非完整的超级计算机，因此它仅以半exaFLOP的成绩排名第二。采用AMD处理器的Frontier超级计算机以1.1exaFLOPS的成绩继续保持榜首位置，并成为排名中唯一的exaFLOP超级计算机。不过，TOP500榜单上有23个新系统采用了英特尔硬件。这些新的英特尔超级计算机包括英国Dawn超级计算机的第一期、德国SuperMUC-NG的第二期以及阿拉马斯国家实验室的Crossroads。Aurora超级计算机的首次亮相使富士通与日本理化学研究所采用A64FX处理器的"富岳"超级计算机跌至第三位。与此同时，AMD也在其通讯中宣传，AMD目前为TOP500榜单中的140台超级计算机提供算力，而Frontier仍然排名第一，是唯一一台超过exaFLOP大关的超级计算机。在绿色500榜单中，Frontier也名列第8位。AMD还指出，Aurora提交的部分数据已经比整个Frontier超级计算机的功率还要大，而性能等级却低得多。另一则有趣的轶事是，在绿色500榜单上效率最高的前十台超级计算机中，有八台都是AMD提供的算力。最新的TOP500榜单可从TOP500.org获取：https://www.top500.org/...PC版：https://www.cnbeta.com.tw/articles/soft/1396681.htm手机版：https://m.cnbeta.com.tw/view/1396681.htm

全球Top500超算公布：Frontier蝉联第一中国超算不再参加测试

全球Top500超算公布：Frontier蝉联第一中国超算不再参加测试Frontier蝉联第一，Aurora排名第二在Top500超算榜单中，前十大性能最强超级计算机的排名基本上与六个月前在SC23会议期间公布的排名保持一致。唯一的新进前10的超级计算机是来自瑞士国家超级计算中心（CSCS）的Alpsmachine，排名第6名位。具体前十名单如下：1、Frontier以1.206EFlop/s的HPL性能继续蝉联第一。该超算位于美国田纳西州的橡树岭国家实验室（ORNL），由美国能源部（DOE）运营。其采用了HPECrayEX235a架构，2GHzAMDEPYC64CCPU和AMDInstinct250XGPU，共有8699904个CPU和GPU核心，并借助于Slingshot11网络进行数据传输。此外，Frontier还具有高达52.59GFlops/W的额定能效，2、Aurora以1.012Exaflop/s的HPL性能排名第二。相比去年首次上榜时（当时未全部安装完成）性能几乎翻了一倍。该超算安装在美国伊利诺伊州的阿贡国家实验室，也是由美国能源部运营。Aurora基于HPECrayEX网络，整合了21248个IntelXeonMax系列CPU、63744个IntelMax系列GPU、20.42PB内存，峰值性能号称可达2EFlop/s，远超Frontier。3、Eagle以561.2PFlop/s的HPL性能排名第三。该超算安装在微软Azure云平台上，并且它依然是Top500超算中最高排名的云计算系统。这款微软NDv5系统的强大性能，源于英特尔XeonPlatinum8480C处理器和英伟达(NVIDIA)H100GPU加速器的结合。4、Fugaku凭借其442PFlop/s的HPL性能排名第四。该超算安装在日本神户的理研计算科学研究中心（R-CCS），基于2.2GHzFujitsuA64FX48C处理器，TofuinterconnectD互联，共计拥有7630848个核心，继续保持了美国以外地区排名最高的超级计算机的地位。5、LUMI以379.7PFlop/s的HPL性能排名第五。该超算安装在芬兰CSCEuroHPC中心，是欧洲最强的超级计算机，其基于HPECrayEX235a系统，AMD第三代EPYC64C2GHz处理器，AMDInstinctMI250X加速器，Slingshot-11网络、6、Alps以270PFlop/s的HPL性能排名第六。该超算安装于瑞士国家超级计算中心(CSCS)，基于HPECray254n系统构建的超算，3.1GHzNVIDIAGrace72C处理器，NVIDIAGH200超级芯片，Slingshot-11网络互联。7、Leonardo以241.2PFlop/s的HPL性能排名第七。该超算安装在意大利CINECA的EuroHPC，基于AtosBullSequanaXH2000系统，由英特尔XeonPlatinumCPU和NVIDIAA100加速器提供强大的计算能力，还采用了四轨NVIDIAHDR100Infiniband。8、MareNostrum5ACC以175.3PFlop/s的HPL性能排名第八。该超算安装在西班牙的EuroHPC/巴塞罗那超级计算中心，基于BullSequanaXH3000系统，采用了英特尔XeonPlatinum8460Y处理器、NVIDIAH100加速器以及InfinibandNDR200网络连接技术。9、Summit以148.6PFlop/s的HPL性能排名第九。该超算是IBM公司在美国橡树岭国家实验室建造的超级计算机，拥有4356个节点，每个节点配备了两个22核的3.07GHzIBMPOWER9CPU和六个NVIDIATeslaV100GPU，每个GPU上集成了80个流式处理器（SM）。10、Eos以121.4PFlop/s的HPL性能排名第十。该超算是英伟达内部使用的DGXSuperPOD，由XeonPlatinum8480C56C3.8GHz，NVIDIAH100加速器共同驱动，还采用了英伟达InfinibandNDR400G交换机。对于排名第二的Aurora超算实际测试性能仅1.012ExaFlop/s，远低于号称性能最高可达2EFlop/s的问题，阿贡国家实验室的副主任兼杰出研究员RickStevens表示，2exaFLOPS这一数值是基于Aurora核心处理器数量与处理器峰值性能相乘得出的理论峰值，但这并非负责维护和运营Aurora的阿贡系统经理所设定的实际性能目标或期望。Stevens解释说：“峰值性能是一个通过计算得出的理论数字，它基于时钟速率与单个计算元件运算次数的乘积。实际上，典型的系统只能达到这个峰值的一小部分，这取决于它们所执行的任务，通常在50%、60%或70%之间。Aurora上标称的2exaFlop/s峰值实际上是结合了GPU和CPU的FLOPS得出的。在基准测试中，通常不会这样做。如果查看Top500榜单中其他类似的系统，就会发现它们同样拥有非常大的理论峰值，但实际达到的峰值比例与Aurora类似。因此，这并不是一个根本性的问题。”Stevens表示，Aurora在基准测试中应该能够实现LINPACK性能的提升，因为在最近的基准测试执行时，Aurora的11%计算能力尚未被激活。他预测，当整个系统安装完成之后，将会产生更高的基准测试数据。然而，他拒绝透露阿贡国家实验室对于Aurora在完全运行状态下的具体性能目标数字。根据HPC-AI行业分析机构HyperionResearch公司的首席执行官EarlJoseph的预计，随着时间的推移和系统的进一步调优，Aurora最终将会超过1.5exaFlop/s。中国不再参加Top500的HPL基准测试在中国的国家级超算去年跌出Top500榜单前十之后，依然无缘于最新的前十榜单。在去年的榜单上，中国的神威·太湖之光和天河二号A也进入了前十五，分别排名第11和第14位。Top500组织在最新发布的报告中指出，中国已决定不再参加Top500的HPL基准测试。在最新的Top500名单中，美国依然是拥有超级计算机数量最多的国家。美国在其之前的基础上新增了7台超级计算机，使得其总数达到了168台。而中国则从104台减少到了80台。Top500组织表示，“事实上，中国在这份新名单上并未报告任何新加入的超级计算机。”从大的区域变化来看，北美地区依然保持领先地位，从上一份榜单的160台系统增加到171台。而亚洲地区则出现了下滑，从169台系统减少到148台。与此同时，欧洲地区实现了显著的增长，从143台增加到160台，位列北美地区之后，成为了全球第二大超级计算机分布区域。英特尔拿下63%的处理器份额Top500组织表示，此次前500强的超算当中，采用英特尔CPU的占比依然是高达63.00%，虽然低于六个月前的67.80%。相比之下，前500强超算当中，有156个系统（31.20%）使用的AMD处理器，高于六个月前的28.00%。另外，还有194个超算系统使用了加速器/协处理器技术，高于六个月前的185个。其中有83个使用了NVIDIAAmpereGPU，48个使用NVIDIAVoltaGPU。从总算力来看，所有Top500超算的的总综合性能从6个月前的7.01ExaFlop/s（EFlop/s）提高到现在的8.21ExaFlop/s。Top100的性能门槛达到了9.44PFlop/s。从核心数量来看，TOP500超算的平均并发级别达到了每个系统229426个内核，高于六个月前的212027个。Green500超算今年的超级计算机Green500榜单也有了显著的变化，前三名的绿色超级计算机均为新上榜者。排名第一的是JEDI–JUPITERExascaleDevelopmentInstrument，这台超级计算机由德国的EuroHPC/FZJ开发。在TOP500超级计算机排名中，JEDI位列第190位，展现出了不俗的性能实力。其能效评级高达72.73GFlop/W，HPL得分为4.5PFlop/s。JEDI是一款配备NVIDIAGraceHopperSuperchip72C的BullSequanaXH3000架构的超级计算，总共有19584个核心处理器。英国布里斯托尔大学的Isambard-AI以68.83GFlop/W能效评级和7.42PFLop/s的HPL得分位居第二。Isambard-AI在TOP500中排名第129位，拥有34,272个核心处理器。排名第三的是来自波兰Cyfronet的Heliossystem。该机器的能效得分为66.95GFlop/WHPL得分为19.14PFlop/s。Top500组织在讨论能源效率时，还特别提到了Top500榜单第一的Frontier系统。Frontier系统取得了1.206EFlop/s的HPL成绩，这一成绩证明了其优秀的计算能力。同时，Frontier在能源效率方面也表现出色，获得了56.97GFlop/W的分数。这使得Frontier在Green500榜单中排名第11位。...PC版：https://www.cnbeta.com.tw/articles/soft/1431648.htm手机版：https://m.cnbeta.com.tw/view/1431648.htm

Aurora超级计算机安装完毕：2个ExaFLOPS 数万个CPU和GPU 锁定Top 500榜首

Aurora超级计算机安装完毕：2个ExaFLOPS数万个CPU和GPU锁定Top500榜首"Aurora是英特尔Max系列GPU的首次部署，是最大的基于XeonMaxCPU的系统，也是世界上最大的GPU集群，"英特尔公司副总裁兼超级计算组总经理JeffMcVeigh说。Aurora超级计算机看起来相当令人印象深刻，即使从数字上看也是如此。该机器由21248个通用处理器提供动力，包含超过110万个内核，用于需要传统CPU马力的工作负载，还有63744个计算GPU，将用于人工智能和HPC工作负载。在内存方面，Aurora提供了1.36PB的封装HBM2E内存和19.9PB的DDR5内存，这些内存被CPU使用，以及PonteVecchi计算GPU携带的8.16PB的HBM2E。Aurora机器占用166个机架，每个机架容纳66个刀片。它横跨八列，占据的空间相当于两个篮球场，这还不算Aurora的存储子系统，后者采用了1024个全闪存存储节点，提供220TB的存储容量，总带宽为31TB/s。目前，阿贡国家实验室没有公布Aurora或其存储子系统的官方耗电数字。这台超级计算机将用于各种工作负载，从核聚变模拟到是否预测，从空气动力学到医学研究，它采用HPE的Shasta超级计算机架构和Slingshot互连。同时，在该系统通过ANL的验收测试之前，它将被用于大规模科学生成性AI模型。阿贡国家实验室副主任里克-史蒂文斯说："在我们努力实现验收测试的同时，我们将使用Aurora来训练一些大规模的开源科学生成性人工智能模型。Aurora拥有超过6万个英特尔MaxGPU，一个非常快的I/O系统和一个全固态大容量存储系统，是训练这些模型的完美环境。"尽管Aurora刀片已经安装完毕，这台超级计算机仍需进行并通过一系列验收测试，这是超级计算机的一个常见程序。一旦它成功通过这些测试并在今年晚些时候上线，预计它的理论性能将超过2ExaFLOPS（每秒20亿次浮点运算）。凭借巨大的性能，它有望确保在Top500榜单中占据榜首位置。Aurora超级计算机的安装标志着几个里程碑：它是业界第一台性能超过2ExaFLOPS的超级计算机和第一台基于英特尔的ExaFLOPS级机器。Aurora最初于2015年亮相，最初打算由英特尔的XeonPhi协处理器提供动力，预计在2018年提供约180PetaFLOPS。然而，英特尔决定放弃XeonPhi，改用计算型GPU，导致需要与阿贡国家实验室重新谈判协议，在2021年之前提供一个EaaFLOPS系统。由于英特尔7纳米（现在称为英特尔4）生产节点的延迟，以及必须为台积电的N5（5纳米级）工艺技术重新设计计算模组，该系统的交付被进一步推迟，因为PonteVecchio的复杂情况。英特尔终于在去年年底推出了数据中心GPUMax产品，现在已经向ANL运送了超过6万个这种计算GPU。...PC版：https://www.cnbeta.com.tw/articles/soft/1366873.htm手机版：https://m.cnbeta.com.tw/view/1366873.htm

英特尔"Aurora"突破Exaflops障碍成为AI领域速度最快的超级计算机

英特尔"Aurora"突破Exaflops障碍成为AI领域速度最快的超级计算机由英特尔、阿贡国家实验室（ArgonneNationalLaboratory）和HPE合作研发的Aurora超级计算机以585.34petaflops的部分系统运行速度排名第二。阿贡的早期科学计划取得了重大进展，该计划重点关注科学研究中的高性能计算和人工智能应用。图为安装团队成员在阿贡国家实验室的众多机架中穿行。(图片来源：阿贡国家实验室）Aurora超级计算机部署在阿贡国家实验室，由惠普企业公司（HPE）合作建造，有望成为高性能计算和人工智能领域表现最出色的产品之一。该平台由英特尔至强CPUMax和数据中心GPUMax系列提供支持，与AMD展开了激烈的竞争，后者成功地率先突破了Exaflops关卡。与此同时，尽管早在2019年就宣布了Aurora超级计算机，但它几乎没能达到预期目标，但如今，该系统的运行能力已达到87%，即总共9234个节点。在规格方面，Aurora超级计算机由166个机架组成，其中包括10624个刀片服务器、21248个英特尔至强CPUMax芯片（第四代）和63744个英特尔数据中心GPUMax系列单元（PonteVecchio）。它基于HPEslingshot光纤架构进行互连，使用84992个端点。在性能指标方面，Aurora超级计算机在HPLLINPACK基准测试中名列第二，但仅用了总节点容量的87%（9234个节点对10624个节点）就达到了1.012exaflops，成功突破了1Exaflops障碍。在HPCG测试中，该系统也以5612TFLOPs/second的成绩排名第三，仅使用了系统的39%。利用Xe核心架构及其多个人工智能硬件模块，曙光超级计算机目前在人工智能性能排行榜上名列第一，额定总性能为10.6AIExaflops。该性能使用LINPACK混合精度（HPL-MxP）基准进行测量。采用英特尔至强CPUMax系列和英特尔数据中心GPUMax系列技术部署的新型超级计算机彰显了英特尔推进高性能计算和人工智能的目标。这些系统包括欧洲-地中海气候变化中心（CMCC）的Cassandra，用于加速气候变化建模；意大利国家新技术、能源和可持续经济发展局（ENEA）的CRESCO8，用于实现核聚变能源的突破；德克萨斯高级计算中心(TACC)，该中心已全面投入使用，可对超音速湍流进行生物数据分析，并对多种材料进行原子模拟；以及英国原子能管理局(UKAEA)，用于解决未来核聚变发电厂设计中的内存约束问题。混合精度人工智能基准测试的结果将为英特尔面向人工智能和高性能计算的下一代GPU（代号为FalconShores）奠定基础。FalconShores将利用下一代英特尔Xe架构和英特尔高迪的最佳性能。这种集成实现了统一的编程接口。英特尔至强6的早期性能结果显示，与上一代产品相比，配备P核和多路复用器组合级（MCR）内存（8800MT/s）的实际高性能计算应用（如欧洲海洋建模核心（NEMO））的性能提高了2.3倍，为成为高性能计算解决方案的首选主机CPU奠定了坚实的基础。...PC版：https://www.cnbeta.com.tw/articles/soft/1430710.htm手机版：https://m.cnbeta.com.tw/view/1430710.htm

Frontier 再次登顶 Top500 超算榜单

Frontier再次登顶Top500超算榜单Top500项目公布了最新的超算榜单，美国田纳西州橡树岭国家实验室（ORNL）的Frontier超算去年初成为第一个真正突破Exascale大关的超算，它再次高居榜首。Frontier由HPECrayEX制造，使用AMDEPYC64C2GHz处理器，共8,699,904个核心，峰值性能1.194Exaflop/s。日本的ARM超算富岳排在第二位，性能442petaflops。芬兰欧洲超算中心的新超算LUMI排在第三位，同样使用第三代AMDEPYC处理器，共2,220,288个核心，性能309petaflops。第四是意大利超算Leonardo，性能174petaflops，第五IBMSummit（148.6petaflops），之后是IBMSierra，神威太湖之光，Perlmutter，英伟达超算Selen，天河二号A。排名前十的超算和去年下半年完全相同。有四台使用了AMDEPYC处理器，两台使用IBMPower处理器，ARM处理器一台，申威处理器一台，两台使用了英特尔的至强处理器。在Top500中，美国有150台，中国134台，德国36台，日本33台，法国24台。联想制造的超算数量最多168台，其次是HPE的100台，浪潮的43台。来源，来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

ORNL的Exaflop超算Frontier保持领先地位新的竞争者Leonardo进军前十

ORNL的Exaflop超算Frontier保持领先地位新的竞争者Leonardo进军前十除此之外，Frontier在衡量混合精度计算性能的HPL-MxP基准上表现出了7.94EFlop/s的得分。Frontier基于HPECrayEX235a架构，装备的是AMDEPYC64C2GHz处理器。该系统有8,730,112个内核，功率效率等级为52.23千兆/瓦。它还依靠千兆位以太网进行数据传输。Frontier是通向exascale竞赛的明显赢家，后续计算机行业需要大量的工作和创新才能把它从头把交椅上打下来。日本神户Riken计算科学中心（R-CCS）的Fugaku系统在被Frontier机器挤下来之前，曾连续两年占据榜首。凭借0.442EFlop/s的HPL得分，Fugaku保留了其在之前榜单中的第2位。LUMI系统在最新的名单中保留了第三的位置，然而，该系统经历了一次重大升级以保持其竞争力。这次升级使机器的尺寸增加了一倍，这使得它的HPL得分变成了0.309EFlop/s。唯一登上榜首的新机器是位于意大利博洛尼亚的EuroHPC/CINECA的第4号Leonardo系统，这台超算以1,463,616个内核取得了0.174EFlop/s的HPL得分。以下是排名前十的系统的摘要：Frontier是TOP500中排名第一的系统。这个HPECrayEX系统是美国第一个性能超过1EFlop/s的系统。它被安装在美国田纳西州的橡树岭国家实验室（ORNL），为能源部（DOE）运营。目前，它使用8,730,112个内核实现了1.102EFlop/s。新的HPECrayEX架构结合了为HPC和AI优化的第三代AMDEPYCCPU，以及AMDInstinct250X加速器和Slingshot-10互连。Fugaku现在是全球第2号超算系统，安装在日本神户的RIKEN计算科学中心（R-CCS）。它有7,630,848个内核，这使它能够达到442Pflop/s的HPL基准得分。升级后的LUMI系统是另一个HPECrayEX系统，安装在芬兰CSC的EuroHPC中心，以309.1Pflop/s的性能排名第三。欧洲高性能计算联合项目（EuroHPCJU）正在汇集欧洲资源，开发用于处理大数据的顶级Exascale超级计算机。泛欧Exascale前超级计算机之一LUMI位于CSC在芬兰Kajaani的数据中心。新的4号系统Leonardo安装在意大利CINECA的另一个EuroHPC站点。它是一个AtosBullSequanaXH2000系统，主处理器为XeonPlatinum835832C2.6GHz，加速器为NVIDIAA100SXM440GB，互连系统为Quad-railNVIDIAHDR100Infiniband。它的Linpack性能达到了174.7Pflop/s。Summit是IBM在美国田纳西州橡树岭国家实验室（ORNL）建造的一个系统，现在以HPL基准的148.8Pflop/s的性能列在全球第5位，该基准用于对TOP500名单进行排名。Summit有4356个节点，每个节点有两个POWER9CPU，每个有22个内核，还有6个NVIDIATeslaV100GPU，每个有80个流式多处理器（SM）。这些节点通过Mellanox双轨EDRInfiniBand网络连接在一起。美国加州劳伦斯-利弗莫尔国家实验室的Sierra系统位列第6。其架构与5号系统的Summit非常相似。它由4320个节点组成，有两个POWER9CPU和四个NVIDIATeslaV100GPU。Sierra达到了94.6Pflop/s。神威-太湖之光是由中国国家并行计算机工程技术研究中心（NRCPC）开发的系统，安装在位于中国江苏省无锡市的国家超级计算中心，以93Pflop/s的速度列在第7位。排在第8位的Perlmutter是基于HPECray"Shasta"平台和一个由基于AMDEPYC的节点和1,536个NVIDIAA100加速节点组成的异质系统。Perlmutter达到了64.6Pflop/s排在第9位的Selene是一个NVIDIADGXA100SuperPOD，在美国的NVIDIA公司内部安装。该系统基于AMDEPYC处理器，采用NVIDIAA100进行加速，并采用MellanoxHDRInfiniBand作为网络，达到63.4Pflop/s。由中国国防科技大学（NUDT）开发并部署在中国广州国家超级计算机中心的天河-2A（MilkyWay-2A）系统现在以61.4Pflop/s的成绩被列为第10位。...PC版：https://www.cnbeta.com.tw/articles/soft/1332851.htm手机版：https://m.cnbeta.com.tw/view/1332851.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人