英特尔"Aurora"突破Exaflops障碍 成为AI领域速度最快的超级计算机

英特尔"Aurora"突破Exaflops障碍成为AI领域速度最快的超级计算机由英特尔、阿贡国家实验室(ArgonneNationalLaboratory)和HPE合作研发的Aurora超级计算机以585.34petaflops的部分系统运行速度排名第二。阿贡的早期科学计划取得了重大进展,该计划重点关注科学研究中的高性能计算和人工智能应用。图为安装团队成员在阿贡国家实验室的众多机架中穿行。(图片来源:阿贡国家实验室)Aurora超级计算机部署在阿贡国家实验室,由惠普企业公司(HPE)合作建造,有望成为高性能计算和人工智能领域表现最出色的产品之一。该平台由英特尔至强CPUMax和数据中心GPUMax系列提供支持,与AMD展开了激烈的竞争,后者成功地率先突破了Exaflops关卡。与此同时,尽管早在2019年就宣布了Aurora超级计算机,但它几乎没能达到预期目标,但如今,该系统的运行能力已达到87%,即总共9234个节点。在规格方面,Aurora超级计算机由166个机架组成,其中包括10624个刀片服务器、21248个英特尔至强CPUMax芯片(第四代)和63744个英特尔数据中心GPUMax系列单元(PonteVecchio)。它基于HPEslingshot光纤架构进行互连,使用84992个端点。在性能指标方面,Aurora超级计算机在HPLLINPACK基准测试中名列第二,但仅用了总节点容量的87%(9234个节点对10624个节点)就达到了1.012exaflops,成功突破了1Exaflops障碍。在HPCG测试中,该系统也以5612TFLOPs/second的成绩排名第三,仅使用了系统的39%。利用Xe核心架构及其多个人工智能硬件模块,曙光超级计算机目前在人工智能性能排行榜上名列第一,额定总性能为10.6AIExaflops。该性能使用LINPACK混合精度(HPL-MxP)基准进行测量。采用英特尔至强CPUMax系列和英特尔数据中心GPUMax系列技术部署的新型超级计算机彰显了英特尔推进高性能计算和人工智能的目标。这些系统包括欧洲-地中海气候变化中心(CMCC)的Cassandra,用于加速气候变化建模;意大利国家新技术、能源和可持续经济发展局(ENEA)的CRESCO8,用于实现核聚变能源的突破;德克萨斯高级计算中心(TACC),该中心已全面投入使用,可对超音速湍流进行生物数据分析,并对多种材料进行原子模拟;以及英国原子能管理局(UKAEA),用于解决未来核聚变发电厂设计中的内存约束问题。混合精度人工智能基准测试的结果将为英特尔面向人工智能和高性能计算的下一代GPU(代号为FalconShores)奠定基础。FalconShores将利用下一代英特尔Xe架构和英特尔高迪的最佳性能。这种集成实现了统一的编程接口。英特尔至强6的早期性能结果显示,与上一代产品相比,配备P核和多路复用器组合级(MCR)内存(8800MT/s)的实际高性能计算应用(如欧洲海洋建模核心(NEMO))的性能提高了2.3倍,为成为高性能计算解决方案的首选主机CPU奠定了坚实的基础。...PC版:https://www.cnbeta.com.tw/articles/soft/1430710.htm手机版:https://m.cnbeta.com.tw/view/1430710.htm

相关推荐

封面图片

未完工的英特尔Aurora超级计算机首次登上TOP500排行榜第2位

未完工的英特尔Aurora超级计算机首次登上TOP500排行榜第2位Aurora项目自成立以来一直在拖延,其目标是通过第四代至强可扩展Max"蓝宝石激流"处理器和英特尔数据中心GPUMax系列硬件的组合,实现峰值双精度计算能力超过两个exaFLOPS。但就其首次亮相而言,在系统尚未完全扩展的情况下,其峰值为585.34petaFLOPS...对于那些希望它能在秋季TOP500世界最快超级计算机排名中及时全面亮相的人来说,这远远达不到它的全部能力。Aurora由10624个计算刀片组成,共配备21248个英特尔至强Max系列CPU和63744个英特尔Max系列GPU。主要硬件已于今年早些时候在ANL安装完毕,但英特尔及其工程合作伙伴仍在继续努力扩大系统规模并对软件进行微调。由于今年秋季提交给TOP500榜单的并非完整的超级计算机,因此它仅以半exaFLOP的成绩排名第二。采用AMD处理器的Frontier超级计算机以1.1exaFLOPS的成绩继续保持榜首位置,并成为排名中唯一的exaFLOP超级计算机。不过,TOP500榜单上有23个新系统采用了英特尔硬件。这些新的英特尔超级计算机包括英国Dawn超级计算机的第一期、德国SuperMUC-NG的第二期以及阿拉马斯国家实验室的Crossroads。Aurora超级计算机的首次亮相使富士通与日本理化学研究所采用A64FX处理器的"富岳"超级计算机跌至第三位。与此同时,AMD也在其通讯中宣传,AMD目前为TOP500榜单中的140台超级计算机提供算力,而Frontier仍然排名第一,是唯一一台超过exaFLOP大关的超级计算机。在绿色500榜单中,Frontier也名列第8位。AMD还指出,Aurora提交的部分数据已经比整个Frontier超级计算机的功率还要大,而性能等级却低得多。另一则有趣的轶事是,在绿色500榜单上效率最高的前十台超级计算机中,有八台都是AMD提供的算力。最新的TOP500榜单可从TOP500.org获取:https://www.top500.org/...PC版:https://www.cnbeta.com.tw/articles/soft/1396681.htm手机版:https://m.cnbeta.com.tw/view/1396681.htm

封面图片

Aurora超级计算机安装完毕:2个ExaFLOPS 数万个CPU和GPU 锁定Top 500榜首

Aurora超级计算机安装完毕:2个ExaFLOPS数万个CPU和GPU锁定Top500榜首"Aurora是英特尔Max系列GPU的首次部署,是最大的基于XeonMaxCPU的系统,也是世界上最大的GPU集群,"英特尔公司副总裁兼超级计算组总经理JeffMcVeigh说。Aurora超级计算机看起来相当令人印象深刻,即使从数字上看也是如此。该机器由21248个通用处理器提供动力,包含超过110万个内核,用于需要传统CPU马力的工作负载,还有63744个计算GPU,将用于人工智能和HPC工作负载。在内存方面,Aurora提供了1.36PB的封装HBM2E内存和19.9PB的DDR5内存,这些内存被CPU使用,以及PonteVecchi计算GPU携带的8.16PB的HBM2E。Aurora机器占用166个机架,每个机架容纳66个刀片。它横跨八列,占据的空间相当于两个篮球场,这还不算Aurora的存储子系统,后者采用了1024个全闪存存储节点,提供220TB的存储容量,总带宽为31TB/s。目前,阿贡国家实验室没有公布Aurora或其存储子系统的官方耗电数字。这台超级计算机将用于各种工作负载,从核聚变模拟到是否预测,从空气动力学到医学研究,它采用HPE的Shasta超级计算机架构和Slingshot互连。同时,在该系统通过ANL的验收测试之前,它将被用于大规模科学生成性AI模型。阿贡国家实验室副主任里克-史蒂文斯说:"在我们努力实现验收测试的同时,我们将使用Aurora来训练一些大规模的开源科学生成性人工智能模型。Aurora拥有超过6万个英特尔MaxGPU,一个非常快的I/O系统和一个全固态大容量存储系统,是训练这些模型的完美环境。"尽管Aurora刀片已经安装完毕,这台超级计算机仍需进行并通过一系列验收测试,这是超级计算机的一个常见程序。一旦它成功通过这些测试并在今年晚些时候上线,预计它的理论性能将超过2ExaFLOPS(每秒20亿次浮点运算)。凭借巨大的性能,它有望确保在Top500榜单中占据榜首位置。Aurora超级计算机的安装标志着几个里程碑:它是业界第一台性能超过2ExaFLOPS的超级计算机和第一台基于英特尔的ExaFLOPS级机器。Aurora最初于2015年亮相,最初打算由英特尔的XeonPhi协处理器提供动力,预计在2018年提供约180PetaFLOPS。然而,英特尔决定放弃XeonPhi,改用计算型GPU,导致需要与阿贡国家实验室重新谈判协议,在2021年之前提供一个EaaFLOPS系统。由于英特尔7纳米(现在称为英特尔4)生产节点的延迟,以及必须为台积电的N5(5纳米级)工艺技术重新设计计算模组,该系统的交付被进一步推迟,因为PonteVecchio的复杂情况。英特尔终于在去年年底推出了数据中心GPUMax产品,现在已经向ANL运送了超过6万个这种计算GPU。...PC版:https://www.cnbeta.com.tw/articles/soft/1366873.htm手机版:https://m.cnbeta.com.tw/view/1366873.htm

封面图片

英特尔公布量子计算机芯片量产的一大重要里程碑成果

英特尔公布量子计算机芯片量产的一大重要里程碑成果英特尔旗下两个主要研究机构英特尔实验室(IntelLabs)和基础材料研究所(ComponentsResearch)近日宣布,他们在大规模生产量子计算处理器方面取得了重大进展。PC版:https://www.cnbeta.com/articles/soft/1324189.htm手机版:https://m.cnbeta.com/view/1324189.htm

封面图片

英特尔、戴尔和剑桥大学宣布部署“黎明”超级计算机第一期

英特尔、戴尔和剑桥大学宣布部署“黎明”超级计算机第一期Dawn启动了最近启动的英国人工智能研究资源(AIRR),该资源将探索相关系统和架构的可行性。黎明号"使英国更接近于达到每秒五百万亿次(1018)浮点运算的计算门槛--1exaflop,也就是众所周知的超大规模。从这个角度来看:地球上的每个人都必须每天24小时、持续四年以上进行计算,才能达到超大规模系统一秒钟的处理能力。"黎明"极大地增强了英国的科学和人工智能计算能力,如今它已在剑桥开放Zettascale实验室投入使用。戴尔PowerEdgeXE9640服务器为托管英特尔数据中心GPUMax系列加速器提供了计算平台,它通过oneAPI开放了生态系统供用户选择。Dawn诞生于戴尔、英特尔、剑桥大学之间的合作设计,并获得了英国研究与创新部门的额外投资。Dawn是英国目前部署的速度最快的人工智能超级计算机,将支持英国学术研究和工业领域有史以来最大的一些工作负载。使用领域包括医疗保健、工程、绿色聚变能源、气候建模以及宇宙学和高能物理领域的前沿科学。"Dawn第一阶段代表着英国在人工智能和仿真能力方面向前迈出了一大步,现已部署完毕,随时可以投入使用。该系统在更大的范围内发挥着重要作用,联合设计活动的目标是在2024年交付第二期超级计算机,其性能将是第一期的10倍。"剑桥大学研究计算服务部主任保罗-卡列哈(PaulCalleja)博士说:"如果二期项目得以推进,将极大地提升英国的人工智能能力,并延续这一成功的行业合作关系。"Dawn1期和已经宣布的Isambard人工智能超级计算机将共同组成AIRR,这是英国的一个国家设施,旨在帮助研究人员最大限度地发挥人工智能的潜力,并支持研究该技术的潜力和安全使用的关键工作。由英国研究与创新机构(UKRI)支持的Dawn将大大提高英国在基础研究和工业用例方面的人工智能和仿真计算能力,加速研究发现,推动英国知识经济的增长。新超级计算机基于戴尔PowerEdgeXE9640服务器。该服务器系统具有多种配置选项和液冷技术,能够很好地满足人工智能和高性能计算工作负载的需求。直接液冷技术提供了比传统风冷系统更高效、更经济的解决方案。"政府必须投资于正确的技术和基础设施,以确保英国在人工智能和exascale级仿真能力方面处于领先地位。"戴尔技术公司英国公共部门负责人TariqHussain表示:"同样重要的是,我们要全面拥抱技术生态系统,包括GPU多样性,以确保客户能够应对生成式人工智能、工业仿真建模和突破性科学研究日益增长的需求。"该系统中的每台PowerEdgeXE9640服务器都结合了两颗第四代英特尔至强可扩展处理器和四颗英特尔数据中心GPUMax加速器。英国中小型企业StackHPC的ScientificOpenStack提供了一个完全人工智能和仿真优化的云超级计算软件环境。它与oneAPI开放软件生态系统和优化框架相结合,可帮助开发人员加快AI和HPC工作负载的速度,并增强代码在多种硬件架构之间的可移植性。Dawn第一阶段的技术细节和性能数据将于11月中旬在科罗拉多州丹佛市举行的超级计算23(SC23)大会上发布。...PC版:https://www.cnbeta.com.tw/articles/soft/1393901.htm手机版:https://m.cnbeta.com.tw/view/1393901.htm

封面图片

AAEON推出板载英特尔Alder Lake CPU的GENE-ADP6单板计算机

AAEON推出板载英特尔AlderLakeCPU的GENE-ADP6单板计算机AAEON发布的新GENE-ADP6单板计算机功能得到全面增强,为边缘计算、数字标牌和机器视觉应用打开了大门,通过英特尔第12代酷睿/赛扬CPU(原AlderLake-P)提供了15%的CPU性能提升,其特点是混合平台处理器架构,最多有12个内核和16个线程。随着CPU能力的提高,GENE-ADP6显示出更大的AI能力,英特尔的深度学习BoostAI加速器提供了增强的推理能力,使GENE-ADP6成为可以用于5G和AI边缘计算的装备。GENE-ADP6通过两个双通道DDR5SODIMMs引入了64GB系统内存,也是AAEON旗下第一个这样做的3.5英寸超紧凑板。从DDR4到DDR5的改进提供了50%的数据传输速度提升和一个新的、更有效的电源管理结构。GENE-ADP6支持M.23052/3042和M.22230模块,实现了5G和Wi-Fi,增强了应用连接。GENE-ADP6单板计算机的FPC扩展槽提供了PCIex4(Gen4)速度,这也使用户可以灵活地扩展板子的额外PCIex4插槽,用于机器视觉、智能零售和工业自动化应用。其它输入输出接口方面包括三个USB3.2插槽,四个USB2.0插槽,以及一个用于四个独立显示器的英特尔IrisXe图形的显示接口。有关GENE-ADP6的更多信息,请访问产品页面:https://www.aaeon.com/en/p/subcompact-boards-gene-adp6...PC版:https://www.cnbeta.com/articles/soft/1313105.htm手机版:https://m.cnbeta.com/view/1313105.htm

封面图片

日本理化所与英特尔合作开展 "通向超大规模之路"

日本理化所与英特尔合作开展"通向超大规模之路"与超级计算机和人工智能有关的计算机技术硅基量子计算机技术和量子模拟技术与英特尔代工服务(IFS)合作进行原型开发在这次合作中,理化所和英特尔将利用双方的研究和技术能力,在通往zettascale(zetta是10的21次方,是exascale的1000倍)的道路上大幅提高性能。随着大数据规模的扩大,需要进一步完善机器学习和深度学习的计算基础设施,并希望大幅提高超级计算机和量子计算机的性能。为了满足这一需求,日本唯一的自然科学综合研究机构--理化所目前正在实施"理化所2023年"。我们启动了理化所平台的转型研究创新平台(TRIP)[见这里的项目图],这是一个横向项目。TRIP将连接理化所的尖端研究平台(超级计算机、大型同步辐射设施、生物资源项目等),加速和发展研究数字化转型(研究DX),并为社会变革提供引擎。为了促进这一点,有必要加快下一代计算领域的研究,如提高超级计算机和量子计算机的性能。...PC版:https://www.cnbeta.com.tw/articles/soft/1361049.htm手机版:https://m.cnbeta.com.tw/view/1361049.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人