评估认为NASA的超级计算机严重落后 拥有18000颗CPU却只搭配48颗GPU

评估认为NASA的超级计算机严重落后拥有18000颗CPU却只搭配48颗GPU目前,NASA拥有五台超算,安放在加州艾莫斯的NASA先进超算中心(NAS)、马里兰州戈达德的NASA气候模拟中心(NCCS)。性能最好的是Aitken,性能也只有13.12PFlops(每秒1.312亿亿次浮点计算),美国重返月球项目用的就是它。还有Electra8.32PFlops、Discover8.1PFlops、Pleiades7.09PFlops、Endeavour15.48TFlops。这些超算不但性能平平,而且架构技术都不算先进,仍然几乎完全依赖传统CPU处理器。NAS拥有总计超过18000颗GPU,却只有48颗GPU,NCSS部署的GPU更少。NASA在报告中称,超算基础设置的严重落伍,严重影响了NASA的项目进展,而且管理方式落后,利用效率低下,还存在很多安全隐患,因此强烈建议转向GPU为主的新型超算。两个字总结:打钱!...PC版:https://www.cnbeta.com.tw/articles/soft/1423996.htm手机版:https://m.cnbeta.com.tw/view/1423996.htm

相关推荐

封面图片

1万颗NVIDIA H100 GPU为价值3亿美元的特斯拉超级计算机提供算力

1万颗NVIDIAH100GPU为价值3亿美元的特斯拉超级计算机提供算力据报道,特斯拉已经升级了英伟达的A100s,计算性能提高了约五倍,达到了340FP64PFLOPS,与业内其他超级计算机相比,性能明显提高。埃隆-马斯克将目光投向了FSD,并表示这是特斯拉的未来。该公司已将资源投入到该功能的发展中,目前仍处于初始阶段。到2024年,随着耗资10亿美元的Dojo超级计算机的启动,特斯拉将拥有巨大的计算能力,这将使其比其他汽车制造商更具优势,尤其是在利用人工智能力量的功能方面。特斯拉计划斥资40多亿美元发展FSD和AI车型,这表明该行业的未来令人兴奋。然而,在如此巨大的雄心背后,英伟达公司的AIGPU却难以获得,原因是巨大的需求和供应链瓶颈。埃隆曾表示,人工智能GPU比"毒品"还难买,这也是行业现状的最终写照。汽车行业的未来是光明的,尤其是借助人工智能,将其融入我们的日常生活,特斯拉在FSD方面的雄心壮志将被证明是该行业的革命性变革,它的开发和测试过程都非常有章法。...PC版:https://www.cnbeta.com.tw/articles/soft/1380849.htm手机版:https://m.cnbeta.com.tw/view/1380849.htm

封面图片

NASA 的任务因超级计算机短缺而被推迟

NASA的任务因超级计算机短缺而被推迟美国宇航局(NASA)的超级计算能力未能跟上最新技术发展的步伐,并且“超额认购和负担过重”,导致任务延迟,有时需要由团队购买自己的基础设施来解决。NASA内部审计机构监察长办公室发布的审计报告称“NASA需要新的承诺和持续的领导关注,以重振其高端计算工作。如果不做出重大改变,该机构的高端计算可能会限制未来的任务优先事项和目标。”NASA当前的超级计算设施存在超额分配、超负荷使用和过时的问题。例如,NASA的“先进超级计算设施”只有48个GPU和18,000个CPU。而SLS团队每年花费25万美元购买独立计算资源,而不是等待现有的资源可用。——

封面图片

NVIDIA CPU+GPU超级芯片终于量产 搭配144TB内存

NVIDIACPU+GPU超级芯片终于量产搭配144TB内存再加上GraceCPU、HopperGPU、AdaLovelaceGPU、BlueFieldDPU等全套系统方案,NVIDIA现在已经有400多种配置,可满足市场对生成式AI的激增需求。欧洲和美国的超大规模云服务商、超算中心,将会成为接入GH200系统的首批客户。同时,黄仁勋还公布了GraceHopper的更多细节,尤其是它的CPU、GPU之间使用NVLink-C2C互连技术,总带宽高达900GB/s,相比传统的PCIe5.0通道超出足足7倍,能够满足要求最苛刻的生成式AI和HPC应用,功耗也降低了超过80%。GraceCPU拥有72个Armv9CPU核心,缓存容量198MB,支持LPDDR5XECC内存,带宽高达1TB/s,还支持PCIe5.0。HopperGPU则采用台积电4nm定制工艺,集成多达800亿个晶体管,号称世界上最先进的芯片,集成18432个CUDA核心、576个Tenor核心、60MB二级缓存,支持6144-bitHBM3/2e高带宽内存。同时,NVIDIA宣布推出一款新型大内存AI超级计算机“DGXGH200”,可用于开发面向生成式AI语言应用、推荐系统和数据分析工作负载的下一代大模型。它配备了多达256颗GH200GraceHopper超级芯片,彼此NVLinkSwitchSystem互相连接,带宽提升48倍以上,对外可作为单个GPU使用,浮点性能高达1PFlops(每秒1千万亿次浮点计算)。同时还有144TB共享内存,相比2020年的上一代DGXA100增大了近500倍。...PC版:https://www.cnbeta.com.tw/articles/soft/1362341.htm手机版:https://m.cnbeta.com.tw/view/1362341.htm

封面图片

Aurora超级计算机安装完毕:2个ExaFLOPS 数万个CPU和GPU 锁定Top 500榜首

Aurora超级计算机安装完毕:2个ExaFLOPS数万个CPU和GPU锁定Top500榜首"Aurora是英特尔Max系列GPU的首次部署,是最大的基于XeonMaxCPU的系统,也是世界上最大的GPU集群,"英特尔公司副总裁兼超级计算组总经理JeffMcVeigh说。Aurora超级计算机看起来相当令人印象深刻,即使从数字上看也是如此。该机器由21248个通用处理器提供动力,包含超过110万个内核,用于需要传统CPU马力的工作负载,还有63744个计算GPU,将用于人工智能和HPC工作负载。在内存方面,Aurora提供了1.36PB的封装HBM2E内存和19.9PB的DDR5内存,这些内存被CPU使用,以及PonteVecchi计算GPU携带的8.16PB的HBM2E。Aurora机器占用166个机架,每个机架容纳66个刀片。它横跨八列,占据的空间相当于两个篮球场,这还不算Aurora的存储子系统,后者采用了1024个全闪存存储节点,提供220TB的存储容量,总带宽为31TB/s。目前,阿贡国家实验室没有公布Aurora或其存储子系统的官方耗电数字。这台超级计算机将用于各种工作负载,从核聚变模拟到是否预测,从空气动力学到医学研究,它采用HPE的Shasta超级计算机架构和Slingshot互连。同时,在该系统通过ANL的验收测试之前,它将被用于大规模科学生成性AI模型。阿贡国家实验室副主任里克-史蒂文斯说:"在我们努力实现验收测试的同时,我们将使用Aurora来训练一些大规模的开源科学生成性人工智能模型。Aurora拥有超过6万个英特尔MaxGPU,一个非常快的I/O系统和一个全固态大容量存储系统,是训练这些模型的完美环境。"尽管Aurora刀片已经安装完毕,这台超级计算机仍需进行并通过一系列验收测试,这是超级计算机的一个常见程序。一旦它成功通过这些测试并在今年晚些时候上线,预计它的理论性能将超过2ExaFLOPS(每秒20亿次浮点运算)。凭借巨大的性能,它有望确保在Top500榜单中占据榜首位置。Aurora超级计算机的安装标志着几个里程碑:它是业界第一台性能超过2ExaFLOPS的超级计算机和第一台基于英特尔的ExaFLOPS级机器。Aurora最初于2015年亮相,最初打算由英特尔的XeonPhi协处理器提供动力,预计在2018年提供约180PetaFLOPS。然而,英特尔决定放弃XeonPhi,改用计算型GPU,导致需要与阿贡国家实验室重新谈判协议,在2021年之前提供一个EaaFLOPS系统。由于英特尔7纳米(现在称为英特尔4)生产节点的延迟,以及必须为台积电的N5(5纳米级)工艺技术重新设计计算模组,该系统的交付被进一步推迟,因为PonteVecchio的复杂情况。英特尔终于在去年年底推出了数据中心GPUMax产品,现在已经向ANL运送了超过6万个这种计算GPU。...PC版:https://www.cnbeta.com.tw/articles/soft/1366873.htm手机版:https://m.cnbeta.com.tw/view/1366873.htm

封面图片

美国拍卖退役超级计算机 起价仅2500美元 曾经全球第20

美国拍卖退役超级计算机起价仅2500美元曾经全球第20这套超算位于美国怀俄明州夏延市的国家大气研究中心超算中心,2016年开始安装,2017年1月12日投用,2023年12月31日退役,七年的时间里为大气和地球系统科学研究做出了杰出贡献。服役期间,它运行了超过70亿核心小时,服务了4400多名用户,支持了近1300项美国国家科学基金会资助项目、80多门大学课程和培训活,产生了超过4500篇经同行评审的出版物、硕士/博士论文等。它共有4032个节点,每节点两颗Intel至强E5-2697v42.3GHz18核心处理器,共计145152个核心,还有313TB内存、40PB硬盘,能耗1.7兆瓦。峰值性能为5.34PFlops(5340万亿次浮点每秒),刚上线的时候高居全球第20位,而如今世界第一的Frontier峰值性能高达1.68EFlops(168亿亿次浮点每秒),共有8699904个核心,能耗22.7兆瓦。其实,“夏延”最初计划的使用年限只有五年,但因为新冠疫情导致供应链中断,被迫多干了两年。最终,散热系统出现问题,导致大约1%的节点存在内存ECC错误,而且停机时间和维修成本过高,只能退役并拍卖。目前已经有十多人对此超算感兴趣,并出价竞拍,但最高也只有27643美元,约合人民币20万元。...PC版:https://www.cnbeta.com.tw/articles/soft/1429304.htm手机版:https://m.cnbeta.com.tw/view/1429304.htm

封面图片

AMD超级计算机强到离谱 小弟发挥一成功力就是世界前五

AMD超级计算机强到离谱小弟发挥一成功力就是世界前五它不但会超越现有第一的Frontier(也是AMDCPU+GPU组合平台),而且有希望超越至少持平IntelCPU+GPU组合平台的Aurora,全球范围内数一数二。不过,ElCapitan主要是面向关乎美国国家安全的机密科研项目,LLNA又宣布了它的衍生版本“Tuolumne”——名字来自与酋长岩同在约塞米蒂国家公园的图奥勒米河。Tuolumne将开放给非机密的科研项目,规模比ElCapitan小得多,算力只有其10-15%,但依然强的离谱。ElCapita200亿亿次算力没有说是持续性能还是峰值性能,我们就按峰值性能来算,10-15%的话就是20-30亿亿次,在当今公开的TOP500超算榜单上可以排第四或者第五。如果按持续性能来算,这个规模最好的情况下甚至能够杀入前三!Tuolumne依然会采用AMD平台,CPU处理器是Zen4架构的霄龙9004,GPU加速器则是同时集成Zen4CPU核心、CDNA3GPU核心的InstinctMI300A。LLNA没有公布Tuolumne的上线时间,但肯定要优先完成ElCapitan。...PC版:https://www.cnbeta.com.tw/articles/soft/1370435.htm手机版:https://m.cnbeta.com.tw/view/1370435.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人