特斯拉自研7nm超级芯片 可取代NVIDIA安培GPU

特斯拉自研7nm超级芯片可取代NVIDIA安培GPU特斯拉的自动驾驶技术开发走在前列,无疑,这背后有一套规模庞大的超级计算机用作开发训练平台。日前,特斯拉工程总经理TimZaman分享了特斯拉这套人工智能训练系统的最新规格,一年前配备了5760颗NVIDIAA100GPU,如今增加了1600颗,达到7360,幅度是28%。A100也就是完整的安培大核心,集成80GBHBM2e显存、拥有2TB/s带宽、功耗也是高达400W。按照Zaman的说法,特斯拉这套超算是全球GPU规模第7大的服务器运算平台。当然,马斯克并不满足于从NVIDIA买芯片,实际上特斯拉正在研制Dojo超算,GPU芯片也是自研的D1,台积电7nm工艺。D1是一款半定制ASIC,服务的就是人工智能推理运算训练,单精度浮点性能高达22.6T,集成500亿晶体管,功耗同样高达400W。PC版:https://www.cnbeta.com/articles/soft/1306045.htm手机版:https://m.cnbeta.com/view/1306045.htm

相关推荐

封面图片

2033年超越人类大脑 特斯拉自研芯片性能将达1千万亿次

2033年超越人类大脑特斯拉自研芯片性能将达1千万亿次特斯拉不仅在电动汽车行业实力强大,近年来还在研发脑机系统,并且有了自研的高性能芯片,未来甚至要超过人类大脑的算力——预计这个目标在2033年实现。根据汽车和货车租赁公司Vanarama的一项新研究,特斯拉的汽车将在2033年比人类大脑更聪明,性能将达到1PFLOPS,也就是1千万亿次,这是很多超算的性能水平了。这是因为特斯拉自研的芯片每年性能提升486%,只需要17年就能达到成熟人脑的程度,而人类大脑自然成熟需要25年。特斯拉最新发布的自研芯片DojoD1性能达到了362万亿次,是6年他们使用的NVIDIA芯片的30倍,后者的性能只有12万亿次。在前不久的AI日活动上,特斯拉正式发布了D1芯片,采用台积电7nm工艺制造,核心面积达645平方毫米,仅次于NVIDIAAmpere架构的超级计算核心A100(826平方毫米)、AMDCDNA2架构的下代计算核心Arcturus(750平方毫米左右),集成了多达500亿个晶体管,相当于IntelPonteVecchio计算芯片的一半。它集成了四个64位超标量CPU核心,拥有多达354个训练节点,特别用于8×8乘法,支持FP32、BFP64、CFP8、INT16、INT8等各种数据指令格式,都是AI训练相关的。特斯拉称,D1芯片的FP32单精度浮点计算性能达22.6TFlops(每秒22.6万亿次),BF16/CFP8计算性能则可达362TFlops(每秒362万亿次)。为了支撑AI训练的扩展性,它的互连带宽非常惊人,最高可达10TB/s,由多达576个通道组成,每个通道的带宽都有112Gbps。而实现这一切,热设计功耗仅为400W。PC版:https://www.cnbeta.com/articles/soft/1311783.htm手机版:https://m.cnbeta.com/view/1311783.htm

封面图片

NVIDIA CPU+GPU超级芯片终于量产 搭配144TB内存

NVIDIACPU+GPU超级芯片终于量产搭配144TB内存再加上GraceCPU、HopperGPU、AdaLovelaceGPU、BlueFieldDPU等全套系统方案,NVIDIA现在已经有400多种配置,可满足市场对生成式AI的激增需求。欧洲和美国的超大规模云服务商、超算中心,将会成为接入GH200系统的首批客户。同时,黄仁勋还公布了GraceHopper的更多细节,尤其是它的CPU、GPU之间使用NVLink-C2C互连技术,总带宽高达900GB/s,相比传统的PCIe5.0通道超出足足7倍,能够满足要求最苛刻的生成式AI和HPC应用,功耗也降低了超过80%。GraceCPU拥有72个Armv9CPU核心,缓存容量198MB,支持LPDDR5XECC内存,带宽高达1TB/s,还支持PCIe5.0。HopperGPU则采用台积电4nm定制工艺,集成多达800亿个晶体管,号称世界上最先进的芯片,集成18432个CUDA核心、576个Tenor核心、60MB二级缓存,支持6144-bitHBM3/2e高带宽内存。同时,NVIDIA宣布推出一款新型大内存AI超级计算机“DGXGH200”,可用于开发面向生成式AI语言应用、推荐系统和数据分析工作负载的下一代大模型。它配备了多达256颗GH200GraceHopper超级芯片,彼此NVLinkSwitchSystem互相连接,带宽提升48倍以上,对外可作为单个GPU使用,浮点性能高达1PFlops(每秒1千万亿次浮点计算)。同时还有144TB共享内存,相比2020年的上一代DGXA100增大了近500倍。...PC版:https://www.cnbeta.com.tw/articles/soft/1362341.htm手机版:https://m.cnbeta.com.tw/view/1362341.htm

封面图片

美国 政府限制 NVIDIA、AMD 向中国和俄罗斯出口高端 GPU 芯片,可能影响 AI 等技术发展

美国政府限制NVIDIA、AMD向中国和俄罗斯出口高端GPU芯片,可能影响AI等技术发展NVIDIA已暂停数据中心GPU卡A100和H100对中国区的发货,其它GPU卡不受影响。AMD方面已暂停所有数据中心GPU卡MI100和MI200对中国区的发货;向中国出口MI250芯片同样被限制。http://www.icsmart.cn/55878/https://amp.dw.com/zh/a-62987820https://investor.nvidia.com/financial-info/sec-filings/sec-filings-details/default.aspx?FilingId=16057737

封面图片

智绘微电子自研国产GPU完成设计 今年发布:14nm工艺、性能升8倍

智绘微电子自研国产GPU完成设计今年发布:14nm工艺、性能升8倍这两年,芯动科技、摩尔线程等创新企业崭露头角,从消费级到数据中心都带来了全新的GPU产品,但架构授权都来自ImaginationPowerVR。据智绘微电子官方消息,旗下IDM系列GPU的第二款产品“IDM929”,已于近日完成设计,即将进入流片阶段,预计2023年内推出。目前,IDM929已与多款国产CPU、国产操作系统完成内部测试,将满足桌面办公、图形工作站、地理信息系统、高性能计算等应用需求。据悉,智绘微电子成立于2018年12月,专注于国产自主可控创新型GPU芯片设计的细分领域,致力于发展高性能计算机系统所需的图形渲染、图像处理、虚拟现实、人工智能等通用处理器芯片,已先后完成天使轮融资、数千万元Pre-A轮融资。公司核心技术团队成员来自国防科大、西邮微电、三星电子等各大芯片平台,拥有GPU成功流片经验,在GPU芯片的多路输出、3D渲染、高性能计算等核心应用技术上拥有多年技术沉淀,具备实现芯片国产化替代的实力。公司拥有发明专利13项、集成电路布图设计专有权4项、计算机软件著作权8项、计划再申知识产权20项。截至目前,智绘微电子已与国产整机厂商长城/浪潮、国内CPU龙头苏州国芯、多家科研院所形成商业伙伴或战略合作关系,上升态势明显。2020年10月,智绘微电子成功推出了第一代高性能桌面级显卡GPU芯片IDM919,适配麒麟、统信多个国产操作系统,以及龙芯等多个国产CPU,性能达到当时国内领先水平。IDM919采用CMOS工艺,依托自研编译器和指令集架构,达到高性能性、高稳定性、高安全可靠性,通过SIMT指令实现可编程统一着色器架构,不仅可用于2D和3D图像渲染,也可以用于高性能计算等。第二代IDM929具备高算力、高通用性、高能效三大优势,采用14nmCMOS工艺,完全依托智绘微电子自研的IDMV架构、指令集、编译器。工作主频1.2GHz,像素填充率19.2Gp/s(每秒192亿),纹理填充率76.8Gt/s(每秒768亿),单浮点运算能力2.5TFlops(每秒2.5万亿次),整体性能是第一款产品IDM919的八倍之多。另外,它还支持4K超高清显示、4路独立显示输出,支持HDMI、DVI、VGA接口,支持H264、MPEG2、MPEG4、VC-1、DivX、VP6等视频硬件解码。另外,第三代GPUIDM939将在今年开启预研,制造工艺升级到7nm。智绘微电子预计到2024年实现数十万颗的销量。...PC版:https://www.cnbeta.com.tw/articles/soft/1344343.htm手机版:https://m.cnbeta.com.tw/view/1344343.htm

封面图片

特斯拉晶圆级Dojo处理器投入量产,采用25颗芯片阵列设计

特斯拉晶圆级Dojo处理器投入量产,采用25颗芯片阵列设计特斯拉在台积电北美技术研讨会上宣布,专为AI训练设计的晶圆级Dojo处理器已开始量产。该处理器采用5x5阵列,共25颗芯片,利用台积电的InFO_SoW技术实现晶圆级互连,模拟单个处理器工作。Dojo处理器耗电量巨大,使用复杂的电压调节模块,为计算平面提供18000安培的电力,散发的热量高达15000W,因此需要水冷散热。尽管特斯拉未透露具体性能,但其在AI训练领域的潜力巨大,具有高带宽、低延迟通信和高能源效率等优势。关注频道@TestFlightCN频道投稿@TNSubmbot

封面图片

传特斯拉增加台积电代工订单 扩产D1超级计算机芯片

传特斯拉增加台积电代工订单扩产D1超级计算机芯片特斯拉使用Dojo超级计算机训练高级驾驶辅助系统和完全自动驾驶系统的人工智能模型。随着FSD、自动驾驶出租车和Optimus机器人等项目的推出,Dojo超级计算机对公司运营的贡献可能会更大。特斯拉增加DojoD1芯片订单也有助于台积电。据报道,台积电与特斯拉的交易使得与高性能计算相关的订单有所增加。虽然特斯拉和台积电都没有对此事发表评论,但业内已经公开知晓这两家公司的业务关系。随着Dojo超级计算机的加入,特斯拉或许能够减少对英伟达GPU芯片产品的依赖。特斯拉一直是英伟达的重要客户,有报道称特斯拉最近启用了一款新的超级计算机,搭载了1万块英伟达H100GPU芯片。这个系统耗资约3亿美元,将用于各种人工智能应用。特斯拉人工智能官方账号在社交媒体X上发布了一系列关于Dojo超级计算机的帖子,展现了其宏大目标。特斯拉表示,Dojo超级计算机于2022年7月开始投产,并预计到2024年1月,其算力将进入世界前五。到2024年10月,特斯拉预计Dojo超级计算机将拥有每秒百亿亿次(100Exa-flop)的计算能力。...PC版:https://www.cnbeta.com.tw/articles/soft/1386321.htm手机版:https://m.cnbeta.com.tw/view/1386321.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人