新版摩尔定律来?ChatGPT之父:AI算量18个月翻倍

新版摩尔定律来?ChatGPT之父:AI算量18个月翻倍1965年,时任仙童半导体工程师、后来创立了Intel的戈登·摩尔发文指出,每隔18个月,半导体芯片的晶体管密度就会翻倍,被称为摩尔定律,后续又被时间间隔修正为24个月,也就是两年时间芯片密度翻倍,成本降低一半。至于ChatGPT,它目前使用的是GPT-3大模型,有1750亿参数,已经积累了1亿用户,日活超过1300万,训练阶段总算力消耗约为3640PF-days(即1PetaFLOP/s效率跑3640天),成本预计在500万美元/次。未来会升级到GPT-4模型,有100万亿参数,算力性能需要指数级提升。...PC版:https://www.cnbeta.com.tw/articles/soft/1346599.htm手机版:https://m.cnbeta.com.tw/view/1346599.htm

相关推荐

封面图片

【OpenAI创始人提出新摩尔定律:宇宙中的智能数量每18个月翻倍】

【OpenAI创始人提出新摩尔定律:宇宙中的智能数量每18个月翻倍】2023年02月27日10点08分2月27日消息,OpenAI联合创始人、现任CEOSamAltma发布推特称,摩尔定律的一个新版本,可能很快就会开始,宇宙中的智能数量每18个月翻倍。据悉,摩尔定律是英特尔创始人之一戈登·摩尔的经验之谈,其核心内容为:集成电路上可以容纳的晶体管数目在大约每经过18个月到24个月便会增加一倍。换言之,处理器的性能大约每两年翻一倍,同时价格下降为之前的一半。

封面图片

AMD苏姿丰:摩尔定律未死 但推进已放慢

AMD苏姿丰:摩尔定律未死但推进已放慢苏姿丰在接受巴伦周刊(Barron's)采访时表示,她不认为摩尔定律已死,她认为摩尔定律已放慢,必须以不同行动延续,获得摩尔定律的能效和能源效益。至于“摩尔定律放慢”是否部分是因为晶圆价格的关系,苏姿丰表示,晶体管成本、以及从密度与整体耗能降低获得的改善程度,每一代都在降低,但AMD仍不断前进,正在从事许多3纳米制程的工作,也已放眼2纳米制程,AMD将持续运用小芯片(Chiplet)这类架构,试着绕过摩尔定律的一些挑战。摩尔定律是否已经失效,是近年来半导体产业最常被提及的议题。然而2004年90纳米推出之后,历经65纳米、45纳米等制程微缩,至2012年的22纳米为止,仍然符合摩尔定律。但22纳米到2015年进入14纳米,至今再进入10纳米或7纳米,摩尔定律的推进已经明显放慢。去年,英伟达发布了新一代AdaLovelace架构GPU,由于价格调涨引发用户质疑。对此英伟达CEO黄仁勋表示,“摩尔定律已死”,是公司不得不涨价的原因。...PC版:https://www.cnbeta.com.tw/articles/soft/1358151.htm手机版:https://m.cnbeta.com.tw/view/1358151.htm

封面图片

台积电谈如何延续摩尔定律

台积电谈如何延续摩尔定律https://www.chainnews.com/articles/013399851822.htmhttps://www.anandtech.com/show/14770/hot-chips-31-keynote-day-2-dr-phillip-wong-vp-research-at-tsmc-145pm-pt线宽已接近原子极限,所以Dr.Wong建议大家去关注晶体管密度增长,而不是去关注制程节点。毕竟摩尔定律只说每两年晶体管密度增加一倍

封面图片

摩尔定律到底死没死?芯片巨头英特尔、英伟达为何各执一词?

摩尔定律到底死没死?芯片巨头英特尔、英伟达为何各执一词?北京时间9月28日消息,作为半导体行业的黄金定律,摩尔定律一直指导着芯片开发。但是,随着芯片工艺的升级速度放缓,这一定律正受到质疑。摩尔定律是由英特尔联合创始人戈登·摩尔(GordonMoore)在上世纪60年代提出,主要说的是芯片上的晶体管数量。PC版:https://www.cnbeta.com/articles/soft/1321493.htm手机版:https://m.cnbeta.com/view/1321493.htm

封面图片

大模型增速远超摩尔定律 MIT最新研究:人类快要喂不饱AI了

大模型增速远超摩尔定律MIT最新研究:人类快要喂不饱AI了论文地址:https://arxiv.org/pdf/2403.05812.pdfLLM的能力提升大部分来自于算力,而摩尔定律代表着硬件算力的发展,——也就是说,随着时间的推移,终有一天我们将无法满足LLM所需要的算力!如果那个时候AI有了意识,不知道会不会自己想办法找饭吃?上图表示不同领域的算法改进对有效计算翻倍的估计。蓝点表示中心估计值或范围;蓝色三角形对应于不同大小(范围从1K到1B)的问题的倍增时间;紫色虚线对应于摩尔定律表示的2年倍增时间。摩尔定律和比尔盖茨摩尔定律(Moore'slaw)是一种经验或者观察结果,表示集成电路(IC)中的晶体管数量大约每两年翻一番。1965年,仙童半导体(FairchildSemiconductor)和英特尔的联合创始人GordonMoore假设集成电路的组件数量每年翻一番,并预测这种增长率将至少再持续十年。1975年,展望下一个十年,他将预测修改为每两年翻一番,复合年增长率(CAGR)为41%。虽然Moore没有使用经验证据来预测历史趋势将继续下去,但他的预测自1975年以来一直成立,所以也就成了“定律”。因为摩尔定律被半导体行业用于指导长期规划和设定研发目标,所以在某种程度上,成了一种自我实现预言。数字电子技术的进步,例如微处理器价格的降低、内存容量(RAM和闪存)的增加、传感器的改进,甚至数码相机中像素的数量和大小,都与摩尔定律密切相关。数字电子的这些持续变化一直是技术和社会变革、生产力和经济增长的驱动力。不过光靠自我激励肯定是不行的,虽然行业专家没法对摩尔定律能持续多久达成共识,但根据微处理器架构师的报告,自2010年左右以来,整个行业的半导体发展速度已经放缓,略低于摩尔定律预测的速度。下面是维基百科给出的晶体管数量增长趋势图:到了2022年9月,英伟达首席执行官黄仁勋直言“摩尔定律已死”,不过英特尔首席执行官PatGelsinger则表示不同意。从下图我们可以看出,英特尔还在努力用各种技术和方法为自己老祖宗提出的定律续命,并表示,问题不大,你看我们还是直线没有弯。AndyandBill'sLaw关于算力的增长,有一句话是这样说的:“安迪给的,比尔都拿走(WhatAndygiveth,Billtakethaway)”。这反映了当时的英特尔首席执行官AndyGrove每次向市场推出新芯片时,微软的CEO比尔·盖茨(BillGates)都会通过升级软件来吃掉芯片提升的性能。——而以后吃掉芯片算力的就是大模型了,而且根据MIT的这项研究,大模型以后根本吃不饱。研究方法如何定义LLM的能力提升?首先,研究人员对模型的能力进行了量化。基本的思想就是:如果一种算法或架构在基准测试中以一半的计算量获得相同的结果,那么就可以说,它比另一种算法或架构好两倍。有了比赛规则之后,研究人员招募了200多个语言模型来参加比赛,同时为了确保公平公正,比赛所用的数据集是WikiText-103和WikiText-2以及PennTreebank,代表了多年来用于评估语言模型的高质量文本数据。专注于语言模型开发过程中使用的既定基准,为比较新旧模型提供了连续性。需要注意的是,这里只量化了预训练模型的能力,没有考虑一些“训练后增强”手段,比如思维链提示(COT)、微调技术的改进或者集成搜索的方法(RAG)。模型定义研究人员通过拟合一个满足两个关键目标的模型来评估其性能水平:(1)模型必须与之前关于神经标度定律的工作大致一致;(2)模型应允许分解提高性能的主要因素,例如提高模型中数据或自由参数的使用效率。这里采用的核心方法类似于之前提出的缩放定律,将DenseTransformer的训练损失L与其参数N的数量和训练数据集大小D相关联:其中L是数据集上每个token的交叉熵损失,E、A、B、α和β是常数。E表示数据集的“不可减少损失”,而第二项和第三项分别代表由于模型或数据集的有限性而导致的错误。因为随着时间的推移,实现相同性能水平所需的资源(N和D)会减少。为了衡量这一点,作者在模型中引入了“有效数据”和“有效模型大小”的概念:其中的Y表示年份,前面的系数表示进展率,代入上面的缩放定律,可以得到:通过这个公式,就可以估计随着时间的推移,实现相同性能水平所需的更少资源(N和D)的速度。数据集参与测评的包含400多个在WikiText-103(WT103)、WikiText-2(WT2)和PennTreebank(PTB)上评估的语言模型,其中约60%可用于分析。研究人员首先从大约200篇不同的论文中检索了相关的评估信息,又额外使用框架执行了25个模型的评估。然后,考虑数据的子集,其中包含拟合模型结构所需的信息:token级测试困惑度(决定交叉熵损失)、发布日期、模型参数数量和训练数据集大小,最终筛选出231个模型供分析。这231个语言模型,跨越了超过8个数量级的计算,上图中的每个形状代表一个模型。形状的大小与训练期间使用的计算成正比,困惑度评估来自于现有文献以及作者自己的评估测试。在某些情况下,会从同一篇论文中检索到多个模型,为了避免自相关带来的问题,这里每篇论文最多只选择三个模型。实证结果根据缩放定律,以及作者引入的有效数据、有效参数和有效计算的定义来进行评估,结果表明:有效计算的中位倍增时间为8.4个月,95%置信区间为4.5至14.3个月。上图表示通过交叉验证选择的模型的算法进度估计值。图a显示了倍增时间的汇总估计值,图b显示了从左到右按交叉验证性能递减(MSE测试损耗增加)排序。上图比较了2016年至2020年前后的算法有效计算的估计倍增时间。相对于前期,后期的倍增时间较短,表明在该截止年之后算法进步速度加快。参考资料:https://twitter.com/emollick/status/1767717692608217407...PC版:https://www.cnbeta.com.tw/articles/soft/1423970.htm手机版:https://m.cnbeta.com.tw/view/1423970.htm

封面图片

英特尔 CEO:别听老黄瞎忽悠 摩尔定律依然有效

英特尔CEO:别听老黄瞎忽悠摩尔定律依然有效英特尔CEO帕特・基辛格(PatGelsinger)今日表示,在AI时代,英特尔处理器不但不会失去动力,反而会继续发挥重要作用。摩尔定律也依然有效。基辛格直接抨击了英伟达CEO黄仁勋的说法,即在AI时代,像英特尔这样的传统处理器正在失去动力。他说:“我认为,它就像25年前的互联网,规模和潜力庞大。我们相信,这是推动半导体行业在2030年之前达到1万亿美元的动力。”(新浪科技)

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人