Sora证明马斯克的是对的 但特斯拉和人类可能都输了

Sora证明马斯克的是对的但特斯拉和人类可能都输了随后他在X上转发了一条2023年的视频,内容是特斯拉自动驾驶总监AshokElluswamy向外界介绍特斯拉如何用AI模拟真实世界驾驶。视频中,AI同时生成了七个不同角度的驾驶视频,同时只需要输入‘直行’或者‘变道’这样的指令,就能让这七路视频同步变化。当然,这不意味着特斯拉早在一年前就掌握了Sora的技术,毕竟特斯拉的生成技术只用于模拟车辆行驶,而Sora能够处理的环境、场景、Prompt、物理规律等信息更加复杂,二者在难度上不可同日而语。但特斯拉AI和Sora训练的思路是一致的:并不是训练AI如何生成视频,而是训练AI理解和生成一个真实的场景或者世界,视频只是从某一个视角观察这个场景的一段时空。这是两家在现有业务上完全不同的公司,以彼此不同的方法来感知真实世界,而他们共同希望通向的,都是AGI(通用人工智能),甚至更具体一些,就是具身智能和智能体。理解这个观点的核心,是理解OpenAI为Sora赋予的使命,并不只是替代视频生成的创作者,而是将视频生成作为帮助AI理解真实世界的‘模拟器’。如果说特斯拉数以百万计的车辆仍然需要用‘肉身’感受这个世界,那么Sora则是单纯依靠数据的输入,建立起对世界的认知。OpenAI官网上,关于Sora的这篇研究论文名为《把视频生成模型作为世界模拟器》。请注意‘世界模拟器’(worldsimulators)这个关键词,它是比生成视频更关键的核心所在。其实,早在特斯拉发布FSDV12的时候,这家以汽车为主要消费产品的人工智能公司,就已经展示了类似的能力。如何理解呢?首先,在FSDV12上,工程师删除了超过30万行定义驾驶规则的代码,系统将从被‘投喂’的驾驶视频中,学习如何应对真实的驾驶场景,而不是向过往那样,按照写好的规则,在某个特定场景下执行某一个具体的命令。当然,和作为‘生成式模型’的Sora不同,FSD的目标是实现自动驾驶,所以它并不需要真正生成一个具体的视频。你可以想象成一个人(或者智能体)正在进行‘防御性驾驶’,基于过往经验,可以对周围环境中交通参与者的下一步移动趋势做出判断。这个判断存在在头脑里就行了,不需要真正把它画在纸上。因此,特斯拉的FSD也不需要把对未来的想象,生成为一个真实视频,并呈现在车辆的某一个屏幕上。所以,现在有OpenAI和特斯拉两家完全不同的公司,用截然不同的方式和路径,实现‘通过视频生成,让AI理解物理世界’这个相同的目标。简单了解一下Sora的运行逻辑:OpenAI表示,Sora结合了Transformer和Diffusion两个过去几年最重要的模型。ChatGPT、Gemini、LLaMA等语言模式都是基于Transformer模型,它对词语进行标记,并生成下一个单词;Diffusion模型则是‘文生图’的代表。如果从‘理解世界’的角度来审视Sora,那么某一帧图像的画质、画面关系绝不是模型质量高低的评判标准,甚至官网释出的60秒一镜到底视频也不是最核心的部分。重要的是这个生成的视频可以被剪辑——在不同的机位下,无论是广角、中景、近景、特写,视频中人物和背景的关系都保持着高度的‘一致性’。这才是Sora遥遥领先并接近真实的地方。这一点和特斯拉在FSD上采取‘纯视觉’方案可以结合理解。简单来说,99%的车企或者智驾团队都会在车辆上保留激光雷达,通过激光束的发射和接收,辅助计算周围物体和车辆间的距离关系。但马斯克不仅删除了30万行代码,还移除了雷达,只依靠高清摄像头采集和神经网络学习来判断距离关系。无论是对特斯拉,还是对OpenAI,这都是巨大的挑战。毕竟输入的画面是2D的,但输出的结果(无论是驾驶指令还是视频)都需要基于对3D世界的深刻理解。规模和质量是训练模型的核心。特斯拉的数据来源于真实道路上,搭载了传感器的车辆;而OpenAI的大量数据,从目前的公开信息来看,来源于网络。在质量的维度,在《马斯克传》里,作者艾萨克森写道特斯拉通过和Uber合作,获取‘五星司机’的素材训练FSD;而从规模出发,奥特曼最近希望筹集万亿规模的资金,就是重注算力和规模的具体体现。最后,回到一开始的那个问题,为什么我们会认为Sora和FSDv12是相似的?Sora和OpenAI未来的想象空间又是什么呢?它们和AGI又有什么关系?在马斯克看来,当人工智能可以真正解决一个问题(物理、数学、化学等等)的时候,AGI就到来了。不过还有另外一个理解维度,那就是具身智能。毕竟现实世界里,并不是只有数学公式和文字规则,拥有一定的智商的小猫小狗也可以依靠运动真实地和物理世界进行互动。这点对于过去只能输入二维信息的AI来说很难做到。这也是为什么马斯克看到Sora后在X上评价是‘GGHumans’,在他看来Sora今天做到的,已经打破了过去的次元壁,而能理解真实世界并继续学习,AI也就有了更进一步影响真实世界的能力。而就像特斯拉把这种生成能力用于训练车辆,Sora的价值也不仅仅是生成一个难以让人区分真假的视频,用作影视创作者的生产力工具(尽管这是一个非常困难且刚需的场景)。就像周鸿祎所说,‘Sora只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。’...PC版:https://www.cnbeta.com.tw/articles/soft/1419067.htm手机版:https://m.cnbeta.com.tw/view/1419067.htm

相关推荐

封面图片

Sora证明马斯克是对的,但特斯拉和人类可能都输了#抽屉IT

封面图片

马斯克:特斯拉视频生成技术全球第一 比OpenAI更牛

马斯克:特斯拉视频生成技术全球第一比OpenAI更牛一位X用户发帖称:“OpenAI的Sora与特斯拉的FSDv12有什么关系?结果是有很多!OpenAI的重磅炸弹证实了特斯拉的理论!“马斯克回应称:“特斯拉已经能够以精确的物理生成真实世界视频大约一年了。这并不是特别有趣,因为所有的训练数据都来自汽车,所以它看起来就像特斯拉的视频,尽管是动态生成的(而不是记忆的)世界。”马斯克稍后分享了特斯拉一年前制作的几段模拟真实场景的自动驾驶视频,并在回应一位用户的评论时表示:“特斯拉视频生成超越OpenAI的地方在于,它预测了极其精确的物理场景。这对自动驾驶至关重要。”另一位X用户发帖称:“特斯拉应该做一款视频游戏。你可以通过解决工程问题获得积分,还可以获得徽章。”马斯克回应称:“我早就想这么做了:)我们的真实世界模拟和视频生成是世界上最好的,但不幸的是,我们只能在发布无监督的FSD后才能制作游戏,这比有监督的FSD更安全。”      ...PC版:https://www.cnbeta.com.tw/articles/soft/1419005.htm手机版:https://m.cnbeta.com.tw/view/1419005.htm

封面图片

周鸿祎:推测 Sora 生成视频应没有靠 3D 建模训练 而是模拟人类智能

周鸿祎:推测Sora生成视频应没有靠3D建模训练而是模拟人类智能在抖音个人直播间中,360创始人周鸿祎表示对OpenAI文生视频应用Sora的逼真效果十分惊讶。据其推测,Sora生成逼真的视频背后应该没有靠3D建模训练。如果Sora也只用3D建模再进行渲染,那么这和传统的电影工业走的是一样的路。他认为,Sora应该是模拟人类智能理解真实世界规律,掌握了人类观察、描绘、表现世界的方法。人类的大脑里不需要3D建模,因为人类对真实世界的物理规律有基本认知,可以控制自己所想。

封面图片

马斯克评 OpenAI 首个视频生成模型:人类认赌服输

马斯克评OpenAI首个视频生成模型:人类认赌服输OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频。他们似乎又领先了其他所有人1-2年。以下是我看过的最令人印象深刻的视频,以及生成它们的提示。”另一位X用户评论称:“gg皮克斯。”马斯克回应称:“gg人类(gghumans)。”gg是网络游戏用语“goodgames”的缩写,主要用于游戏结束后,输赢双方都可以用。

封面图片

马斯克称未来机器人数量将多于人类,特斯拉愿共享自动驾驶技术

马斯克称未来机器人数量将多于人类,特斯拉愿共享自动驾驶技术在今日开幕的世界人工智能大会上,马斯克虽然没有亲自来到现场,但依然通过网络发表了一段视频演讲,谈到了特斯拉人形机器人Optimus、自动驾驶、人工智能等方面。马斯克认为,现在可能是人类历史上最深刻的一个时期,特斯拉的人形机器人还在开发阶段,处于比较早期的阶段,但未来将会有非常多的机器人,机器人和人类的比例,在现在看来,某个阶段将会超过1:1,那也就是说,未来地球上的机器人的数量将会超过人类的数量。#视频来源,来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

封面图片

马斯克因特斯拉自动驾驶宣传面临SEC调查

马斯克因特斯拉自动驾驶宣传面临SEC调查作为特斯拉的首席执行官,马斯克言论的真实性在该机构的规定下具有特别的分量。马斯克已经在几个方面与SEC发生了冲突。但是,监管机构对自动驾驶的审查直接涉及了马斯克认为对特斯拉未来至关重要的业务优先事项。知情人士称,SEC官员正在权衡马斯克是否做出了不恰当的前瞻性声明。该机构执法部门的调查并不一定会导致后果,但可能会导致公司和高管面临诉讼、罚款或其他民事处罚。目前还无法确定马斯克关于自动驾驶的哪些声明或活动引起了SEC的注意。特斯拉的驾驶辅助技术多年来一直是马斯克关注的焦点。他亲自指导了2016年一段视频的创作,这段视频可能夸大了这项技术的能力。视频中承诺的最终全自动、免提驾驶功能尚未实现。...PC版:https://www.cnbeta.com.tw/articles/soft/1341311.htm手机版:https://m.cnbeta.com.tw/view/1341311.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人