大华股份:公司拥有视频大模型能力,但方向与 Sora 相反,大华侧重解析

大华股份:公司拥有视频大模型能力,但方向与Sora相反,大华侧重解析据澎湃新闻,AI视频模型Sora引发外界关注。2月19日,记者以投资者身份致电大华股份,相关人士表示,公司拥有视频大模型的能力,目前在两个行业做研发。不一样的点是Sora是生成式的,大华做的是解析式的,方向刚好是反过来的,大华主要拿既有的素材或者客户内容去做解析,然后告诉客户视频里发生了什么,根据这个发生的事情来做行为判断。截至19日午盘,大华股份涨3.14%。

相关推荐

封面图片

海康威视:公司专注感知智能 与 Sora 方向不同

海康威视:公司专注感知智能与Sora方向不同OpenAI旗下的AI视频模型Sora爆火,2月19日,对于海康威视是否有类似Sora的产品,记者以投资者身份致电海康威视,相关人士表示,公司的产品与Sora不是同一个范畴的人工智能,公司专注在感知智能方面。公司的视频大模型主要用在智能物联行业,是来给企业做降本增效的,“比方说拍了一段视频,然后再去判断视频内有没有发生一些什么事情,是有明确规则的,按照规定去识别某一项东西。Sora是生成式的,其实跟我们的方向是相反的。”截至19日午盘,海康威视涨0.45%。(澎湃新闻)

封面图片

Sora:探索大型视觉模型的前世今生、技术内核及未来趋势 | blog

Sora:探索大型视觉模型的前世今生、技术内核及未来趋势Sora,一款由OpenAI在2024年2月推出的创新性文转视频生成式AI模型,能够依据文字说明,创作出既真实又富有想象力的场景视频,展现了其在模拟现实世界方面的巨大潜能。本文基于公开技术文档和逆向工程分析,全面审视了Sora背后的技术背景、应用场景、当前面临的挑战以及文转视频AI技术的未来发展方向。文章首先回顾了Sora的开发历程,探索了支撑这一“数字世界构建者”的关键技术。接着探讨了Sora在电影制作、教育、市场营销等多个领域内的应用潜力及其可能带来的影响。文章还深入讨论了为实现Sora的广泛应用需克服的主要挑战,例如保证视频生成的安全性和公正性。最后展望了Sora乃至整个视频生成模型技术未来的发展趋势,以及这些技术进步如何开创人机互动的新方式,进而提升视频创作的效率和创新性。

封面图片

国泰君安:OpenAI 发布 Sora 模型,实现 AIGC 领域的里程碑式进展

国泰君安:OpenAI发布Sora模型,实现AIGC领域的里程碑式进展国泰君安发布研报称,OpenAI发布首个文生视频模型Sora,效果震撼。Sora模型可以通过文本描述生成60秒长视频,还可以对视频色彩风格等要素精确理解,创造出人物表情丰富、情感生动的视频内容。Sora三大亮点突出,实现AIGC领域的里程碑式进展。首先是60秒长视频,Sora可以保持视频主体与背景的高度流畅性与稳定性。其次是单视频多角度镜头,Sora在一个视频内实现多角度镜头,分镜切换符合逻辑且十分流畅。再是理解真实世界的能力,Sora对于光影反射、运动方式、镜头移动等细节处理得十分优秀,极大地提升了真实感。Sora模型推动AI多模态领域飞跃式发展,AI创作等相关领域将迎来深度变革,AI赋能范围进一步扩大,多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。

封面图片

OpenAI的Sora视频生成模型也能用来渲染游戏

OpenAI的Sora视频生成模型也能用来渲染视频游戏这篇题为《作为世界模拟器的视频生成模型》(Videogenerationmodelsasworldsimulators)的论文由多位OpenAI研究人员共同撰写,揭开了Sora架构关键方面的神秘面纱--例如,Sora可以生成任意分辨率和长宽比(最高1080p)的视频。根据论文所述,Sora能够执行一系列图像和视频编辑任务,从创建循环视频、向前或向后延伸视频到更改现有视频的背景。但最吸引笔者的还是Sora"模拟数字世界"的能力,OpenAI的合著者如是说。在一次实验中,OpenAI将Sora放到Minecraft上,让它在控制玩家的同时渲染世界及其动态(包括物理)。Sora在Minecraft中控制一名玩家,并渲染视频游戏世界,请注意,颗粒感是由视频到GIF的转换工具造成的,而不是Sora。图片来源:OpenAIOpenAI那么,Sora是如何做到这一点的呢?正如NVIDIA高级研究员JimFan(通过Quartz)所说,与其说Sora是一个创意引擎,不如说它是一个"数据驱动的物理引擎"。它不仅能生成单张照片或视频,还能确定环境中每个物体的物理特性,并根据这些计算结果渲染照片或视频(或交互式3D世界,视情况而定)。合著者写道:"这些功能表明,继续扩展视频模型是开发物理和数字世界以及其中的物体、动物和人的高能力模拟器的一条大有可为的途径。"现在,Sora在视频游戏领域也有其通常的局限性。该模型无法准确模拟玻璃碎裂等基本互动的物理过程。即使在可以建模的互动中,Sora也经常出现不一致的情况,例如在渲染一个人吃汉堡时,却无法渲染汉堡上的咬痕。不过,如果我没看错的话,Sora似乎可以为更逼真(甚至可能是逼真)的程序生成游戏铺平道路。这既令人兴奋,又令人恐惧(考虑到Deepfake的影响)--这也许就是为什么OpenAI选择暂时将Sora关在一个非常有限的访问程序后面的原因。相关文章:OpenAI推出文本到视频人工智能模型SoraOpenAI首个视频生成模型发布能生成长达1分钟的高清视频...PC版:https://www.cnbeta.com.tw/articles/soft/1418461.htm手机版:https://m.cnbeta.com.tw/view/1418461.htm

封面图片

大华股份:智慧物联的万亿赛道已打开;全力构建全球智慧物联的首选品牌

大华股份:智慧物联的万亿赛道已打开;全力构建全球智慧物联的首选品牌12月30日,大华股份在新年贺词中表示,新的三十年已开启,智慧物联的万亿赛道已打开。数字产业化、产业数字化正深刻改变千行百业。数据已成为新的生产力,视频数据是最具价值的数据,而算力,特别是海量视频数据的计算,成为新的“能源”。智能是最有效、最强的生产工具,智能改变世界,特别是行业大模型颠覆式改变行业应用。数字化、智能化已成为时代最大的发展趋势,给我们带来千载难逢的机遇,同时逆全球化、全球经济不确定性给我们带来新的挑战。强化质量管理,全面提升交付和产品品质,推动AI大模型在智能软件编程、智能售前、智能运维等实践应用。全力构建全球智慧物联的首选品牌,从技术和市场驱动,到质量和品牌双驱动。研发、销售、供应链、质量、交付、服务、IT、财经、人力、品牌、合规等任何一块成为木桶的短板,都难以实现成就客户的目标。

封面图片

中信证券:OpenAI 推出视频生成模型 Sora,AI 产业围绕多模态不断加码

中信证券:OpenAI推出视频生成模型Sora,AI产业围绕多模态不断加码中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,围绕视频多模态这个核心关键点双方不断加码。Gemini1.5Pro基于大语言模型处理视频模态,上下文长度超过百万,Sora在技术上采用了DiffusionTransformer的路线,OpenAI表示Sora在训练过程中表现出了与其他模型不同的涌现能力,有望成为真正的“世界模型”。从投资角度来看,Sora背后的涌现能力为自动驾驶、设计等需要现实世界建模的行业提供了明确方向。Gemini在短期内的部分商业场景表现可能会更为出色,尤其是需要结合图片与文字的多模态应用场景。除去应用端的投资机会,硬件端的需求也必然会随着多模态的技术进步而不断提高,我们仍然持续看好AI算力,尤其是后续商业端成熟而带来的更多AI推理侧算力的机会。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人