汤姆猫:正在推进申请接入 OpenAI 的 Sora 模型

汤姆猫:正在推进申请接入OpenAI的Sora模型汤姆猫在互动平台表示,公司正在推进申请接入OpenAI的Sora模型,并计划进行相关的素材制作的测试,目前暂未正式接入Sora。在生成视频领域,公司已利用Pika、Runway、StableDiffusion等工具制作了部分视频素材,探索该等素材在营销、动画制作领域的应用。目前公司在文生视频技术上的应用仍在探索阶段,相关技术的应用现阶段未对公司业绩产生重大影响。

相关推荐

封面图片

【汤姆猫:公司开始接入测试OpenAI所提供的Embeddings等技术服务】

【汤姆猫:公司开始接入测试OpenAI所提供的Embeddings等技术服务】汤姆猫在接受调研时表示,在OpenAI的文本预训练通识大模型基础上,公司开始接入测试OpenAI所提供的Embeddings等技术服务。除此之外,在图像模型领域,公司海外美术团队已在局部美术创作中使用AIGC相关技术StableDiffusion进行美术创作,旨在探索减少部分重复度高且耗时的工作。同时,公司也在持续关注各类自然语言大模型、多态大模型、视觉大模型、音频大模型等发展情况。

封面图片

汤姆猫在互动平台表示,在生成视频领域,公司已利用Pika、Runway、StableDiffusion等工具制作了部分素材,

汤姆猫在互动平台表示,在生成视频领域,公司已利用Pika、Runway、StableDiffusion等工具制作了部分视频素材,探索该等素材在营销、动画制作领域的应用。目前公司在文生视频技术上的应用仍在探索阶段,相关技术的应用现阶段未对公司业绩产生重大影响。此外,公司海内外研发团队正推进AI手游《TalkingBenAI》、汤姆猫AI讲故事、AI语音交互陪伴机器人等产品的研发与测试工作,目前相关产品尚未正式上线。

封面图片

OpenAI 发布文生视频模型 Sora

OpenAI发布文生视频模型Sora2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型。Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。一位YouTube博主PaddyGalloway发表了对Sora的感想,他表示内容创作行业已经永远的改变了,并且毫不夸张。“我进入YouTube世界已经15年时间,但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了,素材网站将变得无关紧要,任何人都可以无壁垒获得难以置信的产品,内容背后的‘想法’和故事将变得更加重要。”但Sora模型当前也存在弱点。OpenAI称它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。例如,一个人可能咬了一口饼干后,饼干会没有咬痕,玻璃破碎的物理过程可能也无法被准确呈现。频道:@kejiqu群组:@kejiquchat

封面图片

汤姆猫:公司海内外研发团队正推进三款 AI 应用产品的研发与测试工作

汤姆猫:公司海内外研发团队正推进三款AI应用产品的研发与测试工作汤姆猫近期在接受调研时表示,在AI产品方向,公司海内外研发团队正推进三款AI应用产品的研发与测试工作。其中,国内团队研发的多模态AI汤姆猫与汤姆猫讲故事AI产品接入的底层大模型均为西湖大模型,与国内其他大模型相比,西湖大模型以情商智商俱佳为特色,具备长期记忆、情感感知等特点,支持文字、图片、语音等多模态输入输出,今年下半年西湖大模型在文生动图、降低推理成本、提升对话时长等方向取得较大进展;公司海外团队正在研发测试的AI手游《TalkingBenAI》已接入OpenAI与Google的大模型及其他AI服务进行测试,打造符合公司汤姆猫家族IP性格特征并满足用户娱乐需求的交互产品。该产品此前已在斯洛文尼亚、塞浦路斯、南非等地区开启首轮海外测试。

封面图片

OpenAI 推出文本到视频人工智能模型 Sora

OpenAI推出文本到视频人工智能模型Sora根据OpenAI的介绍博文,Sora能够创建"具有多个角色、特定运动类型以及主体和背景准确细节的复杂场景"。该公司还指出,该模型能够理解物体"在物理世界中的存在方式",还能"准确解释道具并生成表达生动情感的引人注目的角色"。该模型还能根据静态图像生成视频,以及在现有视频中填充缺失的帧或扩展视频。OpenAI的博文中包含的Sora生成的演示包括淘金热时期加利福尼亚州的空中场景、从东京火车内部拍摄的视频等。许多演示都有人工智能的痕迹--比如在一段博物馆的视频中,地板疑似在移动。OpenAI表示,该模型"可能难以准确模拟复杂场景的物理现象",但总体而言,演示结果令人印象深刻。几年前,像Midjourney这样的文本到图像生成器在模型将文字转化为图像的能力方面处于领先地位。但最近,视频技术开始飞速进步:Runway和Pika等公司都展示了自己令人印象深刻的文字转视频模型,而Google的Lumiere也将成为OpenAI在这一领域的主要竞争对手之一。与Sora类似,Lumiere也为用户提供了文字转换视频的工具,还能让用户通过静态图像创建视频。Sora目前只对"红队"人员开放,他们负责评估模型的潜在危害和风险。OpenAI还向一些视觉艺术家、设计师和电影制片人提供访问权限,以获得反馈意见。它指出,现有模型可能无法准确模拟复杂场景的物理现象,也可能无法正确解释某些因果关系。本月早些时候,OpenAI宣布将在其文本到图像工具DALL-E3中添加水印,但指出这些水印"很容易去除"。与其他人工智能产品一样,OpenAI将不得不面对人工智能逼真视频被误认为是真实视频的后果。...PC版:https://www.cnbeta.com.tw/articles/soft/1418385.htm手机版:https://m.cnbeta.com.tw/view/1418385.htm

封面图片

OpenAI的Sora视频生成模型也能用来渲染游戏

OpenAI的Sora视频生成模型也能用来渲染视频游戏这篇题为《作为世界模拟器的视频生成模型》(Videogenerationmodelsasworldsimulators)的论文由多位OpenAI研究人员共同撰写,揭开了Sora架构关键方面的神秘面纱--例如,Sora可以生成任意分辨率和长宽比(最高1080p)的视频。根据论文所述,Sora能够执行一系列图像和视频编辑任务,从创建循环视频、向前或向后延伸视频到更改现有视频的背景。但最吸引笔者的还是Sora"模拟数字世界"的能力,OpenAI的合著者如是说。在一次实验中,OpenAI将Sora放到Minecraft上,让它在控制玩家的同时渲染世界及其动态(包括物理)。Sora在Minecraft中控制一名玩家,并渲染视频游戏世界,请注意,颗粒感是由视频到GIF的转换工具造成的,而不是Sora。图片来源:OpenAIOpenAI那么,Sora是如何做到这一点的呢?正如NVIDIA高级研究员JimFan(通过Quartz)所说,与其说Sora是一个创意引擎,不如说它是一个"数据驱动的物理引擎"。它不仅能生成单张照片或视频,还能确定环境中每个物体的物理特性,并根据这些计算结果渲染照片或视频(或交互式3D世界,视情况而定)。合著者写道:"这些功能表明,继续扩展视频模型是开发物理和数字世界以及其中的物体、动物和人的高能力模拟器的一条大有可为的途径。"现在,Sora在视频游戏领域也有其通常的局限性。该模型无法准确模拟玻璃碎裂等基本互动的物理过程。即使在可以建模的互动中,Sora也经常出现不一致的情况,例如在渲染一个人吃汉堡时,却无法渲染汉堡上的咬痕。不过,如果我没看错的话,Sora似乎可以为更逼真(甚至可能是逼真)的程序生成游戏铺平道路。这既令人兴奋,又令人恐惧(考虑到Deepfake的影响)--这也许就是为什么OpenAI选择暂时将Sora关在一个非常有限的访问程序后面的原因。相关文章:OpenAI推出文本到视频人工智能模型SoraOpenAI首个视频生成模型发布能生成长达1分钟的高清视频...PC版:https://www.cnbeta.com.tw/articles/soft/1418461.htm手机版:https://m.cnbeta.com.tw/view/1418461.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人