Google宣布Imagen Video：根据简短文本内容生成短视频

Google宣布ImagenVideo：根据简短文本内容生成短视频继日前Meta宣布Make-A-Video之后，Google今天宣布了ImagenVideo人工智能系统，可以根据简短文本内容（例如泰迪熊洗碗）生成视频片段。虽然目前生成的短视频清晰度不够，但Google声称ImagenVideo是朝着具有“高度可控性”和世界知识的系统迈出的一步，包括生成镜头的能力在一系列艺术风格中。PC版：https://www.cnbeta.com/articles/soft/1324127.htm手机版：https://m.cnbeta.com/view/1324127.htm

在Telegram中查看

相关推荐

pen Chat Video Editor

项目名称：OpenChatVideoEditor项目功能：短视频生成项目简介：功能特点：◉一键生成可用的短视频，包括：配音、背景音乐、字幕等◉根据输入的简短文字，生成短视频文案，并合成短视频◉自动对网页的内容进行提取，生成视频文案，并生成短视频◉对输入的长视频进行分析和摘要，并生成短视频项目地址：

[图]Meta推出Make-A-Video工具：只需简单文本就可创建短视频

[图]Meta推出Make-A-Video工具：只需简单文本就可创建短视频通过Dall-E、Midjourney和CrAIyon等AI工具，普通用户也可以输入一些简单的文本内容，经过人工智能加工之后生产媲美艺术家的艺术插图。而Meta最新推出的Make-A-Video工具则让AI艺术生成工具更近一步，只要一些简单的文字就可以生成视频。PC版：https://www.cnbeta.com/articles/soft/1322499.htm手机版：https://m.cnbeta.com/view/1322499.htm

video-subtitle-extractor - 视频硬字幕提取，生成srt文件。无需申请第三方API，本地实现文本识别。基

-视频硬字幕提取，生成srt文件。无需申请第三方API，本地实现文本识别。基于深度学习的视频字幕提取框架，包含字幕区域检测、字幕内容提取功能：提取视频中的关键帧检测视频帧中文本的所在位置识别视频帧中文本的内容过滤非字幕区域的文本，去除水印（台标）文本去除重复字幕行，生成srt字幕文件支持视频字幕批量提取多语言：支持中文/英文、日语、韩语、繁体中文、法语、德语、俄语、西班牙语、葡萄牙语、意大利语字幕的提取多模式：快速-快速提取字幕但可能丢字幕（推荐）精准-不丢字幕但速度较慢

Google发布视频生成模型Veo 支持生成1080P

Google发布视频生成模型Veo支持生成1080P视频据了解，Veo能够根据文本、图像创建超过60秒的高质量1080P视频，用户可对光照、镜头语言、视频颜色风格等进行设定。用户仅需写出文本提示即可生成视频，比如文本提示：“在宁静的山地平移镜头，相机慢慢露出白雪皑皑的山峰、花岗岩岩石和倒映天空的清澈湖泊。”“一艘宇宙飞船在浩瀚的太空中穿梭，星星划过，高速，科幻”。...PC版：https://www.cnbeta.com.tw/articles/soft/1430903.htm手机版：https://m.cnbeta.com.tw/view/1430903.htm

Google人工智能技术“Transframer”可根据一张图片创建短视频

Google人工智能技术“Transframer”可根据一张图片创建短视频随着技术的发展，研究人员继续寻找新的方法来利用人工智能和机器学习能力。本周早些时候，Google科学家宣布创建了Transframer，这是一个新的框架，它能根据单一的图像输入来生成短视频。这项新技术有朝一日可以增强传统的渲染解决方案并使开发者能够基于机器学习能力创建虚拟环境。这个新框架的名称（及在某些方面的概念）是对另一个基于人工智能的模型Transformer的点赞。Transformer最初于2017年推出，是一个新颖的神经网络架构，它有能力通过建模和比较句子中的其他词来生成文本。此后，该模型被纳入了标准的深度学习框架如TensorFlow和PyTorch。据悉，Transframer使用具有类似属性的背景图像，结合查询注释来创建短视频。尽管在原始图像输入中没有提供任何几何数据，但产生的视频在目标图像周围移动并将准确的视角可视化。这项新技术使用Google的DeepMind人工智能平台进行了演示，其功能是分析单一的照片背景图像以此来获得关键的图像数据并生成额外的图像。在这一分析过程中，系统确定了图片的框架，这反过来又帮助系统预测图片的周围环境。然后，语境图像被用来进一步预测图片从不同角度会出现的情况。预测根据数据、注释及语境框架中的任何其他信息对额外图像框架的概率进行建模。该框架通过提供基于非常有限的数据集生成合理准确的视频的能力，这标志着视频技术的巨大进步。Transframer任务在其他跟视频有关的任务和基准上也显示出极有前景的结果，如语义分割、图像分类和光流预测。对基于视频的行业如游戏开发可能具有潜在的巨大影响。目前的游戏开发环境依赖于核心渲染技术，如着色、纹理映射、景深和光线追踪。像Transframer这样的技术有可能通过使用人工智能和机器学习来构建他们的环境并与此同时来减少创建环境所需的时间、资源和精力以为开发者提供一个全新的开发路径。PC版：https://www.cnbeta.com/articles/soft/1306793.htm手机版：https://m.cnbeta.com/view/1306793.htm

Stability AI 推出 Stable Video Diffusion 模型，可根据图片生成视频

StabilityAI推出StableVideoDiffusion模型，可根据图片生成视频StableVideoDiffusion这款模型能够通过现有图片生成视频，是基于之前发布的StableDiffusion文本转图片模型的延伸，也是目前为止市面上少有的能够生成视频的AI模型之一。不过，这款模型目前并不是对所有人开放的。StableVideoDiffusion目前处于StabilityAI所谓的“研究预览”阶段。想要使用这款模型的人必须同意一些使用条款，其中规定了StableVideoDiffusion的预期应用场景（例如“教育或创意工具”、“设计和其他艺术过程”等）和非预期的场景（例如“对人或事件的事实或真实的表达”）()投稿：@ZaiHuaBot频道：@TestFlightCN

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人