OpenAI发布Shap・E模型:通过输入文本创建逼真3D模型

OpenAI发布Shap・E模型:通过输入文本创建逼真3D模型OpenAI最近发布了名为Shap・E的模型,可以通过输入文本创建逼真且多样化的3D模型。这种模型与现有的只能输出点云或体素的模型不同,可以生成高质量的3D资产,具有细粒度纹理和复杂形状。Shap・E不仅仅是一个3D模型生成器,而且可以直接生成隐式函数的参数,这些参数可以用于渲染纹理网格和神经辐射场(NeRF)。NeRF是一种具有隐式场景表示的新型视场合成技术,在计算机视觉领域引起了广泛的关注。它可以用于视图合成和三维重建,广泛应用于机器人、城市地图、自主导航、虚拟现实/增强现实等领域。值得注意的是,Shap・E模型还可以生成神经辐射场,这是一种新型的三维场景表示方法。通过这种方法,Shap・E可以呈现更加真实的光照效果和材质感,让3D图像更加生动、逼真。未来,这种模型可能会被广泛应用于游戏、电影、建筑等领域,为人们带来更加精彩、逼真的视觉体验。#AI来源,https://github.com/openai/shap-e来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

相关推荐

封面图片

OpenAI 发布"语音引擎"模型

OpenAI发布"语音引擎"模型VoiceEngine模型使用文本输入和单个15秒音频样本来生成与原始说话者非常相似的自然语音,小样本即可创建情感丰富且逼真的声音。该模型于2022年底首次开发,正在支持ChatGPT语音朗读和文本转语音API,已被HeyGen等企业用户采用。由于合成语音的滥用风险,VoiceEngine每段音频都有用于跟踪的隐水印,并且OpenAI暂不打算广泛部署和允许个人声音克隆,直到公众意识到深度伪造的挑战。线索:@ZaiHuabot投稿:@TNSubmbot频道:@TestFlightCN

封面图片

英伟达发布 LATTE3D 模型 1 秒生成高质量 3D 效果

英伟达发布LATTE3D模型1秒生成高质量3D效果英伟达AI研究副总裁SanjaFidler所属位于多伦多的AI实验室团队在GTC2024春季场的座谈活动中,发布了LATTE3D模型并于现场进行实机展示,该技术能够高效率通过文本提示词生成3D模型,在搭配英伟达RTXA6000GPU的情况下能够几乎即时(不到1秒时间)生成3D模型,3D形状可以随意放大、旋转,360度无死角。“一年前,AI模型需要1小时才能生成这种质量的3D视觉效果,而目前的技术水平大约是10到12秒。”SanjaFidler说。

封面图片

OpenAI推出DALL-E 3 API和新版文本到语音模型

OpenAI推出DALL-E3API和新版文本到语音模型DALL-E3API提供不同的格式和质量选项,分辨率从1024×1024到1792×1024,每张生成图片的价格从0.04美元起。不过,与DALL-E2API相比,它的功能还有些有限--至少目前是这样。与DALL-E2API不同的是,DALL-E3不能用来创建编辑版本的图像,即让模型替换已有图像的某些区域或创建已有图像的变体。OpenAI表示,当生成请求被发送到DALL-E3时,它会"出于安全考虑"和"增加更多细节"而自动重写,这可能会导致不那么精确的结果,具体取决于提示。在其他方面,OpenAI现在提供了一个文本到语音API--AudioAPI,它提供了六种预设语音--Alloy、Echo、Fable、Onyx、Nova和Shimer--供用户选择,还提供了两种生成式AI模型变体。它从今天开始上线,每次输入1000个字符的价格为0.015美元。OpenAI的CEOSamAltman在台上说:"这比我们听到的其他任何东西都要自然得多,这可以让应用程序的交互更自然,更易于使用。它还能解锁很多用例,比如语言学习和语音辅助。"与某些语音合成平台和工具不同的是,OpenAI并不提供控制所生成音频的情感影响的方法。在音频API的文档中,该公司指出,"某些因素"可能会影响生成的声音听起来如何,比如朗读文本中的大小写或语法,但OpenAI在这方面的内部测试结果"好坏参半"。OpenAI要求使用人工智能的开发者告知用户音频是由人工智能生成的。在一份相关的公告中,OpenAI推出了其开源自动语音识别模型Whisperlarge-v3的下一个版本,该公司声称该模型在各种语言中的性能都有所提高。该版本已在GitHub上发布,采用许可授权。...PC版:https://www.cnbeta.com.tw/articles/soft/1394933.htm手机版:https://m.cnbeta.com.tw/view/1394933.htm

封面图片

OpenAI 推出 AI 系统,将文本转换为逼真的视频

OpenAI推出AI系统,将文本转换为逼真的视频OpenAI公布了一种新的人工智能系统,该系统可以根据用户的文本提示创建逼真的视频,使其成为最新一家采用生成视频技术的人工智能公司。该公司周四在一篇博客文章中表示,这款名为Sora的人工智能系统可以快速制作长达一分钟的视频,这些视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景”。OpenAI首席执行官SamAltman表示,该工具最初将提供给“有限数量的创作者”。OpenAI还授予一个专家团队访问权限,该团队负责评估Sora的安全性,然后将其纳入公司的产品中。作为推出该产品的准备工作的一部分,OpenAI表示正在开发工具,以帮助检测视频是由Sora生成的。

封面图片

【OpenAI推出AI系统,将文本转换为逼真的视频】

【OpenAI推出AI系统,将文本转换为逼真的视频】OpenAI公布了一种新的人工智能系统,该系统可以根据用户的文本提示创建逼真的视频,使其成为最新一家采用生成视频技术的人工智能公司。该公司周四在一篇博客文章中表示,这款名为Sora的人工智能系统可以快速制作长达一分钟的视频,这些视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景”。OpenAI首席执行官SamAltman表示,该工具最初将提供给“有限数量的创作者”。

封面图片

OpenAI 推出将文本转换为逼真的视频的 AI 系统

OpenAI推出将文本转换为逼真的视频的AI系统OpenAI公布了一种新的人工智能系统,该系统可以根据用户的文本提示创建逼真的视频,使其成为最新一家采用生成视频技术的人工智能公司。该公司周四在一篇博客文章中表示,这款名为Sora的人工智能系统可以快速制作长达一分钟的视频,这些视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景”。OpenAI首席执行官SamAltman表示,该工具最初将提供给“有限数量的创作者”。OpenAI还授予一个专家团队访问权限,该团队负责评估Sora的安全性,然后将其纳入公司的产品中。作为推出该产品的准备工作的一部分,OpenAI表示正在开发工具,以帮助检测视频是由Sora生成的。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人