OpenAI正式推出GPT-4 提供文本图像综合访问能力

OpenAI正式推出GPT-4提供文本图像综合访问能力在一系列领域--包括带有文字和照片、图表或屏幕截图的文件--GPT-4表现出与纯文本输入类似的能力。此外,它还可以使用为纯文本语言模型开发的测试时间技术,包括少数几个镜头和思维链提示。坏消息是,图像输入目前还没有向公众开放,因为它们处于"研究预览"模式。目前还没有关于何时能普遍使用的消息。新版本还将允许用户改变GPT-4答案的语气,博文指出:与经典的ChatGPT个性的固定言辞、语气和风格不同,开发者(以及很快ChatGPT用户)现在可以通过在"系统"消息中描述这些方向来规定他们的人工智能的风格和任务。系统消息允许API用户在一定范围内大幅定制他们的用户体验。该博客还展示了一些性能图表来说明GPT-4的改进。在一个案例中,OpenAI让聊天机器人参加了一些模拟考试。我们通过使用最新的公开测试(就奥林匹克数学和AP自由回答问题而言)或购买2022-2023年版本的练习考试来进行,我们没有为这些考试做专门的培训。上图显示,与GPT-3.5相比,GPT-4在大多数情况下提供的考试成绩要好得多与以前的版本一样,GPT-4在获取更多的最新科目信息方面是有限的,因为它只能回溯到2021年9月。OpenAI还表示,新版本"相对于以前的模型,大大减少了信口开河的现象",但它"并不完全可靠"。如果他们注册了一个等待名单,GPT-4的API目前可供开发者使用,普通人如果注册了ChatGPTPlus,就可以在有限的基础上访问GPT-4,该费用为每月20美元。博文提到,OpenAI可能会推出另一个订阅级别,允许更多的人访问。...PC版:https://www.cnbeta.com.tw/articles/soft/1349447.htm手机版:https://m.cnbeta.com.tw/view/1349447.htm

相关推荐

封面图片

今日重磅: Open AI 正式推出 GPT-4!

今日重磅:OpenAI正式推出GPT-4!在演示视频中,GPT-4可以实现:-问它如何清洁装满食人鱼的鱼缸里面?(回答惊喜连连~)-自动编写一个python脚本来分析我的月度财务情况(支持主流编程语言)-分析、理解图片,并「预测」可能性(这里的预测太酷了:杠杆那头的棒球会被击飞)综合来说:GPT-4是多模态。直接读取图片和文档等应用场景。(多模态意味着机器拥有了更多维度的输入数据处理能力,类似生物有了多感官能力。)GPT-4的高级推理能力超过了ChatGPT。上下文理解巨幅提升。GPT-4能够处理超过25,000字的文本,允许使用案例,如长形式的内容创建,扩展的对话,以及文件搜索和分析。中文准确度大幅提升。更多请访问OpenAI官网:https://openai.com/product/gpt-4Invalidmedia:

封面图片

OpenAI强化GPT-4并使其更加便宜

OpenAI强化GPT-4并使其更加便宜该公司在周一举行的首次开发者大会上宣布,目前通过API预览版提供的GPT-4Turbo已对2023年4月之前的信息进行了培训。3月份发布的GPT-4早期版本只能学习到2021年9月之前的数据。OpenAI计划在未来几周内发布可量产的Turbo模型,但没有给出确切日期。GPT-4Turbo还能"看到"更多数据,其上下文窗口为128K,OpenAI称这"相当于在单个提示符中显示300多页文本"。一般来说,更大的上下文窗口可以让GPT等大型语言模型理解更多问题,并提供更深思熟虑的回答。在此之前,OpenAI发布了两个版本的GPT-4,一个版本的上下文窗口只有8K,另一个版本为32K。OpenAI表示,GPT-4Turbo对开发者来说运行成本更低。与GPT-4的0.03美元相比,每1000个标记(LLM阅读文本或代码的基本单位)的输入成本仅为0.01美元。每输出1000个单位的成本为0.03美元。总体而言,OpenAI表示新版GPT-4比旧版便宜三倍。最新版本的GPT-4仍将接受图像提示、文本到语音请求,并集成了10月份首次发布的DALL-E3功能。该公司表示,GPT-4Turbo的改进意味着用户可以在一次提示中要求模型执行更复杂的任务。用户甚至可以让GPT-4Turbo特别使用自己选择的编程语言来获取结果,比如XML或JSON编码。使用GPT-3.5Turbo模型的公司还将看到上下文窗口、功能和价格方面的改进。它的默认上下文窗口为16K,功能更新与GPT-4Turbo相同。GPT-3.5Turbo的输入费用为0.01美元,输出费用为0.002美元。OpenAI于3月发布了GPT-3.5Turbo,并称其为非聊天用途的最佳模型。8月,该公司又发布了一个可以微调的版本。除了改进旗舰模型,OpenAI还宣布效仿微软和Google,通过一项名为CopyrightShield的计划为企业用户提供版权赔偿。该公司在一份声明中说:"如果你面临有关版权侵权的法律索赔,我们现在将出面为我们的客户辩护,并支付由此产生的费用。"版权保护计划将涵盖ChatGPTEnterprise和OpenAI开发者平台的一般可用功能。Google表示,如果使用其嵌入式生成式人工智能功能的客户被起诉侵犯版权,公司将承担法律责任。微软也为其Copilot人工智能产品的企业用户提供了同样的保护。...PC版:https://www.cnbeta.com.tw/articles/soft/1394925.htm手机版:https://m.cnbeta.com.tw/view/1394925.htm

封面图片

OpenAI正在升级其文本生成模型GPT-3.5-turbo和GPT-4并降低价格

OpenAI正在升级其文本生成模型GPT-3.5-turbo和GPT-4并降低价格例如,函数调用可以帮助创建聊天机器人,通过调用外部工具回答问题,将自然语言转换为数据库查询,并从文本中提取结构化数据。“这些模型已经过微调,可以检测何时需要调用函数……并使用符合函数签名的JSON进行响应,”OpenAI在介绍中写道。“函数调用允许开发人员更可靠地从模型中获取结构化数据。”除了函数调用之外,OpenAI还引入了一种具有极大扩展上下文窗口的GPT-3.5-turbo。上下文窗口以标记或原始文本位衡量,指的是模型在生成任何其他文本之前考虑的文本。具有小上下文窗口的模型往往会“忘记”即使是最近的对话内容,导致他们偏离主题。新的GPT-3.5-turbo提供四倍于普通GPT-3.5-turbo的上下文长度(16000个令牌),价格是原来的两倍——每1000个输入令牌(即输入模型的令牌)0.003美元,每1000个输出令牌0.004美元(模型生成的标记)。OpenAI表示,它一次可以摄取大约20页的文本——明显低于AI初创公司Anthropic的旗舰模型可以处理的数百页文本。(OpenAI正在测试具有32000个令牌上下文窗口的GPT-4版本,但发布范围有限。)从好的方面来说,OpenAI表示它正在将GPT-3.5-turbo(原始版本,而不是具有扩展上下文窗口的版本)的价格降低25%。开发人员现在可以以每1000个输入令牌0.0015美元和每1000个输出令牌0.002美元的价格使用该模型,这相当于每美元大约700页。text-embedding-ada-002的定价也有所降低,这是OpenAI更流行的文本嵌入模型之一。文本嵌入衡量文本字符串的相关性,通常用于搜索(结果按与查询字符串的相关性排序)和推荐(推荐具有相关文本字符串的项目)。Text-embedding-ada-002现在每1000个令牌的价格为0.0001美元,比之前的价格降低了75%。OpenAI表示,减少是通过提高其系统效率实现的——毫无疑问,这是这家初创公司关注的一个关键领域,因为它在研发和基础设施上花费了数亿美元。OpenAI已经表示,在3月初发布GPT-4之后,对现有模型的增量更新是当下主要工作,而不是研发大规模的从头开始的新模型。在最近的一次会议上,首席执行官山姆·奥特曼重申OpenAI尚未开始培训GPT-4的继任者,这表明该公司在开始该模型之前“还有很多工作要做”。了解更多:https://openai.com/blog/function-calling-and-other-api-updates...PC版:https://www.cnbeta.com.tw/articles/soft/1365217.htm手机版:https://m.cnbeta.com.tw/view/1365217.htm

封面图片

OpenAI 发布新一代大型多模态模型 GPT-4

OpenAI发布新一代大型多模态模型GPT-4GPT-4是一个大型多模态模型,可以接受文本和图像输入。GPT-4在各种专业学术基准上有着人类水平表现,例如模拟律师考试中,GPT-4的得分约为前10%,而GPT-3.5的得分约为倒数10%。在多语言测试中,GPT-4优于GPT-3.5和Chinchilla(来自DeepMind)还有PaLM(来自谷歌),包括英语性能还有拉脱维亚语、威尔士语和斯瓦希里语等低资源语言。OpenAI还开放了角色扮演和性格定制能力,开发人员和用户可以自定义他们的AI风格,而不是具有固定冗长、语气和风格的经典ChatGPT个性。ChatGPTPlus订阅用户现可直接GPT-4,未来将对免费用户开放一定数量的GPT-4体验。GPT-4API需要候选名单,每1kprompttokens的价格为$0.03,每1kcompletiontokens的价格为$0.06。目前图像输入处在研究预览阶段,仅对少部分客户开放。微软在GPT-4发布后也正式BingChat基于GPT-4运行,同时BingChat的Edge边栏功能上线。与数据停留在2021年9月的GPT-4离线版本不同,BingChat可联网获取实时信息并且免费。——投稿:@ZaiHuabot频道:@TestFlightCN

封面图片

OpenAI公布GPT-4:更强更可靠 可在考试中超过90%的人类

OpenAI公布GPT-4:更强更可靠可在考试中超过90%的人类OpenAI于2020年发布了GPT(生成型预训练变换模型)-3(生成型预训练变换模型),并将其与GPT-3.5分别用于创建Dall-E和聊天机器人ChatGPT,这两款产品极大地吸引了公众的关注,并刺激其他科技公司更积极地追求人工智能(AI)。OpenAI周二表示,在内部评估中,相较于GPT-3.5,GPT-4产生正确回应的可能性要高出40%。而且GPT-4是多模态的,同时支持文本和图像输入功能。OpenAI称,GPT-4比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。据OpenAI介绍,在某些情况下,GPT-4比之前的GPT-3.5版本有了巨大改进,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。例如,GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。OpenAI表示,虽然两个版本在日常对话中看起来很相似,但当任务复杂到一定程度时,差异就表现出来了,GPT-4更可靠、更有创造力,能够处理更微妙的指令。不过,OpenAI也警告称,GPT-4还不完美,在许多情况下,它的能力不如人类。该公司表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、KhanAcademy和冰岛政府。OpenAI合作伙伴微软周二表示,新版必应搜索引擎将使用GPT-4。...PC版:https://www.cnbeta.com.tw/articles/soft/1349455.htm手机版:https://m.cnbeta.com.tw/view/1349455.htm

封面图片

新版 ChatGPT 可同时访问所有 GPT-4 工具

新版ChatGPT可同时访问所有GPT-4工具OpenAI计划推出一种使用多模式GPT-4的新方法,无需切换即可访问所有工具,并提供更多文档分析功能。许多ChatGPTPlus用户在X上分享的截图显示了PDF和文档分析的新功能以及"所有工具"功能。所有工具"可让用户访问GPT-4的所有功能,而无需在不同功能之间切换。此举被誉为一次重大飞跃,它超越了基于文本的查询,推动了生成式人工智能功能的发展。现在,用户可以上传一张图片,让DALL-E3做出回应,为他们的工作流程增添了新的维度。随着越来越多的用户开始使用新的多模态功能,更多关于如何将所有GPT-4工具结合在一起使用的例子也将出现。有趣的是,GPT-4的所有工具功能似乎并不包括ChatGPT插件。一些新功能可能会使许多第三方ChatGPT插件过时。这可能是为了简化用户体验而精心策划的举动,同时也是对以往提供类似功能的第三方插件的一种限制。在系统中直接分析PDF和其他文件的功能有效地消除了对第三方ChatGPT插件的需求,而这些插件一直以来都在填补这些空白。通过在最新版本的ChatGPT中整合这些功能,OpenAI回应了用户的反馈意见,创建了一个不依赖外部功能的更强大的工具。除了用户可以访问GPT-4AllTools之外,其他人也注意到了更近的知识截止日期。最新消息发布于OpenAI下周的DevDay大会之前,预计该公司将在会上与开发者探讨新工具。...PC版:https://www.cnbeta.com.tw/articles/soft/1393089.htm手机版:https://m.cnbeta.com.tw/view/1393089.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人