OpenAI正式推出GPT-4 提供文本图像综合访问能力

OpenAI正式推出GPT-4提供文本图像综合访问能力在一系列领域--包括带有文字和照片、图表或屏幕截图的文件--GPT-4表现出与纯文本输入类似的能力。此外，它还可以使用为纯文本语言模型开发的测试时间技术，包括少数几个镜头和思维链提示。坏消息是，图像输入目前还没有向公众开放，因为它们处于"研究预览"模式。目前还没有关于何时能普遍使用的消息。新版本还将允许用户改变GPT-4答案的语气，博文指出：与经典的ChatGPT个性的固定言辞、语气和风格不同，开发者（以及很快ChatGPT用户）现在可以通过在"系统"消息中描述这些方向来规定他们的人工智能的风格和任务。系统消息允许API用户在一定范围内大幅定制他们的用户体验。该博客还展示了一些性能图表来说明GPT-4的改进。在一个案例中，OpenAI让聊天机器人参加了一些模拟考试。我们通过使用最新的公开测试（就奥林匹克数学和AP自由回答问题而言）或购买2022-2023年版本的练习考试来进行，我们没有为这些考试做专门的培训。上图显示，与GPT-3.5相比，GPT-4在大多数情况下提供的考试成绩要好得多与以前的版本一样，GPT-4在获取更多的最新科目信息方面是有限的，因为它只能回溯到2021年9月。OpenAI还表示，新版本"相对于以前的模型，大大减少了信口开河的现象"，但它"并不完全可靠"。如果他们注册了一个等待名单，GPT-4的API目前可供开发者使用，普通人如果注册了ChatGPTPlus，就可以在有限的基础上访问GPT-4，该费用为每月20美元。博文提到，OpenAI可能会推出另一个订阅级别，允许更多的人访问。...PC版：https://www.cnbeta.com.tw/articles/soft/1349447.htm手机版：https://m.cnbeta.com.tw/view/1349447.htm

在Telegram中查看

相关推荐

今日重磅： Open AI 正式推出 GPT-4！

今日重磅：OpenAI正式推出GPT-4！在演示视频中，GPT-4可以实现：-问它如何清洁装满食人鱼的鱼缸里面？（回答惊喜连连~）-自动编写一个python脚本来分析我的月度财务情况（支持主流编程语言）-分析、理解图片，并「预测」可能性（这里的预测太酷了：杠杆那头的棒球会被击飞）综合来说：GPT-4是多模态。直接读取图片和文档等应用场景。（多模态意味着机器拥有了更多维度的输入数据处理能力，类似生物有了多感官能力。）GPT-4的高级推理能力超过了ChatGPT。上下文理解巨幅提升。GPT-4能够处理超过25,000字的文本，允许使用案例，如长形式的内容创建，扩展的对话，以及文件搜索和分析。中文准确度大幅提升。更多请访问OpenAI官网：https://openai.com/product/gpt-4Invalidmedia:

OpenAI强化GPT-4并使其更加便宜

OpenAI强化GPT-4并使其更加便宜该公司在周一举行的首次开发者大会上宣布，目前通过API预览版提供的GPT-4Turbo已对2023年4月之前的信息进行了培训。3月份发布的GPT-4早期版本只能学习到2021年9月之前的数据。OpenAI计划在未来几周内发布可量产的Turbo模型，但没有给出确切日期。GPT-4Turbo还能"看到"更多数据，其上下文窗口为128K，OpenAI称这"相当于在单个提示符中显示300多页文本"。一般来说，更大的上下文窗口可以让GPT等大型语言模型理解更多问题，并提供更深思熟虑的回答。在此之前，OpenAI发布了两个版本的GPT-4，一个版本的上下文窗口只有8K，另一个版本为32K。OpenAI表示，GPT-4Turbo对开发者来说运行成本更低。与GPT-4的0.03美元相比，每1000个标记（LLM阅读文本或代码的基本单位）的输入成本仅为0.01美元。每输出1000个单位的成本为0.03美元。总体而言，OpenAI表示新版GPT-4比旧版便宜三倍。最新版本的GPT-4仍将接受图像提示、文本到语音请求，并集成了10月份首次发布的DALL-E3功能。该公司表示，GPT-4Turbo的改进意味着用户可以在一次提示中要求模型执行更复杂的任务。用户甚至可以让GPT-4Turbo特别使用自己选择的编程语言来获取结果，比如XML或JSON编码。使用GPT-3.5Turbo模型的公司还将看到上下文窗口、功能和价格方面的改进。它的默认上下文窗口为16K，功能更新与GPT-4Turbo相同。GPT-3.5Turbo的输入费用为0.01美元，输出费用为0.002美元。OpenAI于3月发布了GPT-3.5Turbo，并称其为非聊天用途的最佳模型。8月，该公司又发布了一个可以微调的版本。除了改进旗舰模型，OpenAI还宣布效仿微软和Google，通过一项名为CopyrightShield的计划为企业用户提供版权赔偿。该公司在一份声明中说："如果你面临有关版权侵权的法律索赔，我们现在将出面为我们的客户辩护，并支付由此产生的费用。"版权保护计划将涵盖ChatGPTEnterprise和OpenAI开发者平台的一般可用功能。Google表示，如果使用其嵌入式生成式人工智能功能的客户被起诉侵犯版权，公司将承担法律责任。微软也为其Copilot人工智能产品的企业用户提供了同样的保护。...PC版：https://www.cnbeta.com.tw/articles/soft/1394925.htm手机版：https://m.cnbeta.com.tw/view/1394925.htm

OpenAI正在升级其文本生成模型GPT-3.5-turbo和GPT-4并降低价格

OpenAI正在升级其文本生成模型GPT-3.5-turbo和GPT-4并降低价格例如，函数调用可以帮助创建聊天机器人，通过调用外部工具回答问题，将自然语言转换为数据库查询，并从文本中提取结构化数据。“这些模型已经过微调，可以检测何时需要调用函数……并使用符合函数签名的JSON进行响应，”OpenAI在介绍中写道。“函数调用允许开发人员更可靠地从模型中获取结构化数据。”除了函数调用之外，OpenAI还引入了一种具有极大扩展上下文窗口的GPT-3.5-turbo。上下文窗口以标记或原始文本位衡量，指的是模型在生成任何其他文本之前考虑的文本。具有小上下文窗口的模型往往会“忘记”即使是最近的对话内容，导致他们偏离主题。新的GPT-3.5-turbo提供四倍于普通GPT-3.5-turbo的上下文长度（16000个令牌），价格是原来的两倍——每1000个输入令牌（即输入模型的令牌）0.003美元，每1000个输出令牌0.004美元（模型生成的标记）。OpenAI表示，它一次可以摄取大约20页的文本——明显低于AI初创公司Anthropic的旗舰模型可以处理的数百页文本。（OpenAI正在测试具有32000个令牌上下文窗口的GPT-4版本，但发布范围有限。）从好的方面来说，OpenAI表示它正在将GPT-3.5-turbo（原始版本，而不是具有扩展上下文窗口的版本）的价格降低25%。开发人员现在可以以每1000个输入令牌0.0015美元和每1000个输出令牌0.002美元的价格使用该模型，这相当于每美元大约700页。text-embedding-ada-002的定价也有所降低，这是OpenAI更流行的文本嵌入模型之一。文本嵌入衡量文本字符串的相关性，通常用于搜索（结果按与查询字符串的相关性排序）和推荐（推荐具有相关文本字符串的项目）。Text-embedding-ada-002现在每1000个令牌的价格为0.0001美元，比之前的价格降低了75%。OpenAI表示，减少是通过提高其系统效率实现的——毫无疑问，这是这家初创公司关注的一个关键领域，因为它在研发和基础设施上花费了数亿美元。OpenAI已经表示，在3月初发布GPT-4之后，对现有模型的增量更新是当下主要工作，而不是研发大规模的从头开始的新模型。在最近的一次会议上，首席执行官山姆·奥特曼重申OpenAI尚未开始培训GPT-4的继任者，这表明该公司在开始该模型之前“还有很多工作要做”。了解更多：https://openai.com/blog/function-calling-and-other-api-updates...PC版：https://www.cnbeta.com.tw/articles/soft/1365217.htm手机版：https://m.cnbeta.com.tw/view/1365217.htm

OpenAI 发布新一代大型多模态模型 GPT-4

OpenAI发布新一代大型多模态模型GPT-4GPT-4是一个大型多模态模型，可以接受文本和图像输入。GPT-4在各种专业学术基准上有着人类水平表现，例如模拟律师考试中，GPT-4的得分约为前10%，而GPT-3.5的得分约为倒数10%。在多语言测试中，GPT-4优于GPT-3.5和Chinchilla(来自DeepMind)还有PaLM(来自谷歌)，包括英语性能还有拉脱维亚语、威尔士语和斯瓦希里语等低资源语言。OpenAI还开放了角色扮演和性格定制能力，开发人员和用户可以自定义他们的AI风格，而不是具有固定冗长、语气和风格的经典ChatGPT个性。ChatGPTPlus订阅用户现可直接GPT-4，未来将对免费用户开放一定数量的GPT-4体验。GPT-4API需要候选名单，每1kprompttokens的价格为$0.03，每1kcompletiontokens的价格为$0.06。目前图像输入处在研究预览阶段，仅对少部分客户开放。微软在GPT-4发布后也正式BingChat基于GPT-4运行，同时BingChat的Edge边栏功能上线。与数据停留在2021年9月的GPT-4离线版本不同，BingChat可联网获取实时信息并且免费。——投稿：@ZaiHuabot频道：@TestFlightCN

OpenAI公布GPT-4：更强更可靠可在考试中超过90%的人类

OpenAI公布GPT-4：更强更可靠可在考试中超过90%的人类OpenAI于2020年发布了GPT（生成型预训练变换模型）-3（生成型预训练变换模型），并将其与GPT-3.5分别用于创建Dall-E和聊天机器人ChatGPT，这两款产品极大地吸引了公众的关注，并刺激其他科技公司更积极地追求人工智能（AI）。OpenAI周二表示，在内部评估中，相较于GPT-3.5，GPT-4产生正确回应的可能性要高出40%。而且GPT-4是多模态的，同时支持文本和图像输入功能。OpenAI称，GPT-4比以前的版本“更大”，这意味着其已经在更多的数据上进行了训练，并且在模型文件中有更多的权重，这使得它的运行成本更高。据OpenAI介绍，在某些情况下，GPT-4比之前的GPT-3.5版本有了巨大改进，新模型将产生更少的错误答案，更少地偏离谈话轨道，更少地谈论禁忌话题，甚至在许多标准化测试中比人类表现得更好。例如，GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右。OpenAI表示，虽然两个版本在日常对话中看起来很相似，但当任务复杂到一定程度时，差异就表现出来了，GPT-4更可靠、更有创造力，能够处理更微妙的指令。不过，OpenAI也警告称，GPT-4还不完美，在许多情况下，它的能力不如人类。该公司表示：“GPT-4仍有许多已知的局限性，我们正在努力解决，比如社会偏见、幻觉和对抗性提示。”OpenAI透露，摩根士丹利正在使用GPT-4来组织数据，而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、KhanAcademy和冰岛政府。OpenAI合作伙伴微软周二表示，新版必应搜索引擎将使用GPT-4。...PC版：https://www.cnbeta.com.tw/articles/soft/1349455.htm手机版：https://m.cnbeta.com.tw/view/1349455.htm

新版 ChatGPT 可同时访问所有 GPT-4 工具

新版ChatGPT可同时访问所有GPT-4工具OpenAI计划推出一种使用多模式GPT-4的新方法，无需切换即可访问所有工具，并提供更多文档分析功能。许多ChatGPTPlus用户在X上分享的截图显示了PDF和文档分析的新功能以及"所有工具"功能。所有工具"可让用户访问GPT-4的所有功能，而无需在不同功能之间切换。此举被誉为一次重大飞跃，它超越了基于文本的查询，推动了生成式人工智能功能的发展。现在，用户可以上传一张图片，让DALL-E3做出回应，为他们的工作流程增添了新的维度。随着越来越多的用户开始使用新的多模态功能，更多关于如何将所有GPT-4工具结合在一起使用的例子也将出现。有趣的是，GPT-4的所有工具功能似乎并不包括ChatGPT插件。一些新功能可能会使许多第三方ChatGPT插件过时。这可能是为了简化用户体验而精心策划的举动，同时也是对以往提供类似功能的第三方插件的一种限制。在系统中直接分析PDF和其他文件的功能有效地消除了对第三方ChatGPT插件的需求，而这些插件一直以来都在填补这些空白。通过在最新版本的ChatGPT中整合这些功能，OpenAI回应了用户的反馈意见，创建了一个不依赖外部功能的更强大的工具。除了用户可以访问GPT-4AllTools之外，其他人也注意到了更近的知识截止日期。最新消息发布于OpenAI下周的DevDay大会之前，预计该公司将在会上与开发者探讨新工具。...PC版：https://www.cnbeta.com.tw/articles/soft/1393089.htm手机版：https://m.cnbeta.com.tw/view/1393089.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人