新版ChatGPT火速发布：十大改进变厉害但仍存缺陷

新版ChatGPT火速发布：十大改进变厉害但仍存缺陷以下是外媒汇总的GPT-4主要改进和不足：更精确人工智能专家、风险投资公司PageOneVentures合伙人克里斯·尼克尔森(ChrisNicholson)告诉GPT-4，自己的母语是英语，不懂西班牙语。他希望GPT-4给他一份可以教他西班牙基础知识的教学大纲。结果，GPT-4提供了一份详细而有条理的教学大纲。它甚至为学习和记忆西班牙语单词提供了广泛的技巧，尽管并不是所有建议都中肯。准确性提高GPT-4比GPT-3.5更准确它还提高了准确性。当人工智能研究员兼教授奥伦·埃齐奥尼(OrenEtzioni)第一次尝试使用GPT-4时，他问了一个直截了当的问题：“奥伦·埃齐奥尼和伊莱·埃齐奥尼(EliEtzioni)之间是什么关系?”机器人的反应是正确的，称两人是父子关系。相比之下，GPT-3.5的回答则是错误的，称他们两人是兄弟关系。但是，GPT-4也存在错误。它说，奥伦是奥伦人工智能研究所的CEO，但实际上奥伦已经卸任了这一职位。更详细描述图像能详细描述图像GPT-4能够对图像和文本做出惊人的详细描述。OpenAI总裁兼联合创始人格雷格·布罗克曼(GregBrockman)演示了该系统如何细致地描述来自哈勃太空望远镜的图像。它还可以回答有关图像的问题。如果给出一张冰箱内部的照片，它就能建议你用手边的东西做几顿饭。擅长标准化考试OpenAI表示，新系统可以在美国41个州和地区的统一律师资格考试(UBE)中获得前10%左右的成绩。根据该公司的测试，它还可以在SAT考试中获得1300分(满分1600分)，在高中生参加的大学生物、微积分、宏观经济学、心理学、统计学和历史先修课程考试中获得5分(满分5分)。不擅长讨论未来尽管这个新的机器人似乎能对已经发生的事情进行推理，但当被要求对未来进行假设时，它就不那么擅长了。它似乎是在借鉴别人的说法，而不是创造新的猜测。仍会产生幻觉新的机器人还是会瞎编。这个问题被称为人工智能“幻觉”，困扰着所有领先的聊天机器人。由于系统不知道什么是真的，什么是假的，它们可能会生成完全错误的文本。当被要求提供描述最新癌症研究的网站地址时，它有时会生成不存在的互联网地址。...PC版：https://www.cnbeta.com.tw/articles/soft/1349487.htm手机版：https://m.cnbeta.com.tw/view/1349487.htm

在Telegram中查看

相关推荐

微软计划未来几周在必应中整合改进版 ChatGPT

微软计划未来几周在必应中整合改进版ChatGPT微软正致力于未来几周内将OpenAIChatGPT的速度改进版本GPT-4整合到必应搜索引擎（Bing）中，以提高其相对于Google搜索的竞争力。整合之后的必应将使用GPT-4回答搜索查询。ChatGPT和GPT-4主要区别在于速度，ChatGPT回答问题有时候需要数分钟，而GPT-4要快得多，回答内容据报道也更详细，更接近人类。Google据报道也在测试类似ChatGPT的AI工具。来源，来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

OpenAI创始人Sam Altman发推宣布ChatGPT-4的消息

OpenAI创始人SamAltman发推宣布ChatGPT-4的消息该网页链接到一份相当技术性的文件，概述了GPT-4，并说："......GPT-4是一个大规模的多模态模型，可以接受图像和文本输入并产生文本输出。虽然在许多现实世界的场景中，GPT-4的能力不如人类，但在各种专业和学术基准上表现出人类水平的性能，包括通过模拟的律师考试，分数约为应试者的前10%"。这个新的ChatGPT-4模型是"多模式的"，这意味着它可以接受文本或图像输入，它开启了很多新的可能性。微软在新的必应搜索引擎中使用了OpenAI和ChatGPT的修改版，称为"普罗米修斯模型"，尽管它不被认为是基于GPT-4的，作为最直接观察人工智能生成文本的前沿，必应在这个新模型上的迭代速度和效果如何值得关注。美国太平洋时间今天下午1点，OpenAI将在YouTube上举行网络广播，提供更多信息后续就会来到。https://www.youtube.com/openai...PC版：https://www.cnbeta.com.tw/articles/soft/1349431.htm手机版：https://m.cnbeta.com.tw/view/1349431.htm

ChatGPT能通过CFA考试吗？摩根大通研究人员试图找寻答案

ChatGPT能通过CFA考试吗？摩根大通研究人员试图找寻答案研究人员在长达11页的报告中写道，“基于预估的通过率和平均自报分数，我们得出的结论是ChatGPT可能无法在所有测试环境下通过CFA一级和二级考试。如果有提示，GPT-4将有较大机会通过CFA一级和二级考试。”CFA协会负责教育的董事总经理ChrisWiese承认，大语言模型将有能力正确回答一些考试问题。他说该公司还在考虑使用一种大语言模型技术来帮助CFA考生。近年来CFA考试的通过率有下降趋势，8月份一级考试通胀率平均为37%，远低于2018年43%的平均水平。常见错误CFA一级考试有180道单选题，二级考试包括案例研究和88道选择题。研究人员发现，无论使用何种类型的提示，这两个大语言模型的二级考试结果都不理想。一级考试中，ChatGPT和GPT-4在衍生品、另类投资、股权投资和伦理道德这几个部分得分最高。这两款聊天机器人在财务报告分析和投资组合管理方面表现都相对较差。二级考试中，与GPT-4相比，ChatGPT在另类投资、固定收益工具这两个部分表现更差，ChatGPT在投资组合管理、经济学相关的领域得分高于GPT-4。ChatGPT的大多数错误是基于知识性，而GPT-4最常犯的是计算错误。研究人员发现GPT-4比ChatGPT更容易出现推理错误。...PC版：https://www.cnbeta.com.tw/articles/soft/1394003.htm手机版：https://m.cnbeta.com.tw/view/1394003.htm

ChatGPT通过美放射学委员会考试

ChatGPT通过美放射学委员会考试为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性，多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。研究团队使用了150道选择题，这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。这些问题不包括图像，分为低阶（知识回忆、基本理解）和高阶（应用、分析、综合）思维问题。高阶思维问题可进一步细分为影像学表现描述、临床管理、计算和分类、疾病关联。研究人员发现，基于GPT-3.5的ChatGPT的正确率为69%，接近70%的及格线。该模型在低阶思维问题上表现相对较好，正确率为84%，但回答高级思维问题时表现不佳，正确率仅为60%。而性能更优异的GPT-4的正确率为81%，且在高阶思维问题上的正确率为81%，远好于GPT-3.5。但GPT-4在低阶思维问题上的正确率仅为80%，答错了12道题，而GPT-3.5全部答对了这些题目，这引发了研究团队对GPT-4收集信息的可靠性的担忧。这两项研究都表明，ChatGPT会有提供不正确答案的倾向，如果仅仅依靠它获取信息，非常危险，因为人们可能意识不到其给出的答案是不准确的，这是它目前面临的最大的问题。...PC版：https://www.cnbeta.com.tw/articles/soft/1360277.htm手机版：https://m.cnbeta.com.tw/view/1360277.htm

GPT-4发布：ChatGPT大升级太太太太强了

GPT-4发布：ChatGPT大升级太太太太强了（看图）手套掉下去会怎样？它会掉到木板上，并且球会被弹飞。甚至只需要简单在纸上画一个网站的草稿图：拍一张照片上传给GPT-4，它就可以立马生成网站的HTML代码！在性能表现上，OpenAI直接甩出一句话：在各种专业和学术基准上和人类相当！而且不只是发布GPT-4这么简单，OpenAI这次“啪的一下”把相关“大动作”一步到位了：ChatGPTPlus：集成GPT-4的ChatGPT升级版发布GPT-4的API公布技术论文*公开SystemCard不仅如此，传闻的“必应早就用上了GPT-4”在今天也得到了微软方面的证实：没错，确实是这样的！不得不说，自打ChatGPT问世以来，微软和Google之间打响的数轮科技战役，微软这次又双叒叕赢麻了。甚至这一次，不少网友都发出了“见证历史”的感慨：史上最强大模型正如之前传言，GPT-4确实拥有多模态能力，可以接受图像输入并理解图像内容。并且可接受的文字输入长度也增加到3.2万个token（约2.4万单词）。升级之后，GPT-4在各种职业和学术考试上表现和人类水平相当。比如模拟律师考试，GPT-4取得了前10%的好成绩，相比之下GPT-3.5是倒数10%。做美国高考SAT试题，GPT-4也在阅读写作中拿下710分高分、数学700分（满分800）。那么GPT-4这些新能力实际用起来是什么样的？技术报告中也给出不少展示。首先，看图能力可以用来解释表情包、梗图。提问这张图哪里好笑？GPT-4可以按顺序描述出每一格的内容，并总结出笑点：用巨大的过时VGA接口给小巧的现代智能手机充电。更进一步，GPT-4可以理解图表中数据的含义，并做进一步计算。甚至可以直接把论文截图发给它，GPT-4可以按像素处理其中的文字和图片，并给出对整篇论文的总结摘要。文字输入长度限制的增加，也大大扩展了GPT-4的实用性。发布会直播上，OpenAI总裁Gregman现场表演了一波GPT-4给代码修Bug。出现问题啥也不用想，直接把1万字的程序文档一股脑扔给GPT-4就行。格式也不用管，你只需要Ctrl+A、Ctrl+C、Ctrl+V。再最后附上出现的问题，在几秒钟内瞬间得到解决办法。在API方面，GPT-4还开放了一个使用功能，允许修改“系统提示”。之前ChatGPT的回答总是冗长而平淡，这是因为系统提示中规定了“你只是一个语言模型……你的知识截止于2021年9月”。现在通过修改这句话，GPT-4就可以展现出更多样的性格，比如扮演苏格拉底。也可以指定之后所有回答的形式，比如全用json格式。虽然GPT-4这波能力大升级，但之前ChatGPT会出现幻觉、胡说八道的毛病还是没能完全改掉。从前面的官方示例也可以看出，要想最大程度发挥GPT-4的能力，最好还是用上思维链路提示（Chain-of-thoughtPrompt）。操作起来也非常简单，只需在提问的时候额外提醒AI给出步骤，就能大大提高推理和计算的准确率。Google依旧在跟就在GPT-4发布前，Google方面为了迎战微软，宣布将一系列即将推出的AIGC功能，应用到自家产品中。包括GoogleDocs（文档）、Gmail、Sheets（表格）和Slides（幻灯片）。但不同于微软和OpenAI的“发布即可用”，Google只会先将Docs和Gmail中的AI工具，在月底提供给一些“值得信赖的开发人员”。而其它功能则将是在今年晚些时候向公众开放。至于具体时间，Google方面并没有具体说明。而外界对此评价是Google希望抢先微软原定于本周四的发布。但从今天的结果上来看，微软依旧提前“抢滩登陆”。OneMoreThing在GPT-4发布之前，便有网友做出了GPT-3和GPT-4参数量的对比图，并猜测GPT-4的参数量将达到100万亿。这一次亦是如此。有网友预言，未来GPT-5的参数量，会是这样的：但无论如何，这一次，我们离真·人工智能，更近了一步。...PC版：https://www.cnbeta.com.tw/articles/soft/1349495.htm手机版：https://m.cnbeta.com.tw/view/1349495.htm

新版 ChatGPT 可同时访问所有 GPT-4 工具

新版ChatGPT可同时访问所有GPT-4工具OpenAI计划推出一种使用多模式GPT-4的新方法，无需切换即可访问所有工具，并提供更多文档分析功能。许多ChatGPTPlus用户在X上分享的截图显示了PDF和文档分析的新功能以及"所有工具"功能。所有工具"可让用户访问GPT-4的所有功能，而无需在不同功能之间切换。此举被誉为一次重大飞跃，它超越了基于文本的查询，推动了生成式人工智能功能的发展。现在，用户可以上传一张图片，让DALL-E3做出回应，为他们的工作流程增添了新的维度。随着越来越多的用户开始使用新的多模态功能，更多关于如何将所有GPT-4工具结合在一起使用的例子也将出现。有趣的是，GPT-4的所有工具功能似乎并不包括ChatGPT插件。一些新功能可能会使许多第三方ChatGPT插件过时。这可能是为了简化用户体验而精心策划的举动，同时也是对以往提供类似功能的第三方插件的一种限制。在系统中直接分析PDF和其他文件的功能有效地消除了对第三方ChatGPT插件的需求，而这些插件一直以来都在填补这些空白。通过在最新版本的ChatGPT中整合这些功能，OpenAI回应了用户的反馈意见，创建了一个不依赖外部功能的更强大的工具。除了用户可以访问GPT-4AllTools之外，其他人也注意到了更近的知识截止日期。最新消息发布于OpenAI下周的DevDay大会之前，预计该公司将在会上与开发者探讨新工具。...PC版：https://www.cnbeta.com.tw/articles/soft/1393089.htm手机版：https://m.cnbeta.com.tw/view/1393089.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人