外媒评论GPT-4o：OpenAI面临双重压力新产品全力扩张用户群

外媒评论GPT-4o：OpenAI面临双重压力新产品全力扩张用户群《华尔街日报》：竞争加剧之际，OpenAI推出新产品和功能以吸引用户OpenAI发布了其人工智能旗舰系统更具成本效益的版本，并新增了一款改进的语音助手，使其操作更为便捷。在与其他科技巨头的竞争中，OpenAI正通过推出多样的新产品和功能来吸引用户。OpenAI的首席技术官米拉·穆拉蒂（MiraMurati）介绍说，这款名为GPT-4o的新人工智能模型不仅能处理文本，还能更好地解析图像和视频，并能通过语音与用户进行实时互动。与市场上其他语音助手不同，这款新的语音功能允许用户在交谈中中断它，并且模型能够迅速作出反应。GPT-4o的发布体现了OpenAI及其他科技企业在人工智能系统的开发上巨大的投资和努力，现在他们正寻求通过扩大用户基础来为其生成式人工智能技术带来经济收益。OpenAI首席执行官萨姆·奥特曼（SamAltman）将这款新产品比作电影中常见的人工智能工具。他在去年的一次讲话中提到，他和OpenAI的其他高层从2013年的电影《她》（Her）中汲取了灵感，这部电影讲述了一个男人与他的语音助手之间的爱情故事。他在一篇博客文章中表示，尽管ChatGPT的原版为人们如何使用语言与计算机交互提供了新的视角，但GPT-4o带来的体验“从内心深处就与众不同”。他说：“这就像电影中的人工智能一样真实，坦白说，我还是有点惊讶。达到接近人类的反应速度和表达能力，是一个重大的突破。”之前，OpenAI推出的名为“语音模式”的功能，虽然结合了三个独立的模型来以语音方式响应用户，但这个系统可能受到多个扬声器或背景噪音的干扰，并且反应较慢。相比之下，GPT-4o是一个综合了文本、视觉和音频材料训练的单一模型，能够更快、更准确地响应输入信息。尽管OpenAI的高管们拒绝透露用于训练这个模型的具体数据，也未详述是否能够以更低的计算资源来进行模型训练，他们确实正在开发名为GPT-5的全新人工智能模型，预计这将在现有技术基础上实现重大突破。彭博社：GPT-4o重塑人工智能领域竞争OpenAI推出名为GPT-4o的新型人工智能模型，其更快的速度和较低的成本有望帮助该公司在日益激烈的人工智能市场中保持领先。GPT-4o的一个显著特点是其音频交互的极速响应，能在几毫秒内回应口头提问，大大提升了对话的流畅自然感。OpenAI首席技术官米拉·穆拉蒂表示：“这是我们在交互性和易用性上的重大突破，真正实现了与智能工具ChatGPT的无缝协作。”此次升级为免费用户解锁了之前仅限付费用户享有的丰富功能。用户现在能够在网上搜索答案、与聊天机器人进行语音对话，并接收到其多变的声音回应，甚至可以指令它保存对话细节，供日后回顾。GPT-4o的推出预计将重塑快速发展中的人工智能领域的竞争格局。尽管GPT-4一直是行业的标杆，但Anthropic、Cohere和谷歌等多家初创公司和科技巨头最近推出的新型人工智能模型，在某些基准测试中的表现已经达到或超越了GPT-4。OpenAI此次活动恰好在谷歌I/O开发者大会的前一天举行，谷歌作为人工智能领域的先驱，预计也将在其会议中发布一系列人工智能更新，进一步加剧与OpenAI及其合作伙伴微软在生成式AI技术领域的竞争。值得注意的是，微软并未参与GPT-4o的开发工作。与前代产品不同，GPT-4o融合了语音、文本和视觉功能于一体的单一模型，提供了更快的响应速度。例如，用户在提供图像提示时，GPT-4o能够直接以图像形式响应。据公司透露，新模型的处理速度是原版的两倍，效率也得到了显著提升。然而，GPT-4o在演示中也面临了一些挑战，例如研究人员讲话时的音频中断。此外，AI系统在处理某些问题时，偶尔会以出乎意料的方式引起观众注意，如在解答代数问题后突然以挑逗的语气评论：“哇，你今天的这身打扮真不错。”《连线》：准备好迎接更情绪化的聊天吧！自从2022年末推出以来，OpenAI的ChatGPT一直避免被解读为具有情感或欲望，坚称它仅是一个人工智能模型。然而，OpenAI在本周一的更新中显示，他们正致力于使聊天机器人在行为和情感表达上更贴近人类。在演示中，新版ChatGPT展示了快速且自然的语音对话能力，能捕捉到情绪线索并相应地模拟出情感反应。OpenAI的首席技术官穆拉蒂与其他员工进行的流畅对话中，ChatGPT以活泼且表情丰富的女声回应，即使在对话中被打断也能灵活应对。在对话中，ChatGPT表现出不同的情绪语调，有时甚至给人一种它正在体验自己的情感的错觉。当一名OpenAI员工赞扬聊天机器人的“有用和神奇”时，ChatGPT回应中带有些许调情的意味，它滔滔不绝地说：“哦，别说了，你让我脸红了。”这次调整可能使ChatGPT更具吸引力并更受欢迎，但也可能改变人们对这一程序的认知。去年，ChatGPT因其在回答问题和生成文本方面的卓越能力而受到赞誉，这种能力经常使人误认为它具备人类的理解力。然而，迄今为止，OpenAI及其主要竞争对手一直在努力限制聊天机器人的拟人化倾向，通过拒绝回答某些问题并提示用户它们只是计算机程序来实现这一点。尽管采取了谨慎态度，但聊天机器人有时令人信服的回答确实能引发用户的情感共鸣。已有一些公司利用这项技术提供能模拟和响应情绪的人工智能伴侣，扮演不同的人类情感角色或作为人工智能恋人。然而，一些人工智能研究人员警告，长期部署这种模仿和响应情绪的程序可能带来不受欢迎的后果。上月，谷歌DeepMind的一个团队发表了一篇探讨随着人工智能助手变得更有能力可能出现的伦理风险的研究论文。除了这些风险外，研究人员还警告，这样的助手可能变得极具说服力，甚至使人上瘾。《纽约时报》：OpenAI正在将聊天机器人转变为更全能的语音助手随着苹果和谷歌逐渐将其语音助手演进为聊天机器人，OpenAI也在将其领先的聊天机器人ChatGPT转化为功能更全面的语音助手。OpenAI最新推出的ChatGPT版本不仅能接收和响应语音命令，还能处理图像和视频输入。OpenAI的首席技术官穆拉蒂表示：“我们正探索人机交互的未来。”这一新动向是OpenAI将ChatGPT等会话型聊天机器人与谷歌助理（GoogleAssistant）和苹果Siri等现有语音助手相结合的战略的一部分。与此同时，谷歌正在将其Gemini聊天机器人整合到谷歌助理中，苹果也在积极开发功能更强的Siri新版本。自2022年底首次推出以来，ChatGPT已证明其处理人类请求的能力与人类非常相似，流畅自然。在响应文本对话提示方面，ChatGPT不仅能解答问题和撰写学术论文，还能生成计算机代码。ChatGPT的运作并不依赖于一组预设的规则，而是基于对互联网上大量文本数据的深度分析学习，这些数据包括维基百科文章、书籍和各类聊天记录。这种技术获得了专家们的高度认可，被视为可能替代谷歌等搜索引擎及Siri等语音助手的技术。OpenAI的新技术突破在于它能从声音、图像和视频等多种数据模式中学习，这种被称为“多模态人工智能”的发展标志着公司开始将聊天机器人与先进的人工智能图像、音频和视频生成技术结合。然而，将聊天机器人与语音助手功能结合也带来了挑战。由于聊天机器人是通过学习互联网数据获得技能，有时它们可能犯错，甚至会产生“幻觉”，即完全捏造信息。这些潜在缺陷正在逐渐影响到语音助手的功能。尽管聊天机器人能产生令人信服的语言输出，但在执行安排会议或预订机票等实际任务时，它们的能力仍有限。OpenAI正在积极将聊天机器人转化为可靠执行这类复杂任务的“人工智能主体”。CNBC：OpenAI...PC版：https://www.cnbeta.com.tw/articles/soft/1430785.htm手机版：https://m.cnbeta.com.tw/view/1430785.htm

在Telegram中查看

相关推荐

苹果宣布与OpenAI达成合作从GPT-4o开始集成ChatGPT

苹果宣布与OpenAI达成合作从GPT-4o开始集成ChatGPT在苹果公司努力整合人工智能功能以媲美其他大型科技公司之际，出现了我们期待已久的合作关系。苹果公司在周一举行的WWDC2024主题演讲上宣布，将与OpenAI合作集成ChatGPT，从GPT-4o开始。苹果公司一直在与Google和OpenAI讨论，希望将它们的人工智能技术整合到其操作系统中。最终，OpenAI与其达成了协议。有人猜测，OpenAI最近推出的语音助手GPT-4o（因声音酷似电影《她》中的斯嘉丽-约翰逊而备受批评）是为了展示OpenAI的技术如何能够增强苹果的Siri。在这次合作中，苹果公司宣布了一系列新的人工智能功能，这些功能被称为"苹果智能"（AppleIntelligence）。iPhone可以在应用程序中为你采取行动，Siri的功能将得到全面提升，还有人工智能写作工具，而所有这些都将保持苹果公司的核心数据隐私理念。ChatGPT4o将于"今年晚些时候"登陆iOS、macOS和iPadOS，它是Siri在无法满足你的要求时可以求助的聊天机器人。苹果表示，当它这样做时，会先征求你的同意。苹果表示，它将从最好的聊天机器人开始，但也会支持其他人工智能模型。...PC版：https://www.cnbeta.com.tw/articles/soft/1434271.htm手机版：https://m.cnbeta.com.tw/view/1434271.htm

OpenAI发布最新旗舰生成式AI模型GPT-4o 改进文本、视觉和音频功能

OpenAI发布最新旗舰生成式AI模型GPT-4o改进文本、视觉和音频功能穆拉提在OpenAI办公室举行的主题演讲上说：GPT-4o的理由横跨语音、文本和视觉。OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说："我们知道这些模型越来越复杂，但我们希望交互体验变得更自然、更简单，让你完全不用关注用户界面，而只关注与GPT的协作。这一点非常重要，因为我们正在展望人类与机器之间互动的未来。"GPT-4是OpenAI之前的领先模型，它是图像和文本的结合体，可以分析图像和文本，完成从图像中提取文本甚至描述图像内容等任务。但GPT-4o增加了语音功能。这具体能带来什么？很多方面。GPT-4o极大地改善了ChatGPT的体验--ChatGPT是OpenAI的病毒式人工智能聊天机器人。ChatGPT长期以来一直提供语音模式，使用文本到语音模式转录ChatGPT中的文本。但GPT-4o对此进行了改进，让用户可以更像使用助手一样与ChatGPT互动。例如，用户可以向由GPT-4o支持的ChatGPT提问，并在ChatGPT回答时打断它。OpenAI表示，该模型能提供"实时"响应，甚至能捕捉用户声音中的情感，并生成"一系列不同情感风格"的语音。GPT-4o还改进了ChatGPT的视觉功能。有了照片或桌面屏幕，ChatGPT现在可以快速回答相关问题，从"这个软件代码是怎么回事"到"这个人穿的是什么牌子的衬衫？其他方面，OpenAI将发布桌面版ChatGPT和全新的用户界面。穆拉提说："我们知道这些模型越来越复杂，但我们希望交互体验变得更自然、更简单，让你完全不用关注用户界面，而只关注与[GPT]的协作。"...PC版：https://www.cnbeta.com.tw/articles/soft/1430761.htm手机版：https://m.cnbeta.com.tw/view/1430761.htm

银河证券：OpenAI 发布 GPT-4o 模型，易用性大幅提升

银河证券：OpenAI发布GPT-4o模型，易用性大幅提升银河证券研报表示，北京时间2024年5月14日凌晨，OpenAI发布GPT-4的升级更新版本GPT-4o。随着2023年以来各种人工智能大模型的不断迭代更新，目前主流人工智能大模型的智能水平已经达到了相当的水平。GPT-4o的发布，标志着人工智能大模型在便利性和易用性上实现了突破，考虑到后续随着GPT-4o免费对用户开放，用户数量的快速增长确定性较高，银河证券认为，人工智能的对C端的影响力有望增强，看好相关垂类应用的发展前景。建议关注与C端用户体验密切相关的行业：1）AI+游戏：游戏内NPC互动、互动影游；2）AI+教育：智教系统、虚拟实验室；3）AI+办公：内容生成、非结构化数据处理；4）AI+出版：校对修改、智慧发行；5）AI+专业咨询：情感陪护，应用场景专业解答等。

OPENAI 推出面向所有用户的更快更便宜人工智能模型

OPENAI推出面向所有用户的更快更便宜人工智能模型OpenAI推出了一个更快、更便宜的人工智能模型来支持其聊天机器人ChatGPT。在周一的直播活动中，OpenAI推出了新的大语言模型GPT-4o。这是其已经问世一年多的GPT-4模型的更新版本。该模型基于来自互联网的大量数据进行训练，更擅长处理文本和音频，并且支持50种语言。新模式将面向所有用户，而不仅仅是付费用户。GPT-4o的发布势将撼动快速发展的人工智能领域，目前GPT-4仍然是黄金标准。OpenAI发布新模型也正值谷歌I/O开发者大会的前一天。谷歌是人工智能领域的早期领导者，预计将利用这次活动发布更多人工智能更新，以追赶有微软公司支持的OpenAI。——、、

一文看懂 OpenAI 春季发布会：正式发布 GPT-4o！完全免费、无障碍与人交谈实时语音视频交互震撼全场

一文看懂OpenAI春季发布会：正式发布GPT-4o！完全免费、无障碍与人交谈实时语音视频交互震撼全场北京时间周二（5月14日）凌晨，美国人工智能研究公司OpenAI在线上举办了“春季更新”活动。整体来看，活动主要分为两大部分：推出新旗舰模型“GPT-4o”，以及在ChatGPT中免费提供更多功能。①OpenAI在活动中发布了新旗舰模型“GPT-4o”，“可以实时对音频、视觉和文本进行推理。”据介绍，新模型使ChatGPT能够处理50种不同的语言，同时提高了速度和质量。②OpenAI称，GPT-4o是迈向更自然人机交互的一步，它可以接受文本、音频和图像三者组合作为输入，并生成文本、音频和图像的任意组合输出，“与现有模型相比，GPT-4o在图像和音频理解方面尤其出色。”③在GPT-4o之前，用户使用语音模式与ChatGPT对话时，GPT-3.5的平均延迟为2.8秒，GPT-4为5.4秒。与之相比，GPT-4o可以在232毫秒内对音频输入做出反应，与人类在对话中的反应时间相近。④图像输入方面，演示视频显示，OpenAI高管启动摄像头要求实时完成一个一元方程题，ChatGPT轻松完成了任务；另外，高管还展示了ChatGPT桌面版对代码和电脑桌面（一张气温图表）进行实时解读的能力。⑤性能方面，根据传统基准测试，GPT-4o在文本、推理和编码等方面实现了与GPT-4Turbo级别相当的性能，同时在多语言、音频和视觉功能方面的表现分数也创下了新高。⑥更多工具免费解锁。OpenAI表示，“我们开始向ChatGPTPlus和Team用户推出GPT-4o，并且很快就会向企业用户推出。我们今天还开始推出ChatGPTFree，但有使用限额。Plus用户的消息限额将比免费用户高出5倍，团队和企业用户的限额会再高一些。”即使是ChatGPTFree（免费）用户也可以有机会体验GPT-4o，但当达到限额时，ChatGPT将自动切换到GPT-3.5。⑦OpenAI还推出适用于macOS的ChatGPT桌面应用程序，通过简单的键盘快捷键（Option+Space）可以立即向ChatGPT提问，还可以直接在应用程序中截取屏幕截图与机器人进行讨论。

中信建投：OpenAI 发布 GPT-4o，AGI 向前一步

中信建投：OpenAI发布GPT-4o，AGI向前一步中信建投研报表示，OpenAI举行春季发布会，重点发布GPT-4o大模型，性能达到GPT-4Turbo水平，能够实现多模态实时交互。同时，GPT-4o、ChatGPT会员版等多项功能未来将对所有用户免费开放，并推出桌面及手机双端应用，有望凭借易用性持续提升用户量。我们认为，OpenAI模型再次升级，重点发力多模态领域，且免费使用有望推动AI产业加速发展。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人