苹果研究人员探索放弃“Siri”短语,改用人工智能聆听

苹果研究人员探索放弃“Siri”短语,改用人工智能聆听据周五(3月22日)发表的一篇论文称,苹果公司的研究人员正在研究是否有可能利用AI来检测用户何时在对iPhone等设备说话,从而消除对“Siri”等触发短语的技术需求。在一项上传到Arxiv且未经同行评审的研究中,研究人员使用智能手机捕获的语音以及来背景噪声的声学数据来训练一个大型语言模型,以寻找可能表明用户何时需要设备帮助的模式。论文中研究人员写道:“该模型部分基于OpenAI的GPT-2版本构建,因为它相对轻量级,可以在智能手机等设备上运行。”论文描述了用于训练模型的超过129小时的数据和额外的文本数据,但没有说明训练集的录音来源。据领英个人资料,七位作者中有六位列出他们的隶属关系为苹果公司,其中三人在该公司的Siri团队工作。论文称,结果令人鼓舞。该模型能够比纯音频或纯文本模型做出更准确的预测,并且随着模型规模的扩大而进一步改进。——、

相关推荐

封面图片

消息称苹果研究人员正探索免唤醒词呼叫 Siri,用 AI 聆听取代

据《麻省理工科技评论》报道,当地时间周五(22)日发表的一篇论文显示,苹果公司的研究人员正在探索利用人工智能来检测用户何时在与iPhone等设备交谈的可能性,从而消除像“Siri”这样的触发短语的技术需求。在这项上传到Arxiv且未经同行评审的研究中,研究人员使用智能手机捕获的语音以及来自背景噪音的声学数据,训练了一个大型语言模型,以寻找“可能表明用户需要设备辅助”的模式。论文中称,该模型部分基于OpenAI的GPT-2构建,因为它相对轻量级,可以在智能手机等设备上运行。论文还描述了用于训练模型的超过129小时的数据、额外的文本数据,但没有说明训练集的录音来源。据领英个人资料,七位作者中有六位列出他们的隶属关系为苹果公司,其中三人在苹果Siri团队工作。论文最终得出的结论“令人鼓舞”,声称该模型能够比纯音频或纯文本模型做出更准确的预测,并且随着模型规模的扩大而进一步改进。目前,Siri的功能是通过保留少量音频来实现的,听到“嘿,Siri”等触发短语之前,不会开始录制或准备回答用户提示。斯坦福人类中心人工智能研究所的隐私和数据政策研究员詹・金表示,取消“嘿,Siri”提示可能会增加对设备“始终监听”的担忧。via匿名标签:#Apple频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

苹果研究人员探索免唤醒词呼叫 Siri

苹果研究人员探索免唤醒词呼叫Siri据《麻省理工科技评论》报道,当地时间周五(22)日发表的一篇论文显示,苹果公司的研究人员正在探索利用人工智能来检测用户何时在与iPhone等设备交谈的可能性,从而消除像“Siri”这样的触发短语的技术需求。在这项上传到Arxiv且未经同行评审的研究中,研究人员使用智能手机捕获的语音以及来自背景噪音的声学数据,训练了一个大型语言模型,以寻找“可能表明用户需要设备辅助”的模式。论文中称,该模型部分基于OpenAI的GPT-2构建,因为它相对轻量级,可以在智能手机等设备上运行。论文还描述了用于训练模型的超过129小时的数据、额外的文本数据,但没有说明训练集的录音来源。据领英个人资料,七位作者中有六位列出他们的隶属关系为苹果公司,其中三人在苹果Siri团队工作。论文最终得出的结论“令人鼓舞”,声称该模型能够比纯音频或纯文本模型做出更准确的预测,并且随着模型规模的扩大而进一步改进。

封面图片

苹果研究人员探索放弃“Siri”短语,改用#人工智能聆听https://www.bannedbook.org/bnews/itn

封面图片

研究发现:用人工智能生成的图像训练出的人工智能产生了糟糕的结果。

研究发现:用人工智能生成的图像训练出的人工智能产生了糟糕的结果。斯坦福大学和莱斯大学的研究人员发现,生成式人工智能模型需要“新鲜的真实数据”,否则输出的质量就会下降。这对摄影师和其他创作者来说是个好消息,因为研究人员发现,训练数据集中的合成图像会放大人工痕迹,使人工智能画出的人类看起来越来越不像真人。研究小组将这种状况命名为“模型自噬障碍”。如果自噬循环的每一代都没有足够的新鲜真实数据,未来的生成模型注定会逐渐降低其质量或多样性。如果该研究论文是正确的,那么这意味着人工智能将无法开发出无穷无尽的数据源。人工智能仍然需要真实、高质量的图像来不断进步,而不是依赖自己的输出。这意味着生成式人工智能将需要摄影师。——

封面图片

苹果可能会在WWDC上宣布放弃 "Hey Siri"触发短语

苹果可能会在WWDC上宣布放弃"HeySiri"触发短语在一条新的推文中,Gurman重申,下周有可能改变Siri的触发短语。11月,他撰写报道说,苹果正在研究一种方法,使Siri能够理解和响应命令,而不需要使用"HeySiri"作为触发短语。相反,用户只需要说"Siri"。该公司正在研究一项举措,在触发短语中取消"Hey",这样用户只需要说"Siri"--连同一个命令。虽然这可能看起来是一个小变化,但实现这一转换是一个技术挑战,需要大量的人工智能培训和基础工程工作。这种复杂性涉及到Siri能够以多种不同的口音和方言理解"Siri"这个单数短语。有两个词--"HeySiri"--增加了系统正确接收信号的可能性。这一变化将使Siri更接近亚马逊的语音助手,只需以"Alexa"作为命令的开头,就可以触发Siri。Gurman补充说,苹果还在努力将Siri与第三方应用程序和服务进行更深层次的整合,以提供更好的帮助,这得益于额外的背景。Gurman最初说,对Siri的改变预计将在2023年或2024年的某个时候推出,但他的最新推文表明,在下周的WWDC上,这是一个明显的可能性。...PC版:https://www.cnbeta.com.tw/articles/soft/1363247.htm手机版:https://m.cnbeta.com.tw/view/1363247.htm

封面图片

MIT研究人员发明可以用声音模拟世界的人工智能系统

MIT研究人员发明可以用声音模拟世界的人工智能系统计算机视觉是一个在过去几十年中被研究得相当多的领域,主要是因为它在建造自动驾驶汽车和其他可以像人类一样"看"世界的工具方面有着直接和明显的应用。然而,直到最近才看到这种水平的研究的一个领域是使用声音而不是视觉来模拟环境。现在,麻省理工学院(MIT)的研究人员已经撰写了一篇研究论文,涉及在这一领域训练的机器学习(ML)模型的构建。PC版:https://www.cnbeta.com.tw/articles/soft/1331483.htm手机版:https://m.cnbeta.com.tw/view/1331483.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人