谷歌 I/O 开发者大会要点一览

谷歌I/O开发者大会要点一览1.将在美国推出“AI概览”(AIOverviews)的功能,搜索引擎会直接归纳总结搜索结果。2.谷歌搜索也将具备多步骤推理能力,可以一次性处理带有多个限制条件的长问题,并支持“拍视频”的新搜索形式。3.Gemini1.5Pro大模型在今年将会把100万Tokens的窗口扩大至200万Tokens,拓展同步处理多模态信息的边界。4.推出了Gemini1.5Flash模型,服务于需要快速响应的场景。5.推出参数量更大的Gemma2。6.在多模态领域,发布了文生图工具Imagen3、与Youtube&音乐家合作的“AI音乐沙盒”,以及最新的视频生成模型Veo。7.多模态GeminiNano模型也将在今年晚些时候登陆Pixel手机并能在本地运行。8.从今年夏天开始,Gemini将支持语音实时交互,还将上线实时视频交互。9.将推出称作Gems的自定义AI助手功能,并与整套“谷歌全家桶”联动。10.宣布第六代TPU芯片Trillium,较上一代芯片的算力表现翻4.7倍,并从下半年起使用。11.谷歌云在明年初用上英伟达最新的Blackwell架构GPU。

相关推荐

封面图片

谷歌 2024 年 I/O 开发者大会前瞻:人工智能成焦点

谷歌2024年I/O开发者大会前瞻:人工智能成焦点谷歌2024年I/O开发者大会将于美国东部时间5月14日13时(北京时间5月15日1时)举行,本届大会的焦点将是人工智能。大会还将举办超过10场与生成式人工智能相关的开发人员“技术分论坛”,主题包括人工智能大模型Gemma最新的进展、学习如何使用Gemini进行多模态检索增强生成。本届I/O开发者大会上,谷歌还将会发布新款Android15移动操作系统,预计Android15将会带来许多全新的人工智能功能,谷歌甚至有可能为Android15发布一款新的大语言模型。

封面图片

Google I/O 2024开发者大会即将开幕

GoogleI/O2024开发者大会即将开幕重头戏:AIGoogle已经明确表示,今年的I/O大会将围绕着AI展开。Google聊天机器人Gemini已经面世几个月了,也引发了一些争议。Google今年开发者大会主题演讲的重点可能是如何融合将搜索和生成式AI融合在一起。该公司一直在测试新的搜索功能,比如为英语学习者提供AI会话练习,以及为购物和虚拟试穿提供的图像生成功能。Google可能还会重点说明如何让用户的智能手机变得更像一款AI设备。这意味着,Google的应用程序将拥有更多生成式AI功能。该公司一直在开发AI功能,例如在Google地图上帮助用户提供餐馆或购物建议,寻找电动汽车充电桩。Google还在测试一项功能,利用AI来呼叫客服,并为你等待直到有人工客服可以对话。AI数字助手Google可能还将在I/O上推出一个新的,更个性化的数字助手,传闻称它的名字为“Pixie”。这款由Gemini驱动的智能助手有望整合多模态功能,比如为产品拍照以学习如何使用它们,或者为用户导航找到可以购买它们的地方。Pixie的推出对于RabbitR1、HumanAiPin等AI设备来说是个坏消息,后两款设备都在近期发布,但一直无法证明自己的存在感。目前,他们可能拥有的唯一优势就是,将智能手机用作AI可穿戴设备有还点困难(尽管并非不可能)。会发布硬件吗?Google今年似乎不太可能把重点放在新硬件上,因为Pixel8A手机已经可以预订,消费者现在可以购买重新推出、更便宜的Pixel平板电脑,除了磁吸式扬声器底座现在需要单独购买之外,一切都没有变化。该公司仍有可能预览Pixel9这样的新产品,这是典型的Google风格,但是它的信息已经泄露的到处都是了。当然,Google还可能公布PixelTablet2平板电脑的信息。Pixel9谍照Google或许还会讨论PixelFold可折叠手机的后续机型。近期传闻称,Google新一代可折叠手机可能不叫PixelFold2,而是使用Pixel9ProFold的名称。...PC版:https://www.cnbeta.com.tw/articles/soft/1430635.htm手机版:https://m.cnbeta.com.tw/view/1430635.htm

封面图片

Google I/O开发者大会即将召开 谷歌能重夺AI搜索话语权吗?

GoogleI/O开发者大会即将召开谷歌能重夺AI搜索话语权吗?I/O大会上,谷歌用AI彻底改革其搜索业务的努力,将展示这家科技巨头是如何应对竞争威胁的。在包括微软(MSFT.US)在内的竞争对手采取行动后,谷歌正在维护其在搜索市场上的主导地位。此前,微软宣布在其自家的搜索产品必应(Bing)中使用初创公司OpenAI的技术。此次I/O大会宣布的所有新产品都将基于谷歌的大型语言模型(LLM)——即从新闻文章、社交媒体帖子或其他互联网来源中获取大量数字文本的大型人工智能系统,并利用这些材料来训练软件,在收到提示或查询时自动预测和生成内容。谷歌是最早对LLM进行研究的公司,而LLM也是为OpenAI的ChatGPT等当前一批人工智能聊天机器人提供支持的主要技术。大会上,谷歌预计将公布这项研究工作的更多进展,以帮助其在竞争中保持领先。这些生成性人工智能技术将如何应用于公司的产品和服务尚待宣布,但搜索方面的任何变化都有可能颠覆用户在空白搜索栏中输入关键词,然后获得来源的相关链接列表的习惯。另外,曾在今年2月,谷歌宣布推出与ChatGPT竞争的人工智能聊天机器人Bard。但到目前为止,由于该款聊天机器人处于公测阶段,用户被要求加入等待名单,该产品的受众仍然有限。在I/O大会上,公众将了解到该公司是否对Bard有更宏伟的计划,以及是否会宣布对该产品的任何改进,因为测试人员在过去几周里指出了该款产品的缺陷和局限性。不过,到目前为止,谷歌对反对者的回应是强调Bard是一个“创造性的伙伴”,而不是取代其值得信赖的搜索产品。谷歌还暗示,该公司将在开发者大会上重点介绍新的生成式人工智能产品,包括其办公组件GoogleWorkspace(GoogleDocs、Sheets和Slides)以及云服务。谷歌过去曾表示,它的人工智能可以帮助制作幻灯片演示和销售培训文档,在会议期间做笔记,以及起草给同事的电子邮件,但实验仅限于谷歌云客户端。不过,该公司也指出,计划最终向公众提供这些功能。投资咨询公司ROBOGlobal的研究分析师ZenoMercer表示,谷歌现在正处于一个“需要快速迭代和做出改变的拐点”,就像它早期所做的那样。“如果不这样做,消费者将开始寻找替代品”。最后,预计谷歌将在大会上推出PixelFold可折叠手机。早前,该公司发布了一段关于该产品的预热视频和照片,从这些资料可以看到,这是一款带有内外屏的可折叠手机,采用横向折叠。...PC版:https://www.cnbeta.com.tw/articles/soft/1359013.htm手机版:https://m.cnbeta.com.tw/view/1359013.htm

封面图片

谷歌将在开发者大会上发布PaLM 2 展示创意写作和编码能力

谷歌将在开发者大会上发布PaLM2展示创意写作和编码能力这份内部文件显示,谷歌将推出其最新、最先进的LLM——PaLM2。PaLM2支持100多种语言,在内部以“统一语言模型”的代号运行。谷歌还对其进行了广泛的编码和数学测试,以及创意性的写作测试和分析。文件还显示,在这次活动上,谷歌将宣布人工智能如何“帮助人们充分发挥其潜力”的主题,包括Bard和搜索的“生成式体验”。谷歌及其母公司Alphabet首席执行官桑达尔·皮查伊(SundarPichai)将向现场的开发者发表演讲,介绍该公司在人工智能领域取得的进步。谷歌此次更新正值人工智能领域的竞争加剧之际,该公司和微软都在竞相将聊天人工智能技术融入自己的产品中。微软正在利用对ChatGPT创建者OpenAI的投资来支持其必应搜索引擎,而谷歌也迅速行动起来,试图在不同的团队中整合其Bard技术,并推出自己的LLM。谷歌于2022年4月首次宣布推出PaLMLanguage模型。今年3月,该公司推出了一款适用于PaLM的API以及一系列人工智能企业工具,称这将帮助企业“通过简单的自然语言提示生成文本、图像、代码、视频、音频等”。上个月,谷歌称其名为“Med-PaLM2”的医学LLM可以回答“专家医生级别”的医学检查问题,准确率达85%。文件显示,谷歌还计划分享Bard和搜索方面取得的进展,提供所谓的“生成式体验”,包括将Bard用于编码、数学和“逻辑”,以及扩展到日语和韩语。谷歌始终在开发一系列功能更强大的Bard模型,并于3月份正式将其作为实验推出。另一份内部文件显示,谷歌还在内部开发了一个名为“Multi-Bard”的多模态模型版本,它使用了更大的数据集,可以帮助解决复杂的数学和编码问题。此外,谷歌还测试了名为“BigBard”和“GiantBard”的版本。谷歌还计划扩展其“WorkspaceAIcollaborator”,包括在工作表中讨论模板生成,以及在幻灯片和Meet产品中讨论图像生成。今年3月,该公司表示,作为测试的一部分,它将允许一小部分用户访问Gmail和GoogleDocs中的人工智能功能,并计划在其会议、工作表和幻灯片应用程序中引入更多生成式人工智能功能。其中一张图片显示了一个带有聊天框的幻灯片侧边栏,允许用户输入文本,并可以选择根据这些文字创建图像。其他更新包括图像识别工具GoogleLens的用例。继去年允许用户询问他们正在观看的图像中的内容后,谷歌将展示对摄像头和语音的“多搜索”技术的改进。此前有报道称,在人工智能领域之外,谷歌将展示其新款可折叠手机PixelFold。该公司声称PixelFold将拥有“可折叠手机上最耐用的铰链”,并将提供手机以旧换新选项。谷歌宣称,PixelFold的最大卖点为防水和只有口袋大小。(小小)...PC版:https://www.cnbeta.com.tw/articles/soft/1358693.htm手机版:https://m.cnbeta.com.tw/view/1358693.htm

封面图片

2023谷歌I/O大会:AI接管谷歌搜索 Pixel Fold折叠屏来了

2023谷歌I/O大会:AI接管谷歌搜索PixelFold折叠屏来了“AI正在度过忙碌的一年”,谷歌和谷歌母公司Alphabet首席执行官桑达尔·皮查伊开场指出。当然,人工智能技术以及软件产品的突破外,本届发布会也带来了谷歌首款折叠机PixelFold、家庭平板Pixeltablet以及入门级的GooglePixel7a。PaLM2发布,Bard将向180个国家地区开放发布会开始,皮查伊在介绍了Gmail、GooglePhotos以及GoogleMaps之后,重点发布最新的人工智能(AI)语言模型“PaLM2”,向OpenAI的GPT-4等竞争对手发起了挑战。皮查伊称:“PaLM2在逻辑和推理方面进行了广泛的训练,具有极强的逻辑和推理能力。同时,它还接受了多语言文本训练,支持100多种语言。”谷歌在2022年4月首次发布了PaLM语言模型。谷歌高级研究总监斯拉夫·彼得罗夫(SlavPetrov)称,最新的PaLM2在一系列基于文本的任务上表现更好,包括推理、编码和翻译等。他说,“与PaLM1相比,PaLM2有了显著提升。”对于PaLM2,谷歌工程师在一份研究论文中称,该系统的语言熟练程度“足以教授这门语言”。与其他大型语言模型一样,PaLM2与其说是一款单一产品,不如说是一系列产品。它拥有不同的版本,可部署在消费者和企业环境中。据悉,PaLM2已被用于支持自家的25项功能和产品,其中包括AI聊天机器人Bard,以及谷歌文档、幻灯片和工作表等。基于最新发布的PaLM2谷歌的Bard聊天机器人得到进化,显著提高了回答的准确度和可用性。据悉,升级后的Bard特别擅长处理编码查询,包括调试和解释20多种语言的代码块。不仅可以提供来源,还可以解释某些代码块。最为重要的是,谷歌正在取消Bard的“等待名单”,将在180个国家和地区提供英语版本的Bard。从今天开始,AI接管了谷歌搜索谷歌I/O开发者大会现场,谷歌通过将生成式AI生成的结果,嵌入到搜索结果显示页中,向外界展示了不同于ChatGPT的新式搜索显示效果。大会上,谷歌搜索副总裁利兹·里德(LizReid)进行了现场演示,她打开笔记本电脑在谷歌搜索框中输入内容,“对于有3岁以下孩子和狗的家庭来说,布莱斯峡谷或拱门哪个更好?”敲下“回车键”后,谷歌立即给出了正常的搜索结果。与此同时,紧随在搜索结果下方,一个长方形的橙色部分闪闪发光,并显示“生成式人工智能正在试用中。”几秒钟后,发光部分被AI生成的摘要所取代:几段话详细分析了生成式AI的推理过程。在右边,还有三个网站的链接,辅助“证实”摘要中的内容。这是谷歌搜索结果页面的新面貌,“AI为先”,并且是五颜六色的,和我们之前所习惯的完全不同,谷歌将其称为“AI快照”。它改变了人们体验搜索的方式,尤其是在移动设备上,“AI快照”经常会吞噬你搜索结果的整个第一页。需要指出的是,要接入“AI快照”,必须选择一个名为“搜索生成体验”(SGE)的新功能。并不是所有的搜索都会引发AI答案,只有当谷歌的算法认为它比标准结果更有用时,AI才会出现。虽然,目前SGE还是一个实验,但这正在成为人们搜索方式的一个根本性的长期变化。AI增加了另一个输入层,帮助用户提出更好、更丰富的问题;同时,也增加了另一个输出层,旨在回答你的问题,并引导你找到新的答案。此外,本次发布会还介绍了谷歌将如何让其他人通过谷歌云使用人工智能,据悉,目前已经有数千家公司,正在使用谷歌的生成式AI平台来创建、综合和组织信息。连发三款硬件产品,PixelFold折叠屏来了发布会进行到80分钟后,Android系统才正式走上发布会舞台。据悉,现在世界上已有超过30亿台Android设备。在简单介绍了Android一直在做的智能垃圾邮件拦截、WhatsApp将于今年夏天登录WearOS以及智能追踪产品等动态后,此次发布会重点介绍了谷歌最新推出的三款智能硬件产品:GooglePixel7a、Pixeltablet以及GooglePixelFold。其中,入门级Pixel7A采用G2处理器,售价499美元,比去年的Pixel6A价格略有上涨,但却也有了新的相机系统。Pixeltablet是一款家庭平板,采用11寸屏幕,搭载G2自研处理器。pixeltablet不仅可以独立使用,连接电池底座就变成了家庭中枢,支持多用户访问并快速切换,不过可惜的是没有手写笔或键盘配件,售价499美元起。作为谷歌首款折叠屏产品,GooglePixelFold展开7.6英寸屏幕,流体铰链支持多角度悬停,正面和背面都有大猩猩玻璃Victus和IPX8防水。在质量上,PixelFold比iPhone14ProMax重,但特点是非常轻薄。在价格方面,谷歌PixelFold售价1799美元,约合人民币12000元。结语:人工智能正融入每个人的生活中从最先发布的PaLM2大模型,再到改造升级过的BardAI聊天机器人、谷歌搜索,乃至于GooglePixel7a、Pixeltablet以及GooglePixelFold等硬件产品。人工智能技术的影子,都不断融入到每一款产品当中。“让人工智能对每个人都有帮助是我们推进使命的最深刻方式。”这是皮查伊在谈及谷歌企业使命时候提出的观点。而在推动这一使命达成的过程中,谷歌也正通过不断地提高知识和学习、提高创造力和生产力,使其他企业能够创新地构建自己的工具并创建新的基础模型等方式,不断推动着人工智能融入到我们的生活当中。...PC版:https://www.cnbeta.com.tw/articles/soft/1359059.htm手机版:https://m.cnbeta.com.tw/view/1359059.htm

封面图片

谷歌宣布向云计算客户开放Gemini Pro 开发者可用其构建应用

谷歌宣布向云计算客户开放GeminiPro开发者可用其构建应用据报道,谷歌发布了面向企业的GeminiPro,允许开发者利用谷歌最新的人工智能模型构建应用程序。Gemini是一个通过大量数据训练的大型人工智能系统,可以根据用户的要求生成新内容。上周,谷歌推出了Gemini,声称这是第一款在许多领域都能超越OpenAIGPT-4的大语言模型,现在它又推出了面向企业的GeminiPro。谷歌云客户可以使用GeminiPro创建人工智能聊天机器人、易于查询的库存数据库以及营销演示等应用程序。该公司还强调,GeminiPro最初将免费提供给云客户,但有一些限制。不过,谷歌表示,最终计划确保其云人工智能产品的“价格具有竞争力”。谷歌公布的参数显示,GeminiPro基于文本的功能比其6月份发布的上一代人工智能模型PaLM2的输入成本低4倍,输出成本低2倍。谷歌云业务首席执行官托马斯·库里安(ThomasKurian)表示,这款人工智能模型的构建旨在“概括和无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频,就像人类同时看到、听到、阅读、收听和谈论不同类型的信息一样。”虽然谷歌是生成式人工智能领域的先驱,但其产品的受欢迎程度却远远落后于对手。上周,谷歌试图通过发布Gemini来反驳这种说法。Gemini有三款模型,分别为GeminiUltra、GeminiPro和GeminiNano。谷歌已经开始推出最小的Nano版本,可以直接在谷歌旗舰智能手机Pixel8Pro等设备上运行。同时,该公司还发布了定制版GeminiPro版本,这是谷歌的人工智能聊天机器人,旨在与OpenAI广受欢迎的ChatGPT展开竞争。通过向应用程序开发者和企业发布GeminiPro,谷歌希望发出这样的信息:它不再落后于OpenAI及其最新的人工智能系统GPT-4,该系统可通过合作伙伴微软的Azure云计算平台访问。谷歌表示,GeminiPro支持全球180个国家和地区的38种语言,目前接受文本作为输入,并可生成文本输出。谷歌还发布了一个专用的GeminiProVision平台,可以处理来自用户的基于文本和图像的提示。该公司还表示,GeminiUltra是该公司用于执行“高度复杂”任务的最大、功能最强的模型,在明年向公众发布之前,将向选定的云客户和合作伙伴提供早期试验。谷歌宣布,GeminiPro将被整合到两款关键的云产品中,即GoogleAIStudio和VertexAI。其中,GoogleAIStudio是一款基于网络的免费开发者工具,谷歌称其为“使用Gemini最快的构建方式”。该工具允许客户使用GeminiAPI开发应用程序。与此同时,VertexAI为开发者和云客户提供了更多的定制服务。企业将能够使用自己的数据定制Gemini,并构建基于Gemini的搜索工具和聊天机器人等应用程序。库里安表示,GeminiPro的定价正变得“更具吸引力”。该公司表示,开发者将可以通过GoogleAIStudio免费使用GeminiPro和GeminiProVision,这适用于大多数应用程序开发需求。更灵活的VertexAI在明年年初之前都是免费的。谷歌还公布了此前发布的人工智能模型的升级版本Imagen2,谷歌的文本到图像技术,将改进照片真实感,文本渲染和logo生成能力。谷歌还推出了MedLM,这是一系列针对医疗保健行业进行微调的模型,基于该公司在Med-PaLM2上所做的工作。Med-PaLM2是谷歌的人工智能模型,经过了专业医学知识的培训。谷歌还宣布与MistralAI建立全球合作伙伴关系,MistralAI是一家总部位于巴黎的人工智能初创公司,专注于开源软件。两家公司在一篇博客文章中表示,MistralAI将在谷歌云的基础设施上分发一些人工智能产品,包括优化的专有语言模型。虽然这项协议不具有排他性,但MistralAI的首席执行官兼联合创始人亚瑟·门施(ArthurMensch)赞扬了谷歌云灵活的工具和支持该公司产品的能力。他说:“谷歌云的开源支持和负责任开发人工智能技术的原则,广泛而可靠的基础设施能力,以及围绕隐私和安全做出的承诺,与我们开发开放可用模型的使命非常一致。”随着最近的发布,谷歌对Gemini的定位是“我们进入人工智能领域的下一步”,并吹嘘其拥有“最先进的能力”。这可能是谷歌试图转移人们对OpenAIChatGPT的关注,或者与他们正面交锋。如果发生这种情况,他们将更接近他们想要达到的目标。但目前,这些产品需要表现良好,并与消费者产生共鸣,包括云客户。...PC版:https://www.cnbeta.com.tw/articles/soft/1404299.htm手机版:https://m.cnbeta.com.tw/view/1404299.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人