传谷歌即将发布GPT-4竞品Gemini

传谷歌即将发布GPT-4竞品Gemini据知情人士透露，国外媒体TheInformation报道称，Google已向少数公司提供了Gemini早期版本进行测试，Gemini模型的正式发布即将到来。Gemini是GoogleDeepMind团队紧锣密鼓开发的下一代AI模型，据悉是Google第一个能够处理文字、图片、视频等不同数据形式的多模态模型，同时可望帮助软件工程师根据提示需求生成代码，加速软件开发。投稿：@ZaiHuaBot频道：@TestFlightCN

在Telegram中查看

相关推荐

谷歌集大成之作要来了据称将发布AI大模型Gemini 对标GPT-4

谷歌集大成之作要来了据称将发布AI大模型Gemini对标GPT-4在ChatGPT掀起的人工智能浪潮中，谷歌今年加大了对生成式人工智能（AIGC）的投资，试图迎头赶上。该公司花费了大量的计算资源和人力来开发这款产品，因此对谷歌来说，Gemini的发布事关重大。而允许外部开发者使用Gemini意味着谷歌正在考虑将其纳入其消费者服务。据知情人士透露，谷歌并将发布不同大小的Gemini版本，这样开发者就可以购买一个不那么复杂的版本来处理简单的任务，或者一个足够小的版本来在个人设备上运行。Gemini的功能Gemini是一个大语言模型的集合，它支持多种功能，包括：聊天机器人、生成原始文本、根据用户的要求总结文本等。Gemini还有望帮助软件工程师编写代码，并根据用户的要求生成原始图像。与现有型号相比，Gemini将大大提高帮助软件开发人员生成代码的能力。谷歌希望用它来追赶微软的GitHubCopilot代码助手，该助手由OpenAI的模型驱动，现在已经成为一个大热产品。谷歌此前还讨论过使用Gemini来增强图表分析等功能，比如让该模型解释已完成图表的含义；以及使用文本或语音命令来浏览网页浏览器或其他软件。此外，谷歌计划通过其谷歌云的VertexAI服务向企业提供Gemini模型，变相促进了谷歌的云服务业务。除了推动云服务器租赁业务外，谷歌还寄望于该软件为其所有业务提供动力，从其Bard聊天机器人到Workspace软件的新功能。...PC版：https://www.cnbeta.com.tw/articles/soft/1384103.htm手机版：https://m.cnbeta.com.tw/view/1384103.htm

Bard 在 Imsys 排行榜排名超越 GPT-4，Bard + Gemini Ultra 即将发布

GoogleDeepMind和谷歌研究院首席科学家JeffDean在X上表示，由GeminiPro模型提供支持的Bard首次亮相就在Imsys排行榜排名第二，超越了GPT-4，Bard+GeminiUltra即将发布。LMSYSOrg是一个开放的研究组织，由加州大学伯克利分校的学生和教师与加州大学圣地亚哥分校和卡耐基梅隆大学合作创立。via匿名标签:#Bard#AI频道:@GodlyNews1投稿:@GodlyNewsBot

超越GPT4！谷歌大杀器终于来了最大规模Gemini震撼发布

超越GPT4！谷歌大杀器终于来了最大规模Gemini震撼发布这次发布的Gemini大模型是原生多模态大模型现在，Google的类ChatGPT应用Bard已经升级到了GeminiPro版本，实现了更为高级的推理、规划、理解等能力，同时继续保持免费。Google预计在明年初将推出“BardAdvanced”，其将使用GeminiUltra。这是Bard问世以来最大的更新。自ChatGPT发布以来，我们一直对Google声称的竞品Gemini模型的能力非常好奇，这款大模型早在今年3月就有了风声，5月的I/O大会上进入“即将推出”的状态。随着知情人士不断透露新信息，我们能了解到：据说Gemini有万亿参数，训练动用的算力是GPT-4的五倍。但Gemini的正式发布却似乎因为各种原因而屡遭推迟。为了与OpenAI和微软展开竞争，Google果断从PaLM2切换到了Gemini上，甚至在今年4月份直接把Google大脑（GoogleBrain）和DeepMind合并在了一起，Gemini就由新组成的GoogleDeepMind汇合两个实验室的力量进行攻关。可见Google在大模型军备竞赛上孤注一掷的心态。那么，Gemini真的能够给我们带来惊喜吗？除了在各种Benchmark上拿到最优成绩，甚至超越人类以外，有趣的是，在新闻发布会上，面对记者有关“Gemini相比以前的大模型有哪些新能力”的提问，GoogleDeepMind产品副总裁EliCollins回答说：“我怀疑有”，表示Google仍然在努力了解GeminiUltra的全部能力。以下为GoogleCEO皮查伊的声明：每一次技术变革都是推进科学发现、加速人类进步和改善生活的机会。我相信我们现在所看到的人工智能转变将是我们一生中最深刻的转变，远远大于之前向移动或网络的转变。人工智能有潜力为世界各地的人们创造从日常生活到非凡的机会。它将带来新一波的创新和经济进步，并以前所未有的规模推动知识、学习、创造力和生产力。这让我感到兴奋：有机会让人工智能为世界各地的每个人提供帮助。作为一家人工智能优先的公司，我们已经走过了近八年的历程，进步的步伐只会不断加快：数百万人现在在我们的产品中使用生成式人工智能来完成一年前无法完成的事情，从寻找答案到更复杂的问题使用新工具进行协作和创造的问题。与此同时，开发人员正在使用我们的模型和基础设施来构建新的生成式人工智能应用程序，世界各地的初创公司和企业正在利用我们的人工智能工具不断成长。这是令人难以置信的势头，然而，我们才刚刚开始触及可能性的表面。我们正在大胆而负责任地开展这项工作。这意味着我们的研究要雄心勃勃，追求能够为人类和社会带来巨大利益的能力，同时建立保障措施并与政府和专家合作，应对人工智能变得更加强大的风险。我们将继续投资最好的工具、基础模型和基础设施，并在我们的人工智能原则的指导下将它们引入我们的产品和其他产品中。Google大模型Gemini正式发布GoogleDeepMindCEO和联合创始人DemisHassabis代表Gemini团队正式推出了大模型Gemini。Hassabis表示长久以来，Google一直想要建立新一代的AI大模型。在他看来，AI带给人们的不再只是智能软件，而是更有用、更直观的专家助手或助理。今天，Google大模型Gemini终于亮相了，成为其有史以来打造的最强大、最通用的模型。Gemini是Google各个团队大规模合作的成果，包括Google研究院的研究者。特别值得关注的是，Gemini是一个多模态大模型，意味着它可以泛化并无缝地理解、操作和组合不同类型的信息，包括文本、代码、音频、图像和视频。Google表示，Gemini还是他们迄今为止最灵活的模型，能够高效地运行在数据中心和移动设备等多类型平台上。Gemini提供的SOTA能力将显著增强开发人员和企业客户构建和扩展AI的方式。目前，Gemini1.0提供了三个不同的尺寸版本，分别如下：GeminiUltra：规模最大、能力最强，用于处理高度复杂的任务；GeminiPro：在各种任务上扩展的最佳模型；GeminiNano：用于端侧（on-device）任务的最高效模型。Google对Gemini模型进行了严格的测试，并评估了它们在各种任务中的表现。从自然图像、音频和视频理解，到数学推理等任务，GeminiUltra在大型语言模型研发被广泛使用的32个学术基准测试集中，在其中30个测试集的性能超过当前SOTA结果。另外，GeminiUltra在MMLU（大规模多任务语言理解数据集）中的得分率高达90.0%，首次超越了人类专家。MMLU数据集包含数学、物理、历史、法律、医学和伦理等57个科目，用于测试大模型的知识储备和解决问题能力。针对MMLU测试集的新方法使得Gemini能够在回答难题之前利用其推理能力进行更仔细的思考，相比仅仅根据问题的第一印象作答，Gemini的表现有显著改进。在大多数基准测试中，Gemini的性能都超越了GPT-4。更多细节，请查看详细的测试报告：https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf在最新版本的MMMU测试集中，GeminiUltra也取得了得分为59.4%的最佳成绩。增强版的测试集由需要慎重推理的多模态任务组成。在图像基准方面的测试中，GeminiUltra不需要从图像中提取文本就能进行OCR处理，这凸显了Gemin内置的强大多模态能力，也初步显示了Gemini具有更复杂推理能力的先兆。下一代全方位能力升级Gemini在设计时原生地支持多模态，从一开始便在不同模态上进行了预训练，然后利用额外的多模态数据进行微调以提升有效性。因此，Gemini能够无缝地理解和推理各种输入，远远优于现有多模态模型，并且它的能力在几乎每个领域都是最强的。复杂推理能力Gemini1.0具有复杂多模态推理能力，可以帮助理解复杂的书面和视觉信息。这使得它尤其擅长发现海量数据中难以辨别的知识。Gemini1.0通过阅读、过滤和理解信息具有了从数十万份文件中提取insights的超凡能力，这有助于科学、金融等诸多领域以超快的速度取得新突破。同时理解文字、图像、音频以及更多模态的信息经过训练，Gemini1.0可以同时识别和理解文本、图像、音频等，因此它能够更全面地理解输入中信息的细节，也能回答与复杂主题相关的问题。因此，它特别擅长对数学和物理等复杂学科的问题进行推理。如下图所示，一位老师画了一个滑雪者从斜坡上下来的物理问题，而一位学生则提出了一个解决方案来计算滑雪者在斜坡底部的速度。利用Gemini的多模态推理能力，该模型能够读懂凌乱的笔迹，正确理解问题的表述，将问题和解决方案都转换为数学公式，识别出学生在解决问题时出错的具体推理步骤，然后给出问题的正确解决方案。高级编码Gemini可以理解、解释和生成流行编程语言（如Python、Java、C++、Go）的高质量代码，具备强大的跨语言工作和推理复杂信息的能力使其成为世界领先的编码基础模型之一。GeminiUltra在多个编码基准测试中表现出色，包括HumanEval（用于评估编码任务性能的重要行业标准）和Natural2Code（Google内部数据集），该数据集使用作者生成的源代码而不是基于网络的信息。Gemini还可以用作更高级编码系统的引擎。两年前，Google推出了AlphaCode，这是第一个在编程竞赛中达到竞争性水平的人工智能代码生成系统。使用Gemini的专门版本，Google创建了更先进的代码生成系统AlphaCode2，它擅长解决超出编码范围、涉及复杂数学和理论计算机科学的竞争性编程问题。经过与原始AlphaCode在相同平台上进行评估，AlphaCode2展现出巨大的改进，解决的问题数量几乎是原来的两倍。专用TPU训练Google使用内部设计的张量处理单元(TPU)v4和v5e在人工智能优化基础设施上对Gemini1.0进...PC版：https://www.cnbeta.com.tw/articles/soft/1402613.htm手机版：https://m.cnbeta.com.tw/view/1402613.htm

外媒：谷歌发布Gemini更多是为营销仍落后于GPT-4

外媒：谷歌发布Gemini更多是为营销仍落后于GPT-4一年前，谷歌被OpenAI的聊天机器人ChatGPT打了个措手不及，此后就一直渴望描绘出自己在人工智能领域快速进步的画面。本周三谷歌突然提前发布了新的人工智能模型Gemini，可以发现魔术中的技巧，并在会计认证考试中取得好成绩。谷歌发布的演示视频也在社交媒体上引起了轰动，但从技术角度来看，谷歌仍然在追赶OpenAI。从谷歌Gemini与OpenAI顶级模型GPT-4的性能对比来看，谷歌最强大的GeminiUltra在高中物理、专业法律测试以及道德场景等大多数基准测试中都优于GPT-4。要知道，当前的人工智能竞赛几乎完全是由这些能力定义的。但在大多数基准测试中，GeminiUltra只比GPT-4高出几个百分点。换句话说，谷歌所谓的顶级人工智能模型较OpenAI至少一年前完成的工作效果提升有限。如果GeminiUltra真如谷歌所说那样在明年1月初发布，那么可能不会在顶级人工智能模型的头把交椅上呆太久时间。在谷歌努力追赶OpenAI的过程中，后者有将近一年的时间来开发新一代人工智能模型GPT-5。谷歌发布在社交媒体X上的演示视频乍一看令人印象深刻。谷歌的人工智能模型能够追踪塑料杯下的纸球，或者在勾勒出图片轮廓之前就推断出会是一只螃蟹，这些都显示出谷歌DeepMind人工智能实验室多年来训练的强大推理能力。这是其他人工智能模型所缺少的功能。但视频中展示的许多其他功能并不是谷歌独有的，ChatGPTPlus3也可以做得到，沃顿商学院教授伊森·莫里克（EthanMollick）就用实验证实了这一点。此外，谷歌也承认演示视频被编辑过。该公司在视频描述中说：“为了达到演示效果，我们缩短了延迟时间，Gemini的输出也压缩了。”这意味着模型做出响应所花费的时间实际上要比视频中展示的长。事实上演示也不是实时的，也没有通过语音交互完成。谷歌的一位发言人在谈到这段视频时表示，这段视频是“使用视频中的静止图像帧，并通过文本提示”制作出来的。有网站展示了其他人如何通过手势、绘画或其他物体的照片与Gemini互动。换句话说，演示视频中的声音只是在解释给Gemini做了哪些人工提示，Gemini输出的依旧是静态图片。这似乎与谷歌所谓一个人可以与Gemini进行流畅对话、模型可以实时观察周围世界并做出反应的暗示完全不同。演示视频也没有说明展示是GeminiUltra人工智能模型。这些细节表明，谷歌更多是在进行营销，希望人们记住自己拥有世界上最大的人工智能研究团队之一，并且比其他任何人都能获得更多数据。正如谷歌在周三所做的那样，公司希望在Chrome、Android和Pixel手机上推出适用于终端设备的Gemini模型，提醒人们公司的部署网络规模有多庞大。但在科技行业，无处不在并不总是看起来那么有优势。早期的手机霸主诺基亚(和黑莓）就经历过惨痛教训，苹果用功能更强大、更直观的iPhone抢走了它们的市场。在软件领域，商业上的成功往往来自于性能最好的系统。几乎可以肯定的是，谷歌这番操作是为了利用OpenAI最近的动荡局势。据报道，当OpenAI董事会暂时罢免首席执行官萨姆·奥特曼(SamAltman)，使公司的未来发展受到质疑时，谷歌迅速发起了一场营销活动，说服OpenAI企业客户转向谷歌。现在，随着Gemini的发布，谷歌似乎正在利用这种不确定性。但演示的效果有限。谷歌之前已经展示过新技术，但没有任何进展。到目前为止，谷歌的庞大架构和层叠复杂的产品经理设置使其无法像OpenAI那样灵活发布产品。随着全社会努力应对人工智能的变革性影响，谷歌的最新举措并不是一件坏事，但效果有待观察。可以肯定的是，谷歌仍然在后面努力追赶。...PC版：https://www.cnbeta.com.tw/articles/soft/1402909.htm手机版：https://m.cnbeta.com.tw/view/1402909.htm

Google 推出原生多模态 AI 模型 Gemini，挑战GPT-4

Google推出原生多模态AI模型Gemini，挑战GPT-4https://abmedia.io/google-ai-model-gemini?utm_source=rss&utm_medium=rss&utm_campaign=google-ai-model-gemini&utm_source=rss&utm_medium=rss&utm_campaign=google-ai-model-gemini

传谷歌推迟发布Gemini大模型或要到明年初上线

传谷歌推迟发布Gemini大模型或要到明年初上线谷歌首席执行官桑达尔·皮查伊（SundarPichai）周四则表示，该公司“正专注于尽快推出Gemini1.0版本，确保它具有竞争力，是最先进的模型，我们将在此基础上继续迭代。”知情人士透露，谷歌推迟向云客户推出大型Gemini模型，意味着该公司希望在让外部软件开发商使用这项新技术之前，先用其来支持其消费者产品。谷歌对Gemini寄予厚望，希望其不仅能提振企业软件的销售，还能为YouTube上的创作者提供新的工具，并改进Bard以及谷歌助手的功能。Gemini团队面临的一个关键挑战是确保初级模型与OpenAI最先进的GPT-4一样好或更好。但知情人士说，目前还不清楚谷歌是否实现了这一标准。据悉，Gemini的开发人员得到了联合创始人谢尔盖·布林（SergeyBrin）的帮助，后者现在每周花四到五天时间前往该公司位于加州山景城的总部，与Gemini的开发人员一起工作。知情人士说，布林不是正式的决策者，但最近几周他对Gemini提出了批评和反馈，并帮助不同的团队协调工作。...PC版：https://www.cnbeta.com.tw/articles/soft/1397597.htm手机版：https://m.cnbeta.com.tw/view/1397597.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人

相关推荐

谷歌集大成之作要来了 据称将发布AI大模型Gemini 对标GPT-4

Bard 在 Imsys 排行榜排名超越 GPT-4，Bard + Gemini Ultra 即将发布

超越GPT4！谷歌大杀器终于来了 最大规模Gemini震撼发布

外媒：谷歌发布Gemini更多是为营销 仍落后于GPT-4

Google 推出原生多模态 AI 模型 Gemini，挑战GPT-4

传谷歌推迟发布Gemini大模型 或要到明年初上线

谷歌集大成之作要来了据称将发布AI大模型Gemini 对标GPT-4

超越GPT4！谷歌大杀器终于来了最大规模Gemini震撼发布

外媒：谷歌发布Gemini更多是为营销仍落后于GPT-4

传谷歌推迟发布Gemini大模型或要到明年初上线