微软发布全新多模态人工智能小语种模型Phi-3-vision

微软发布全新多模态人工智能小语种模型Phi-3-vision新模型名为Phi-3-vision，顾名思义，这种SML不仅可以处理文本提示，还可以接受图像和文本提示来生成问题答案。微软表示，使用这种模式的人可以获得有关他们提交的图表的问题答案，也可以就Phi-3-vision模式接收到的图像提出任何开放式问题。Phi-3-vision包括42亿个参数，比38亿个参数的Phi-3迷你模式大，但比70亿个参数的Phi-3小型模式和140亿个参数的Phi-3中型模式小得多。微软表示，Phi-3-vision可以回答有关"一般视觉推理任务以及图表、图形和表格推理"的问题。新的Phi-3-vision模型目前是预览版，但还不知道何时会全面上市。不过，Phi-3Mini、Phi-3Small和Phi-3Medium现在都可以通过微软的AzureAI模型即服务进行访问。在Build2024的相关新闻中，微软表示AzureAIStudio现已全面可用。该公司表示：pro-code平台支持负责任的生成式人工智能开发，包括开发协同驾驶员，以支持复杂的应用程序和任务，如内容生成、数据分析、项目管理、日常任务自动化等。该公司表示，AzureAIStudio支持"代码优先"功能和"友好的用户界面"，因此开发人员可以选择如何在自己的编码项目中使用这些工具。微软还宣布，OpenAI的最新大型语言模型ChatGPT-4o现在可以通过AzureAIStudio和API普遍使用。...PC版：https://www.cnbeta.com.tw/articles/soft/1431802.htm手机版：https://m.cnbeta.com.tw/view/1431802.htm

在Telegram中查看

相关推荐

微软推出其规模最小的人工智能模型 Phi-3

微软推出其规模最小的人工智能模型Phi-3该公司于12月发布了Phi-2，其性能与Llama2等更大的型号不相上下。微软表示，Phi-3的性能比前一版本更好，其响应速度接近比它大10倍的机型。微软Azure人工智能平台公司副总裁埃里克-博伊德（EricBoyd）介绍说，Phi-3Mini的性能与GPT-3.5等LLM不相上下，"只是外形尺寸更小而已"。与体积较大的同类，小型人工智能模型的运行成本通常更低，在手机和笔记本电脑等个人。据TheInformation今年早些时候报道，微软正在组建一个专门研究轻量级人工智能模型的团队。除了Phi，该公司还建立了一个专注于解决数学问题的模型Orca-Math。微软的竞争对手也有自己的小型人工智能模型，它们大多针对文档摘要或编码辅助等较简单的任务。Google的Gemma2B和7B适合简单的聊天机器人和语言相关工作。Anthropic的Claude3Haiku可以阅读带图表的高密度研究论文并快速总结，而Meta最近发布的Llama38B可能会用于一些聊天机器人和编码辅助工作。博伊德说，开发人员用"课程"来训练Phi-3。他们的灵感来自于儿童是如何从睡前故事、单词较简单的书籍以及谈论较大主题的句子结构中学习的。Phi-3只是在前几个迭代学习的基础上更进一步。Phi-1专注于编码，Phi-2开始学习推理，而Phi-3则更擅长编码和推理。虽然Phi-3系列模型知道一些常识，但它在广度上无法击败GPT-4或其他LLM--从一个在整个互联网上接受过训练的LLM和一个像Phi-3这样的小型模型中得到的答案差别很大。Boyd说，公司经常发现，像Phi-3这样的小型机型更适合他们的定制应用，因为对于很多公司来说，他们的内部数据集无论如何都会偏小。而且，由于这些型号使用的计算能力较低，它们的价格往往要低得多。...PC版：https://www.cnbeta.com.tw/articles/soft/1428349.htm手机版：https://m.cnbeta.com.tw/view/1428349.htm

微软：Phi-2 模型性能优于竞争对手可在设备上运行

微软：Phi-2模型性能优于竞争对手可在设备上运行微软周二表示，其人工智能模型Phi-2的性能好于Meta等其他公司的竞争产品，并且能够在设备上运行。微软在一篇博客中表示：“Phi-2模型仅有27个参数，但在各种综合基准测试中，它的表现超过了欧洲AI初创公司Mistral旗下拥有70亿个参数的大语言模型（LLM）Mistral7B、以及Meta发布的参数达130亿个的AI模型Llama2。”“值得注意的是，Phi-2模型在多步推理任务（即编码和数学）上的表现优于参数达700亿的Llama2（Llama2模型系列包含70亿、130亿和700亿三种参数变体）。”

微软推出具备视觉能力的SLM小语言AI模型Phi-3-vision，英特尔宣布旗下软硬件已适配Phi-3系列

微软推出具备视觉能力的SLM小语言AI模型Phi-3-vision，英特尔宣布旗下软硬件已适配Phi-3系列微软最近发布了Phi-3家族的新成员Phi-3-vision，这是一款42亿参数的多模态AI模型，专注于视觉能力，能够理解图文内容，并能在移动平台上高效运行。Phi-3-vision基于Phi-3-mini的文字理解能力，具备轻量特点，上下文长度为128ktoken，训练于2024年2月至4月。该模型特别适合办公场合，优化了图表和方块图的理解能力，能提供战略建议，性能在多个项目上表现优异。微软已将模型上传至HuggingFace平台。英特尔宣布，已针对微软Phi-3系列模型优化了自家的GaudiAI加速器、Xeon和CoreUltraCPU、Arc显卡，降低了AI模型的运行门槛。英特尔致力于将AI带到任何地方，确保其平台支持最新的AI模型和软件。Phi-3系列模型为开发人员提供了成本效益高的选项，英特尔的人工智能产品全面支持新的Phi-3型号，推动AI在不同场景的应用。关注频道@ZaiHuaPd频道投稿@ZaiHuabot

微软推出了一个小型语言模型，能够分析图片内容

微软宣布推出了新版小型语言模型Phi-3，这款模型能够查看图片并告诉你图片中有什么。Phi-3-vision是一种多模态模型，也就是说它能同时处理文本和图像，而且最适合在移动设备上使用。微软表示，现已提供预览的Phi-3-vision是一个拥有42亿参数的模型（参数指的是模型的复杂程度以及它对训练内容的理解程度），能够执行一般的视觉推理任务，比如对图表或图片提出问题。但是，Phi-3-vision的规模远小于其他以图像为中心的人工智能模型，比如OpenAI的DALL-E或StabilityAI的StableDiffusion。与这些模型不同，Phi-3-vision并不生成图像，但它能理解图像中的内容，并为用户分析这些内容。标签:#微软#AI频道:@GodlyNews1投稿:@GodlyNewsBot

微软：Phi-2模型性能优于竞争对手可在设备上运行

微软：Phi-2模型性能优于竞争对手可在设备上运行“值得注意的是，Phi-2模型在多步推理任务（即编码和数学）上的表现优于参数达700亿的Llama2（Llama2模型系列包含70亿、130亿和700亿三种参数变体）。”微软补充称：“此外，Phi-2模型的性能与最近发布的谷歌GeminiNano2相当、甚至更好，尽管模型规模较小。”微软表示，Phi-2模型将在AzureStudio中推出。据悉，微软于今年6月发布只有13亿参数的Phi-1模型，适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据进行训练，在基准测试中的表现比同类模型高出10倍。微软今年9月更新发布了Phi-1.5版本，同样为13亿参数，可以写诗、写电子邮件和故事，以及总结文本。在常识、语言理解和推理的基准测试中，该模型在某些领域能够跟上多达100亿个参数的模型。微软在11月更新发布的Phi-2规模虽然比此前版本翻番，但相比较其它主流语言模型依然小很多。微软表示，Phi-2在逻辑推理和安全性方面显示出显著的改进，通过正确的微调和定制，小型语言模型是云和边缘应用程序的强大工具。...PC版：https://www.cnbeta.com.tw/articles/soft/1404019.htm手机版：https://m.cnbeta.com.tw/view/1404019.htm

微软发布Copilot智能体还带来了本机小语言模型

微软发布Copilot智能体还带来了本机小语言模型此外，微软还针对Copilot+PC推出了本机小语言模型Phi-Silica。微软宣布，从6月份开始上市销售的所有Copilot+PC都将嵌入Phi-Silica。这是一款微软专门为人工智能个人电脑所搭载神经处理单元（NPU）打造的模型，是公司所有模型中规模最小的，有33亿个参数。微软宣称，Copilot智能体并不会袖手旁观，等待命令，而是可以主动执行诸如监控电子邮件收件箱、自动化手动数据录入等任务。这代表了行业中所称的AI智能体在行为上的重大变革，也就是使聊天机器人能够独立智能地执行复杂任务。这是业界通常所说智能主体方面的一个重大变化，也就是让聊天机器人能自动执行一系列复杂任务。微软商业应用和平台副总裁查尔斯·拉曼纳(CharlesLamanna)在接受采访时解释：“我们很快意识到，仅限于用Copilot进行对话，极大地限制了它目前的功能。”“与其让Copilot等着别人和它聊天，不如让它更主动，让它能够在后台自动执行任务。”微软今天向极少数早期接入测试者展示了这一新能力，并计划在今年晚些时候在CopilotStudio公开进行预览。企业将能够创建能够处理IT支持、员工入职等多种任务的Copilot智能体。“Copilot正从与你并肩作战的助手，演变为为你工作的助手，”微软在一篇博客中说。这些Copilot智能体将由特定事件触发，并将结合企业自身的数据进行操作。以下是微软以新员工入职举例说明Copilot如何工作：想象你是一名新员工。一个积极主动的Copilot会向你打招呼，利用HR数据解答你的问题，把你介绍给同事，为你提供培训信息，帮助你填写表格，安排你第一周的会议。这样，HR及其他员工便可专注于他们的常规任务，无需再被行政管理工作所困扰。这种自动化可能会引发关于失业以及AI未来走向的问题和恐惧。拉曼纳认为，Copilot智能体可以去除工作中重复且单调的任务，如数据输入，而非完全替代工作。“工作和岗位是由许多不同而又多样的任务组成的。如果某人不断重复同一工作，那么这种工作很可能已经被现有技术自动化了。”拉曼纳说，“我们认为，随着Copilot和CopilotStudio的使用，一些任务将被完全自动化……但好消息是，大多数被自动化的任务都是没人真正想做的。”关于小型语言模型Phi-Silica，微软表示这款模型的首字延迟是每秒650个token，功耗大约为1.5瓦特。这意味着它不会大量占用系统资源，从而释放PC的CPU和GPU去处理其他计算任务。此外，Phi-Silica在生成Token时会重用NPU的KV缓存，并在CPU上运行，每秒能产生约27个Token。微软发言人表示，Phi-Silica的独特之处在于这是Windows首个本地部署的语言模型。它专为NPU优化，能够为设备带来极速的本地推理处理。这是一个关键时刻，标志着先进的AI技术将直接应用于Windows平台，支持第三方开发者创建卓越的第一方和第三方体验。这些体验将于今年秋季推向终端用户，从而提升Windows生态系统内的生产力和可访问性。Phi-Silica是微软Phi-3系列模型的第五款产品，其他四款产品是拥有38亿个参数的Phi-3mini、70亿个参数的Phi-3small、140亿个参数的Phi-3medium和42亿个参数的Phi-3vision。（辰辰）...PC版：https://www.cnbeta.com.tw/articles/soft/1431851.htm手机版：https://m.cnbeta.com.tw/view/1431851.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人