小模型时代来了?微软推出其最小参数 AI 模型,性能逼近 GPT-3.5
作者 | 冬梅
当地时间 4 月 23 日,微软宣布推出其轻量级人工智能模型 Phi-3 Mini 的下一版本,这是该公司计划发布的三个小型模型中的第一个。
Phi-3 Mini 可测量参数仅为 38 亿,并在相对于 GPT-4 等大型语言模型更小的数据集上进行训练。现已在 Azure、Hugging Face 和 Ollama 上可使用。另外,微软还计划发布 Phi-3 Small(7B 参数)和 Phi-3 Medium(14B 参数)两个版本。
微软在去年 12 月时发布了 Phi-2,其性能与 Llama 2 等更大的型号不相上下。微软表示,Phi-3 的性能比前一版本更好,其响应速度接近比它大 10 倍的模型。
微软 Azure 人工智能平台公司副总裁埃里克· 博伊德(Eric Boyd)介绍说,Phi-3 Mini 的性能与 GPT-3.5 等 LLM 不相上下,"只是外形尺寸更小而已"。
与大型人工智能模型相比,小型人工智能模型通常运行成本更低,并且在手机和笔记本电脑等个人设备上表现更好。据外媒《The Information》今年早些时候报道称,微软正在组建一个专门专注于轻量级人工智能模型的团队。与 Phi 一起,该公司还构建了 Orca-Math,一个专注于解决数学问题的模型。
微软的竞争对手也在研发自己的小模型,其中大多数针对更简单的任务,例如文档摘要或编码辅助。其中最典型的就是 Google 的 Gemma 2B 和 7B,这两款模型更适合简单的聊天机器人和语言相关的工作。
此外,Anthropic 的 Claude 3 Haiku 可以阅读带有图表的密集研究论文并快速总结它们,而 Meta 最近发布的 Llama 3 8B 可以用于一些聊天机器人和编码辅助。
Boyd 表示,开发人员通过“课程”对 Phi-3 进行了训练。他们的灵感来自于孩子们如何从睡前故事、单词更简单的书籍以及谈论更大主题的句子结构中学习。
“市面上没有足够的儿童读物,因此我们列出了 3000 多个单词的清单,并要求大语言模型制作‘儿童读物’来教授 Phi,”Boyd 说。
他补充说,Phi-3 只是建立在之前迭代所学到的知识之上。Phi-1 专注于编程,Phi-2 开始学习推理,而 Phi-3 更擅长编程和推理。虽然 Phi-3 系列模型能够了解一些常识,但它无法在更大范围的应用场景中击败 GPT-4 或其他大语言模型。
Boyd 表示,公司经常发现像 Phi-3 这样的较小模型更适合他们的定制应用程序,因为对于许多公司来说,他们的内部数据集规模都比较小,而这些使用较少算力的小模型更具性价比。
发布于:辽宁
相关推荐
小模型时代来了?微软推出其最小参数 AI 模型,性能逼近 GPT-3.5
摆脱OpenAI依赖,微软组建王牌AI团队专攻“小模型”,为大模型降本增效
为什么我们需要拥抱小模型?
微软牵手Meta,大模型竞争来到新起点
千亿级参数、性能评测霸榜 夸克发布自研大模型
谁在评价大模型?AI大模型评测榜单乱象调查
微软秒删的开源大模型,性能如何?
不是大模型用不起,而是小模型更有性价比
高通:开启生成式AI新时代 将100亿参数大模型塞进手机
Llama 3发布,亮点在于“小”模型
网址: 小模型时代来了?微软推出其最小参数 AI 模型,性能逼近 GPT-3.5 http://www.xishuta.com/newsview116315.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 94804
- 2人类唯一的出路:变成人工智能 18078
- 3报告:抖音海外版下载量突破1 17596
- 4移动办公如何高效?谷歌研究了 17349
- 5人类唯一的出路: 变成人工智 17185
- 62023年起,银行存取款迎来 9989
- 7网传比亚迪一员工泄露华为机密 7960
- 812306客服回应崩了 12 6350
- 9顶风作案?金山WPS被指套娃 6252
- 10大数据杀熟往返套票比单程购买 6233