手机版
搜索
帮助
微博
微信

互联网快讯

首页科技快讯免费 o1 替代品来了！谷歌新发“王炸”推理大模型：思考速度碾压其他大模型，水平堪比理科博士

免费 o1 替代品来了！谷歌新发“王炸”推理大模型：思考速度碾压其他大模型，水平堪比理科博士

来源：晰数塔互联网快讯时间：2024年12月21日 21:35

作者｜冬梅

在 OpenAI “12 天马拉松”发布的第 11 天，他们平平无奇的发布又被谷歌抢了风头。

刚刚，谷歌发布了实验性的“Gemini 2.0 Flash Thinking”模型，它以令人印象深刻的推理能力而闻名，可以“明确地展示自己的思维”来解决复杂问题，其水平与物理、化学和生物学博士生相当。

谷歌 CEO Sundar Pichai 在社交网络 X 上的一篇文章中写道，这是“我们迄今为止最周到的模型，”还配上了笑脸。

顾名思义，它建立在“2.0 Flash 的速度和性能”之上。谷歌表示，它“经过训练可以大声思考”，从而“具有更强的推理性能”。

为了与 OpenAI 的 o1 竞争，谷歌 DeepMind 首席科学家 Jeff Dean 在 X 上的一条发文中表示，该模型“经过训练，可以使用思维来加强其推理能力”，同时还受益于速度更快的 Gemini Flash 2.0 模型。

Dean 分享的演示展示了 Gemini 2.0 Flash Thinking 如何通过“思考”一系列步骤，然后再提供解决方案，从而解答物理问题。谷歌分享了几个跨物理和概率的演示：

Gemini 2.0 Flash Thinking 现已在 Google AI Studio 和 Vertex AI 中推出。它在 Chatbot Arena LLM 排行榜上首次亮相，位居“所有类别第一” 。就在昨天，谷歌在 Gemini 应用程序中推出了 2.0 Experimental Advanced，Gemini-Exp-1206 也位居排行榜榜首。

这不一定是人类那样的“推理”，但这意味着机器将指令分解为可以产生更强结果的更小的任务。

另一个示例由 Google 产品负责人 Logan Kilpatrick 发布，展示了该模型如何推理解决涉及视觉和文本元素的问题。“这只是我们推理之旅的第一步，”Kilpatrick 说。

在开发者文档中，谷歌解释说，“思考模式的响应推理能力比基础版 Gemini 2.0 Flash 模型更强”，而基础版 Gemini 2.0 Flash 模型是谷歌最新、最出色的模型，仅在 8 天前发布。

新模型仅支持 32000 个标记输入（约 50-60 页文本），并且每个输出响应可以产生 8000 个标记。在 Google AI Studio 的侧面板中，该公司声称它最适合“多模式理解、推理”和“编码”。

该模型的训练过程、架构、许可和成本的完整细节尚未公布。目前，它在 Google AI Studio 中显示每个令牌的成本为零。

与 OpenAI 的竞争推理模型 o1 和 o1 mini 不同，Gemini 2.0 允许用户通过下拉菜单访问其逐步推理，从而更清晰、更透明地了解模型如何得出结论。

通过允许用户了解决策过程，Gemini 2.0 解决了人们对人工智能作为“黑匣子”运行的长期担忧，并使该模型（许可条款仍不明确）与竞争对手的其他开源模型相提并论。

一些开发者对该模型的早期简单测试表明，它可以正确而快速地（1 到 3 秒内）回答一些对于其他 AI 模型来说非常棘手的问题，例如计算“Strawberry”一词中的 R 的数量。（见上面的截图）。

原生支持图像上传和分析

Gemini 2.0 Flash Thinking 是对竞争对手 OpenAI o1 系列的进一步改进，旨在处理跳跃中的图像。

o1 最初是纯文本模型，但后来扩展到包括图像和文件上传分析。目前，这两种模型也只能返回文本。

根据开发者文档显示，Gemini 2.0 Flash Thinking 目前还不支持与谷歌搜索落地，也不支持与其他谷歌应用和外部第三方工具集成。

Gemini 2.0 Flash Thinking 的多模式能力扩展了其潜在用例，使其能够应对结合不同类型数据的场景。

例如，在一项测试中，该模型解决了一个需要分析文本和视觉元素的难题，展示了其跨格式集成和推理的多功能性。

开发人员可以通过 Google AI Studio 和 Vertex AI 利用这些功能，其中模型可供实验。

随着人工智能领域的竞争日趋激烈，Gemini 2.0 Flash Thinking 可能标志着问题解决模型新时代的开始。它能够处理多种数据类型、提供可视化推理并大规模执行，这使它成为推理人工智能市场的有力竞争者，可与 OpenAI 的 o1 系列及其他产品相媲美。

发布于：辽宁

相关推荐

免费 o1 替代品来了！谷歌新发“王炸”推理大模型：思考速度碾压其他大模型，水平堪比理科博士
 Open AI发布新一代大模型“o1”：会像人类一样“花时间思考”
OpenAI o1：大进步？小技巧？新思路？
OpenAI o1模型“我思故我在”，是怎么做到的？
重磅！颠覆AI领域！OpenAI发布o1模型，解锁博士级科学难题
 对标o1，Kimi放出了最能打的国产模型
 “编程作为一个职业在今日终结”，OpenAI新模型o1的可怕之处
 Meta的大模型开源后，国产大模型在卷什么？
OpenAI 年底炸圈开幕：首发o1正式版+200美元Pro 会员
 OpenAI最强模型o1，仍分不出“9.11和9.8哪个大”

网址: 免费 o1 替代品来了！谷歌新发“王炸”推理大模型：思考速度碾压其他大模型，水平堪比理科博士 http://www.xishuta.com/newsview130606.html

所属分类：行业热点

推荐科技快讯

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

人类唯一的出路：变成人工智能（三）

人类唯一的出路：变成人工智能（三）

饿了么口碑：今年计划招5000名员工、增80万骑手

饿了么口碑：今年计划招5000名员工、增80万骑手

盖茨力劝美国用核技术解决气候变化愿掏数十亿腰包

盖茨力劝美国用核技术解决气候变化愿掏数十亿腰包

最新科技快讯

局限性与副作用：AI营销有何“阴暗面”？

局限性与副作用：AI营销有何“阴暗面”？

AI换脸技术滥用引发社会多重隐患

AI换脸技术滥用引发社会多重隐患

在欧洲，没人提DeepSeek MWC2025：AI成最大看点，星纪魅族揭秘了！宇树“机器人”数控设备独家供应商新功能！微信支持进一步瘦身啦 90后清华学霸红海突围，年营收破4亿，小 2nm芯片发布，剑指英伟达 Figure创始人访谈：为什么人形机器人 DeepSeek回应焦虑：最危险的从来不

科技快讯热点排名

科技快讯热点

人类唯一的出路: 变成人工智能（五）

人类唯一的出路: 变

报告：抖音海外版下载量突破10亿大关挑战Facebook

报告：抖音海外版下载

苏宁易购2018年报:营收破2453亿线下门店超万家

苏宁易购2018年报

阿里巴巴钉钉宣布1月30日上线企业拜年红包

阿里巴巴钉钉宣布1月

即时专业知识