马斯克发布Grok 3,推理能力超o3和DeepSeek-R1
本文来自微信公众号:学术头条,作者:学术头条
在试图以 974 亿美元收购 OpenAI 的提议被拒绝后,世界首富马斯克又搞了一个大动作。
今天,他发布了号称“地球最聪明的 AI”,Grok3,其由一个包含约 20 万个 GPU 的数据中心训练,计算能力是上一代模型 Grok 2 的“10 倍”,且使用了扩大的训练数据集。
据此前介绍,Grok 3 是在合成数据的基础上进行训练的,它能够通过重读数据来反思所犯的错误,从而达到逻辑上的一致性。
评测结果方面,Grok3 在 AIME'24(美国数学竞赛)、GPQA(研究生水平科学知识问答能力的基准测试)等测试中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。
尤其在推理方面,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等测试中取得了压倒性的优势,最高分达到 96 分,超过了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。
甚至,在最新的 AIME 2025 评测中,Grok3 推理系列模型更是达到了 90 及以上的分数,稍微领先 o3 mini(high) 的 87 分。
基于 Grok3 推理模型,Grok app 上线了 DeepSearch 功能,DeepSearch 可以表达其理解查询的过程以及计划响应的方式,会扫描互联网和 X,分析信息,并针对问题提供摘要。据现场演示,DeepSearch 包括研究、头脑风暴和数据分析等选项。
此外,在 Chatbot Arena 评估中,Grok-3 的得分达到了 1400 分,同样超过了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。
此外,马斯克在直播中透露,未来——最快一周后——Grok 应用程序将具备“语音模式”,这将为 Grok 模型提供合成语音。几个月后,xAI 将开源上一代模型 Grok 2。“我们的一般做法是,当下一个版本完全推出时,我们将开源上一个版本(Grok)。”
马斯克曾多次警告说,人工智能会给人类文明带来风险,但他仍在极力推动加大对这一领域的投资。
xAI 于 12 月表示,它在新一轮融资中筹集了 60 亿美元,投资者包括美国风险资本家、芯片制造商英伟达和 AMD,以及沙特阿拉伯和卡塔尔的投资基金等。去年 5 月,该公司首次融资便获得了高达 60 亿美元的资金。
本文来自微信公众号:学术头条,作者:学术头条
相关推荐
“地球上最聪明的AI”?马斯克宣布将于周一晚发布Grok 3
马斯克称将发布“地球上最聪明AI”,最大特点是引入“思维链”推理能力
仅用19天,马斯克建成全球最强“超算工厂”,10万块H100 GPU上线,Grok 3预计年底发布
OpenAI CEO 萨姆·阿尔特曼宣布 o3 mini 推理 AI 模型即将发布
马斯克突然发布Grok 1.5,但除了这点都不如GPT-4
马斯克宣布:即将发布
马斯克宣布开源AI大模型Grok,继续硬刚OpenAI
外媒:OpenAI完成“o3 mini”推理AI模型版本,即将推出
DeepSeek打服OpenAI:GPT-5将免费
马斯克旗下 X 平台部署 Grok,AI 生成新闻和热门话题摘要
网址: 马斯克发布Grok 3,推理能力超o3和DeepSeek-R1 http://www.xishuta.com/newsview132798.html
推荐科技快讯

- 1问界商标转让释放信号:赛力斯 95169
- 2人类唯一的出路:变成人工智能 20816
- 3报告:抖音海外版下载量突破1 20696
- 4移动办公如何高效?谷歌研究了 19988
- 5人类唯一的出路: 变成人工智 19959
- 62023年起,银行存取款迎来 10305
- 7网传比亚迪一员工泄露华为机密 8446
- 8五一来了,大数据杀熟又想来, 8279
- 9滴滴出行被投诉价格操纵,网约 7898
- 10顶风作案?金山WPS被指套娃 7207