看完Grok3的发布会,我对国内的AI发展更加乐观了
本文来自微信公众号:共识粉碎机 (ID:botaijin),作者:Andy Liu,原文标题:《创新药与仿制药:评Grok3与DeepSeek》,题图来自:AI生成
现在几乎每周都有AI圈子的大事发生,让人有种应接不暇的感受。
近日,马斯克的xAI发布了万众期待的Grok 3,20万卡的集群fully run了几个月的时间,怼出来了目前pretraining模型的SOTA,在各种榜单上都排到了第一(据说其他top公司表示要尽快把xAI“打下来”)。在性能方面,Grok 3在数学推理、科学逻辑推理和代码编写等领域表现出色,在多项基准测试中超越或媲美Gemini、DeepSeek和ChatGPT等对手。除了base model外,xAI还推出了功能更强大的Grok 3 Thinking推理模式,在benchmark上超过了o3 mini(o3没有办法使用,所以没有做benchmark)。Andrej Karpathy大神表示,实操层面,Grok 3大概是o1 pro的水平,或者略超过o1 pro。
从全球AI的角度来看,xAI证明了有强大的算力就可以更快地追赶头部模型,缩短和世界第一的差距。马斯克也表示,将进一步提升算力,构建几十万卡甚至百万卡的GB200集群。如同我们之前多次强调的,下一步的多模态、合成数据、self-play RL都需要海量算力验证能否“大力出奇迹”。
但是看完xAI的发布会,我们反而对于国内的AI发展可能更加乐观了。xAI用20万张H100,做到了超过o1和o3 mini的水平,而DeepSeek用几千张H800,就能做到o1的水平。o1和o3 mini,大概也就是差了几个月的时间。也就是说,DeepSeek用xAI百分之二至三的算力,就能紧跟目前reasoning model全球最前沿的水平。
这不禁让人想到了在制药领域,创新药和仿制药的对比。创新药的特点就是海量的研发资源投入,通过不断试错,找到最合适的药物组成。然而,仿制药可以用非常低的成本,实现对创新药的复现;如果做得好,效果也可以接近创新原研药。如果说北美头部AI公司是在做创新药,那么留给中国AI公司的机会就是做最好的仿制药。仿制药同样有着巨大的市场空间,如果质量过硬,同样可以创造巨大的社会和经济价值。比如在《我不是药神》这部电影里,印度的仿制药,就可以拯救众多白血病患者的生命。更重要的是,创新药有知识产权保护,而目前看起来,学习、追赶大模型,暂时没有有效的类似的手段来限制追赶。
当然,如果多模态、合成数据、self-play RL在海量GB200/300算力的加持下取得了突破,pretraining scaling law又取得了进一步的进展,中国的算力限制可能又会成为瓶颈,但到了那个时候,未尝不可能有新的追赶方法。比如最近DeepSeek又发布了一篇新的工作,梁文锋亲自署名,NSA:A Hardware-Aligned and Natively Trainable Sparse Attention mechanism for ultra-fast long-context training&inference,极大提升了模型在训练和推理阶段,对于算力和HBM访存的效率,降低了对于算力和HBM BW的依赖。这篇文章idea不复杂,但是工程实现是超一流的,是世界级的。
希望DeepSeek能保持这样的效率,希望大厂们可以慢一点挖DeepSeek的人才,让中国可以有这样一片大模型研发的净土,不断给我们带来更多的惊喜。
相关推荐
看完Grok3的发布会,我对国内的AI发展更加乐观了
测试“天下最聪明”的Grok3,就这?
为什么我们对2025年AI极度乐观?
看完换脸AI做的动图,我已经不记得蒙娜丽莎长什么样了
看完iPhone 15发布会,我的iPhone 13还能再战3年
分享:ChatGPT对国内创业者的启示
AI大模型真的引领了国内的“资本盛宴”吗?
对国内AI算力紧缺问题的若干看法
业界对AI态度不一?科技CEO称从业者和投资人对AI是两种心态:从业者是渐进的,投资人是乐观的
离开OpenAI,独自创业之后,Karpathy对AI更乐观了
网址: 看完Grok3的发布会,我对国内的AI发展更加乐观了 http://www.xishuta.com/newsview132842.html
推荐科技快讯

- 1问界商标转让释放信号:赛力斯 95169
- 2人类唯一的出路:变成人工智能 20816
- 3报告:抖音海外版下载量突破1 20696
- 4移动办公如何高效?谷歌研究了 19988
- 5人类唯一的出路: 变成人工智 19959
- 62023年起,银行存取款迎来 10305
- 7网传比亚迪一员工泄露华为机密 8446
- 8五一来了,大数据杀熟又想来, 8279
- 9滴滴出行被投诉价格操纵,网约 7898
- 10顶风作案?金山WPS被指套娃 7207