英伟达的崛起之路或再生变数
作者:新财富产业研究院
今年2024年底即将发布的ChatGPT 5.0,市场对此寄予厚望的同时,OpenAI也一直在推进定制化芯片ASIC的相关计划,正在与博通、美满等全球芯片设计巨头就开发定制化芯片进行洽谈。全球AI人工智能算法发展的现阶段,行业对基于Transformer架构及其算法变种的认可度正在加速成为主流,底层计算中由张量运算为主的算法确定性逐渐增强,进而推高了行业面向张量运算ASIC体系发展的价值量。我们认为全球人工智能发展的下半场,随着AI算法及其架构现阶段的趋向稳定,定制芯片ASIC预测将重新焕发生机,英伟达未来的行业发展将充满着变数。
全球芯片品类从计算时代的 CPU 横扫数据中心与个人电脑等全产品线,再到现如今算力时代 GPU 的崛起,行业资本开支对算力芯片持续保持高位运行,客户需求与产品线的完美共振造就了英伟达及美股自去年以来的一路高歌猛进。与此同时,大模型算力需求至今持续井喷今年也不见放缓迹象,近期英伟达在算力芯片方面对台积电继续增加高达25%的投片量,台积电下半年业绩或继续超预期。Scaling law告诉我们要不停地堆算力和数据,数据中心的算力规模如今成为了大模型迭代速度的最关键因素,在Transformer架构及堆料张量运算乘法核所构建的现阶段高确定性行业发展设计思路支持之下,促使定制芯片ASIC重出江湖。
现阶段全球算力定制芯片ASIC方面,以博通和美满的市场占有率为主,博通以35%的市占率位居第一,其次美满以12%的市占率位居第二。据研究公司650 Group估计,数据中心定制芯片市场今年将增长至100亿美元,到2025年将翻一番。博通如今的营收增速很大一部分来自于定制芯片ASIC业务,因此助力博通在下行周期的2023年成为仅有的数家能在营收增速方面实现规模正增长的公司。算力芯片方面,博通将其称之为XPU而非GPU,同时博通认为XPU未来将不得不过渡到定制芯片,以此针对特定的AI工作负载进行优化,从而带来了更低的功耗和尺寸要求。博通现阶段为三个大客户提供定制XPU服务,分别是谷歌、微软、以及Meta,接下来的字节跳动将可能是第四个大客户。定制芯片的技术门槛极高,同时设计这些领先的XPU是一项极其研发密集型的业务,成本高达数十亿美元。英伟达曾花费了100亿美元来开发整个Blackwell平台。我们认为此项定制芯片业务将会是博通接下来营收保持高增长的关键,同时也将很大程度上继续赋能博通的核心业务即网络业务的市场主导地位。
在差不多20年前,芯片发展史上就出现过定制芯片ASIC取代通用芯片GPU的过程。早年行业算力较低,并行计算较弱的 CPU 得以也能够参与早期的比特币挖矿,进而成为当时最主要的算力来源。2010年起,随着比特币持续走高,挖矿算力需求快速提升,同时由于比特币采用 SHA256 哈希算法适合并行计算,因此在2010年至2012年期间,GPU算力逐渐取代芯片CPU,进而成为当时最主要的算力来源。2012年后期比特币继续全球暴涨,挖矿算力需求进一步增长,高性价比定制芯片ASIC开始出现在市场。我们认为哈希算法的确定性以及行业对下游算力需求的乐观预期,共同造就了挖矿行业ASIC芯片快速取代通用芯片GPU的历史进程,至此全球挖矿算力需求绝大部分市场皆由定制芯片ASIC所占领。
这样的行业趋势,英伟达也是完全有意识到自身主营业务的潜在风险,于是成立新的业务部门,专注于为云计算公司设计定制算力芯片,客户群涵盖英伟达现阶段的主要收入来源,包括谷歌、微软、亚马逊、Meta等,旨在抢占定制芯片未来爆炸性的市场需求,以此提前布局免受寻求英伟达芯片替代品的潜在风险影响。产品普遍性来看,针对固定架构及算法所设计的场景需求定制芯片,其在特定应用方面性能明显优于通用芯片GPU,因此拥有针对某类算法场景之下的最好性能,会比英伟达主营的通用GPU更有优势。与此同时,我们发现AI处理的重心今年起正在从云端算力往边缘端侧场景应用转移,预测定制芯片的高性价比优势在全球应用推理阶段将会进一步被放大,市场规模空间相较全球AI发展初期的算力训练阶段将会显著提升,竞争格局整体走向利好全球头部数家AI芯片设计厂商,因此英伟达现阶段所面临的市场局面不容乐观。
英伟达的主要优势在于,软件CUDA生态长期以来所培养的全球AI开发者习以为常的设计流程惯性与Omniverse等软件开发配套具有完备性,以及GPU互联技术全球一枝独秀的NVLink解决方案,上述优势皆为英伟达大模型算力训练阶段构筑了极深的行业“护城河”。以规模量产的英伟达HGX H100 8-GPU为例,使用高速 NVIDIA NVLink 4.0技术、NVSwitch互连,以及 NVIDIA Quantum-2 InfiniBand 与 Spectrum-4 以太网,从而大幅突破 AI 集群互联的极限。同时该服务器内部包含NVLink、PCIe和QPI等主板总线,GPU之间的互联通过NVSwitch芯片来实现,CPU与GPU之间的互联则通过PCIe 5.0总线实现,无论单芯片算力亦或是AI集群互联算力方面,英伟达现阶段皆实现了全球领先。其次,芯片议价方面,英伟达在晶圆的采购量上现阶段要比博通、美满的规模大得多,进而英伟达的议价能力相对较高,规模量产方面也具有优先权。沿用此逻辑来看,即使超级云计算厂商拥有强大的IC设计团队,除非能与台积电签订有价格竞争力的长协议订单,进而才有机会在价格上获得优势,打破英伟达现阶段的垄断局面。
从挖矿时代定制芯片ASIC的异军突起,进而取代通用芯片GPU成为挖矿主力,再到如今AI算力芯片ASIC的重出江湖,历史似乎又准备开始重演。整体来看,我们认为定制芯片ASIC的出现往往是因为某一类重要的特定算法推动了下游芯片需求的大爆发,从而使过往通用型芯片中的特定功能被分割出来,进而形成了新的定制化芯片。现阶段在transformer架构下的张量堆料矩阵运算趋向稳定,也基于此稳定且特定算法需求的出现,通用芯片中的小核心甚至是向量计算核心,逐渐成为了功耗与成本的负担,客户终究不会因为此单一特定的张量运算需求,而负担通用芯片中额外的硬件成本,因此定制芯片ASIC的崛起其实是历史的必然。
今年起预测定制芯片ASIC产品发展路线的重心将主要集中在三大方向,同时通用芯片的发展将与ASIC芯片相辅相成互相促进,现阶段行业前期通用芯片探索新算法搭建大模型,后期ASIC芯片通过高性价比将下游需求大规模释放,特别是在接下来全球应用推理阶段其价值量预测将会进一步被放大。整体发展方向来看,一是效仿谷歌定制芯片TPU扩大芯片面积,即在单个芯片内设计更多张量运算核心,进而定制芯片算力直接显著提升。二是效仿定制芯片Groq所设计的sRAM、DDR高速存储桥接产品路线,即张量运算核心将数据运算后直接转移给相邻的sRAM或DDR,进而实现多运算核心之间的更高效协作方案,其性价比胜过HBM方案。三是控制算核运算的编译器相较以往更加重要,ASIC芯片架构中缺少了如通用芯片中对数据预处理的小核心,进而AI芯片设计厂商需要重塑编译器软件设计环节。
发布于:北京
相关推荐
英国正式出手干预英伟达收购ARM,老黄前脚放话后脚就来变数
悄然崛起的英伟达新对手
从识别猫到厨房机器人:探究英伟达的人工智能之路
TikTok不是想买就能买?中方出新规令竞购混战再生变数
全网最硬核解读:在诉讼与骂名中崛起的英伟达GPU
AMD收购Xilinx生变数?英国监管机构介入调查
英伟达,拿了史上最牛一笔天使投资
英伟达和英特尔的AI战事
谁能成为中国的英伟达?
一口气了解英伟达,芯片新王凭什么是他?
网址: 英伟达的崛起之路或再生变数 http://www.xishuta.com/newsview123088.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 95037
- 2人类唯一的出路:变成人工智能 19982
- 3报告:抖音海外版下载量突破1 19767
- 4移动办公如何高效?谷歌研究了 19209
- 5人类唯一的出路: 变成人工智 19079
- 62023年起,银行存取款迎来 10202
- 7网传比亚迪一员工泄露华为机密 8315
- 8五一来了,大数据杀熟又想来, 7549
- 9滴滴出行被投诉价格操纵,网约 7166
- 10顶风作案?金山WPS被指套娃 7146