首页科技快讯大模型创业没有神话

大模型创业没有神话

来源：晰数塔互联网快讯时间：2024年01月04日 21:24

2023年年中以来，大模型领域创业者Frank接触了二十多个投资人，他发现有意愿沟通的不过三五个，其他人只是来聊聊天。

“他们没有出手空间”，Frank回忆说。

经历过太多无效沟通后，Frank已不再对融资抱有期待。他将产品方向转为企业服务，目标面向海外市场，希望能直接赚钱。

Frank原本做的是一个直接面向消费者的人工智能产品。2023年3月，他带着这个想法在奇绩创坛的上海办公室里见到了陆奇。陆奇曾就职于微软，是硅谷地位最高的华人高管，现在专注于创业孵化。

在局促的20分钟时间里，Frank向陆奇讲述了这个与朋友们头脑风暴得出的“尚不成熟的想法”。令他意外的是，陆奇非常支持他，并建议他们将产品方向往大语言模型靠拢。

在此次谈话的数个月之前，OpenAI CEO Sam Altman在新奥尔良举行的NeurIPS机器学习大会上，首次发布了ChatGPT的早期演示。这颗石子激起的水花迅速影响了全球科技创投圈，也让普通人第一次了解到“大模型”这个词。

陆奇主动成为大语言模型的布道者，在他看来，这一次AI（人工智能）技术和商业结合的进化速度，自己只在1996至1997年的互联网产业中感受到过。

为这一次AI浪潮而激动的不止陆奇，英伟达CEO黄仁勋在3月高呼AI迎来了“iPhone时刻”。随后，国内如王慧文、王小川等互联网时代的风云人物纷纷下场创业。各家头部风险投资机构都开始在内部推演大语言模型生态的未来方向。

沉寂已久的创投圈终于迎来了新的兴奋点，根据华兴资本内部对一级市场的调研数据，2023年前三季度，在AI领域出手的机构已超过80%。

大语言模型的出现让无数从业者们看到了改变命运的新机会。但是，站在2024年的初始回望，大模型的风口并没像人们想象那样，让2023年的创投圈重现过去十年的繁荣。

一

事实上，早在Frank及一众创业者杀入大模型创业的一年多以前，国内就有投资人和创业者盯上了这一领域。

2022年春节，明势资本合伙人夏令与大模型创业公司MiniMax创始人闫俊杰吃了一顿晚饭。相互交流之后，闫俊杰很认可夏令对AI行业的理解。夏令意识到MiniMax已经开始挑选投资人了，明势随后也顺利的成为MiniMax的早期投资人。

2022年6月，夏令带着某头部互联网公司创始人去见闫俊杰，并跟MiniMax的ABAB大模型的二代产品对话交流。“屏幕对面的这个AI和你以前接触的已经截然不同。”夏令说。这位创始人问了自己感兴趣的文学、哲学和时事问题，并在“谷爱凌为什么回到美国”一题上，得到了非常满意的回复。

当时正处于行业悄然生变，即将“翻天覆地”的时间点。彼时OpenAI动作频频，发布了DALL·E 2等多款模型，开始引发国内投资者的关注。但还要过好几个月，OpenAI才会发布引爆大众市场的ChatGPT。

智谱AI也是在那个时候开始被投资人追捧。因为太火爆，A轮便入局的达晨财智甚至错过了智谱的B轮融资。“交割速度太快，领投VC拿的额度过高，我们也就不麻烦了。”达晨财智董事总经理张英杰说。如今，智谱AI已经迭代到第三代产品，发展迅猛，估值过百亿。

创立于2017年的AI框架早期公司一流科技（Oneflow）也借着这场东风顺利起势。其创立之后，Oneflow陆续获得了九合、高瓴在内的近亿元融资，但在近几年因为投资人普遍担忧“技术前沿但商业化模式堪忧”，过得并不太好。

2023年三月，王慧文在市场上陆续走访多家AIGC创业项目，他希望为自己的新公司光年之外收购一家建制成熟且价格便宜的初创，在几乎看遍了市面上所有知名项目后，最后一流科技成功中标。

Oneflow被光年之外收购时，市面估值不到1亿美金，王慧文是以2亿美金的估值收购了Oneflow，收购方式是现金加股权置换的形式。

依靠对一流科技的并购，光年之外拥有了自己的核心技术团队，并开始了创业狂飙之旅，6月初，光年之外完成了新一轮融资，晋升独角兽。

但戏剧化的是，光年之外创始人王慧文此后病退，美团立即以20.58亿收购光年之外100%的权益，一流科技也转归于美团。再之后，光年之外和一流科技的投资人悉数退场。其创始人袁进辉不久之后也宣布了单独创业的消息。这家名为硅基流动的AI基础设施层公司在2023年下半年也曾一度融资不顺，今年获得了创新工场的投资。

头部大模型创业公司的估值涨得飞快，这开始让一些投资人感到害怕。腾讯自成立后到达到10亿美元市值用了六年时间，而百川智能的估值在成立的第六个月便达到了10亿美元。参与的人凑份子，不敢独自砸钱，没参与的人又很怕错过，所有人都焦虑。

回望千禧年至今国内互联网产业的发展历程，创投圈曾有长达20年的高歌猛进：PC互联网时代红利下，腾讯、阿里巴巴抓住社交、电商等新商机掘到第一桶金；智能手机和移动互联网的普及，也成为了抖音、美团、滴滴等后来崛起的必要因素。今天的“超级应用”无一不是抓住风口的胜利者。

但近年来的共识是，互联网迅速造富的时代已接近尾声。创业公司的融资速度与估值能够反映这一趋势，根据《财经十一人》不完全统计和调研数据，2022年中国新增独角兽数量大约为40家上下。而2018年至2020年，这个数据分别是156家、137家、111家。

大语言模型的出现让创业者们再次看到了改变命运的机会窗口。在元璟资本刘毅然看来，就像“PC+windows”“智能手机+操作系统”扮演了互联网时代的底层技术栈，大语言模型在当下扮演着同样重要的角色。

重要性人尽皆知，但大语言模型极其考量投资人对于出手时机的判断。特别是2023年以来，投资人圈普遍认为，投基础大模型需要5000万起步，明年则会更高。

制图：顾乐晓

2023年，大语言模型赛道创业成为国内一级市场唯一一个逆势上扬的赛道。根据华兴资本的调研，接近80%的一线机构在该领域都有出手，出手轮次以A轮之前为主，币种上以美元和双币基金为主构成。

按照架构层次划分，大模型赛道初创公司从下至上可分为算力层、基础层、模型层及应用层。

最受关注的模型层主要包括通用大模型和行业大模型。通用大模型竞争格局初定，除了知名互联网大厂之外，第一梯队的公司如智谱AI、百川智能的估值都达到了独角兽级别，他们大多手握20亿的现金，具备与大厂阶段性竞争的实力。

行业大模型的崛起是另一个不容忽略的现象。其背后逻辑是一些有行业积累的公司在接入通用大模型后，利用专业数据精调，在金融和法务等领域取得了不错的表现，并开始与头部厂商竞逐客户，自然语言处理NLP领域的追一科技以及熵简科技是其中代表。

基础层（AI infra）的热度也不逊色，目前该层尚无明确定义，基本认为是介于算力和应用之间用于支撑和交付模型的工具，下到通信、推理优化等，上到中间件、数据库都属于基础层范畴，尤洋创办的潞晨科技，袁进辉的Oneflow以及无问芯穹是其中比较突出的代表。

应用层的创业及投融资热度略微逊色于模型层与基础层，且与美国差距较大，原因是全新的AI场景尚未完全形成，而且应用层对底层模型和基础设施依赖程度很高，多模态（图像、视频等多媒体形式）是此间的研究热点。

相较美国，我国正经历着从模型层到应用层的追赶阶段，但现有的一些模型参数规模依然较低。

制图：顾乐晓

二

Frank本以为这一轮大模型创业热潮能一直火热下去，但到2023年下半年大家突然发现，形势变了。年初200余家号称做大模型的创业公司，在市面上仅剩20余家活跃着。

“去年年中大家普遍发现大模型创业这事没那么好做。不管是训练行业模型，还是训练通用模型，都不是一门很好的生意。”企业级生成AI平台猴子无限CEO尹伯昊告诉界面新闻。

最大的阻碍源于技术差距。GPT4的出现拉高了所有人的期待，它是OpenAI公司在3月份发布的多模态大模型产品，它处理图片和文字的能力又超出了业内预期。

科大讯飞董事长刘庆峰曾公开表示，国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上跟GPT4还有差距。有创业者专门测试对比了国内主流大模型产品与GPT4，得到的结论是“有很大进步空间”。

而为了追赶技术，基础大模型的投入是巨大的。据Information报道，OpenAI在2022年营收仅为2800万美元，亏损则高达5.4亿美元。它能持续进化背后靠的是微软的资金和算力支持。

所以，国内大模型创业公司面临的首要难题是，如何找到下一轮融资？已经融到钱的头部公司暂时不慌，而其他融不到钱的只能离场或者另寻方向。

对投资人而言，底层大模型的资本效率很低，VC的钱很难有立竿见影的效果。远不像移动互联网时期，靠上百万人民币早期投资便能赌出一个好项目。

在观察了近一年之后，曾经投中小米和理想的某知名投资人最终并未出手，“我们在大模型上原来有个口号，‘珍爱生命，远离大模型’。”

大模型生态的不确定性、美元募资受限、部分机构进入退出周期等等因素共同导致了国内大模型投资由热转冷。据非凡资本整理数据，2023年上半年，中国生成式AI行业融资总额为73.99亿人民币，这大约是同期硅谷融资额的7%。

制图：顾乐晓

三

与年初“天天工业革命，夜夜文艺复兴”的盛况相比，大模型赛道的参与者们在2023年末更像是进入了冷静期。

ChatGPT发布之初，整个行业都充斥着“各个场景都值得重做一遍”的兴奋。之后，通用大模型的能力边界逐步显现，行业上下游角色分工也不断明晰。猴子无限的创始人尹伯昊将这一变化概括为，行业参与者在不断摸清自身业务边界。

移动互联网时代，边界是危机感的代名词——承认边界，意味着成长停滞。在接受《财经》专访时，面对“美团的业务边界在哪里”的问题，王兴曾经的回答是：“万物其实是没有简单边界的，所以我不认为要给自己设限。”

设立边界，只做“小而美”的尝试在上个时代大概率会面临被兼并、被抛弃的结局。平台经济的逻辑下，规模就是话语权。

现在大模型赛道的现状显然与这一理念背道而驰。找准自己的定位和边界，先生存下去才是第一位的。

在这一年中，模型层的初创公司一方面在继续找钱，另一方面要快速证明自己的商业化能力。比如挑选几个市场规模相对较大的赛道，试图先让少数头部客户选择自己。

“如果能有对标GPT4的能力，并且能私有化部署，国内还是会有客户愿意付费的。2000万至5000万这个价位区间都是有可能的。但是如果只有GPT3.5的水平可能就有问题了。”熵简科技联合创始人李渔说。

这导致的典型的困境是：2023年年初时，一家国内头部大模型公司给客户私有化部署的报价是千万元起步。然而在过了半年之后，这一报价直接被砍至二十分之一，由千万级变成了数十万。“大家开始意识到大模型没有那么神奇，不能包治百病。”一位业内人士说。

而对于应用层初创公司来说，在融资遇冷的大背景下，自我造血也被视作关键。也正是因为大家在花钱扩张上都很谨慎，马太效应不再明显，创业者也不强求市场份额，而是要找准自己的业务方向。

由于相对更宽松的监管及更高的用户付费意愿，出海成为了一些人的选择。一位专注出海的创业者对此有亲身体会，在巴西、阿根廷等拉美市场，用户对视频智能剪辑这类产品的付费意愿都要高于国内。过去偶尔刷屏的一些应用层大模型产品，如HeyGen、ChatPDF等也均面向海外。

如果说，上一代的创业者们可以坐拥人口红利，那这一代的人口红利需要创业者们主动寻找和开拓。也有不少创业者告诉界面新闻记者，虽然现在比移动互联网时期创业更难，但他们认为现在的状态才是更加“健康、正常”的。

“中国人做的软件是有机会卖给全世界的，这就是我们这一代的机遇。”作为陆奇投资的创业公司CEO，尹伯昊言语之中显露出新一代技术创业者的自信。

制图：顾乐晓

峰瑞资本投资合伙人陈石从2023年年初开始集中关注大模型应用层项目，在接触中他明显感觉到，下半年创业者们变得“成熟了很多”。一方面，语言模型的能力、训练方法等知识快速在创业者群体里扩散。另一方面，海外及国内的成功案例也让创业者有了更多参考，对技术落地的思考变得更加成熟。

那些最聪明的应用未来是否能拿到最高的市场份额，大语言模型会否进入存量竞争导致的利润陷阱，谁会成为基础大模型的主导者、谁又能担纲最重要的协作方，多模态能否成为AI商业宏图的起点，人形机器人又能否承载大模型的最高想象空间？这些关键问题会伴随着大模型的技术演进而慢慢展露出相对成熟的答案，但时间可能需要三到五年。

一个事实是，像大模型这样前沿的科技创新，往往都是阶梯式跃进，顶级投资人也很难预测在哪一阶段能达到大规模泛化。以自动驾驶为例，其经过技术路线和商业模式的多轮迭代，也才在2023年年底跨进了L3级别量产的门槛。

在数次融资未果后，一家大模型初创公司的创始人朱楠再次与数家国内头部风险投资机构接触，但依然没有带回好消息。他暗暗告诫自己先停一停，认真考虑手头的钱还能撑多久？团队还能不能维持下来？

随后，他在朋友圈写下这样一段话：市场行情的下行会让大多数VC捂住钱包，但对于做真正有价值的事业的创业者来说，这是一次非常好的训练机会。这种训练越早越好，越早阶段学会如何高效的融资、学会最大程度上提高人效，比趁着风口跑到后续轮次后突然融不到资，却发现自己没有啥融资和带队本领要好得多。

这或许代表了相当一大部分大模型创业者的状态。从大模型的技术发展进程来看，他们处于冷静但健康的周期之中，与移动互联网黄金时期的遍地神话不同，大模型创业者注定要走上艰难而正确之路。

本文来自微信公众号：界面新闻（ID：wowjiemian），作者：于浩、李京亚，编辑：文姝琪