首页科技快讯李开复解读大语言模型：两年内LLM至少还有两波迭代

李开复解读大语言模型：两年内LLM至少还有两波迭代

来源：晰数塔互联网快讯时间：2024年08月10日 13:45

《第22届华人领袖远见高峰会人物专访》

来源：《远见》

文/曾子轩

“我这个年纪创业（能招募人才），肯定不只是因零一万物的AI演算法做得比别人好。”说出这句话的，是年过花甲的李开复。当人工智能掀起巨潮，他却重回海景第一排逐浪，他究竟看见什麽？

李开复创办的“零一万物”，主攻瞩目程度最高、竞争也最激烈的大语言模型（Large Language Model， LLM）。既要对标美国世界级的玩家，也得和中文世界的大厂和新创业者抗衡，不只比拼模型性能，还要在价格上维持竞争力。

从硬件、基础建设、开发者工具、应用到模型，生成式AI的每个领域都已烽火连天。李开复如何深度解读这场大型语言模型之战？

注入智慧，AI赋能一切应用

自2009年创办并操盘“创新工场”，李开复在科技创投领域耕耘超过十年。去年3月隐士出山，亲自下场筹划，以基础模型为题创业，只因他已看见全新机会。

去年接受《远见》专访，李开复表示，在生成式AI的带动之下，软件应用将能重生、使用者界面出现改变、商业模式更会进化。一年过去，预言逐步成真。

ChatGPT全面进化，已能读懂图片和声音，微软让笔电搭载Copilot，苹果更宣言，将在手机中注入AI，从装置到应用，让时隔一年再度接受《远见》专访的李开复乐观表示，“Super Intelligence”时代已然来临。

他分析，电脑时代能用“Computer on every desktop”总结，当人们的办公桌放上电脑，提升生产力的Office便成为杀手级应用。“Anywhere Anytime Computing”则是移动网路时代的标记，四处迁徙的消费者时刻连网，应用程式能获取位置资讯，Uber、美团因此带来价值。

将时间快转至今，得到AI赋能的应用，不再只是解决疑难杂症，甚至代理人类完成工作。生成式AI与大语言模型之所以标志AI 2.0的开展，正是因为AI做为生产要素的成本下降，从专用走向通用，运算不再昂贵，应用就此得到智慧，“你要善用这些应用程式的聪明才智，做过去不方便或不可能做的任务。”

推论成本将是关键

不过，虽然生成式AI颳起的旋风未停，但目前获益最多的，仍是卖铲子的人。云端服务商对AI伺服器的需求激增，催动辉达等晶片生产商接满订单，效应也外溢到台厂协力厂商，但真正让消费者有感的应用还在半途，软件厂商也在寻觅应用场景。

李开复解读，无论是对企业或者消费者，生成式AI都有市场。前者在企业后勤单位如财务、人资领域中，增加员工效率的效益已浮现，帮助消费者完成任务的用法，也在陆续发生。

然而，AI时代和移动时代的巨大差异之一，在于每次大语言模型运作服务时，皆会产生推论成本。“在移动互联网时期，都是先获取大量用户，不收任何费用，待用得开心后，再从他们身上收费。”搜寻引擎、社群网络和短影音应用，皆遵循此法则。

但AI时代很难靠著补贴式战法打下江山，因为用户变多，不会带来规模经济成本降低的益处。“以前你去烧用户（成本补贴），烧不掉太多什麽，⋯⋯现在每次回答问题，我们都在烧GPU，最后用户不付费就破产。”无论是和ChatGPT对答，还是以Bing生成图像，OpenAI与微软都得在云端上消耗算力，这也是后者力推AI PC的原因之一。

即便向消费者收费，若费用无法超过获客成本和推论成本的总和，服务仍无法延续。李开复以近期他提倡的的概念“TC-PMF”（Technology Cost- Product Market Fit）提醒生成式AI创业者，在寻找产品与市场契合程度时，需关照技术成本的变动。

静态来说，要在模型价格和生成内容品质之间取捨，例如，GPT-4表现优异但所费不赀，GPT-3.5同等模型效果差却便宜。动态来看，每过9到12个月，基础模型能力便会显著升级，例如GPT-3.5至GPT-4的换骨夺胎，以及GPT-4到GPT-4o的化蛹为蝶。

当新模型面世，调用旧等级的模型费用，将下降到原先的十分之一，因此创业者不能只看PMF，而要考虑变动的TC，惟有掌握动态变化，才能生存。

李开复认为，自研基础模型、搭建AI基础设施、推出AI优先应用的“三位一体”战略，是大模型创业者第一时间捕捉到TC-PMF的关键，零一万物目前正在实践当中。

中美AI竞争各有优势

有许多人关注科技战，对中国发展AI带来负面影响。李开复表示，添购显卡的问题没有想像中严重，关键差异在融资。“美国的创业公司，比中国公司更愿意花钱买GPU，理由就是美国市场给这些有能力做大模型的公司，更高的估值。”

这既影响企业发展走向，也影响商业模式。李开复解释，虽然中国大语言模型企业算力较少，但人们愿意花心思、下苦功，“刻苦耐劳做一些不那麽光鲜耀眼的事情。”例如，调校GPU、修改架构和配合软体，挤出每张显卡的最大价值。

李开复分析，美国企业人才顶尖，能开拓出科技最尖端的创新，中国则擅长改善产品、在成本效益间找到甜蜜点。“美国公司做不出拼多多，但是中国公司也做不出Google。”即便大语言模型领域中国落后半年，但很难说后发一定无法先至。

以大型语言模型企业来看，对比中、美环境，李开复分析，后者消费者付费意愿和客单都高于前者，这让中国创业者需要在商业模式上下功夫。“因为用户付费习惯不够多，反而要逼自己找新的商业模式。”例如，当年主打免费的淘宝，便是靠著收取广告费的另闢蹊径击败eBay。

观察零一万物发展，既有面向消费者的应用“万知”，同时也在中国海外推行企业用服务。万知背后旗舰模式YI-Large，中文能力足以和GTP-4o相提并论，因此消费者愿意埋单，这正是由技术实力撑起；在海外市场拓展也颇有成绩，无论是付费意愿或者平均客单价都高过中国竞业，稳定的SAAS服务，让零一万物不用在客制化AI、无法规模化的红海中，与他人争抢微薄利润。

虽然阿里巴巴、百度和科大讯飞等大厂在价格战中逐底，甚至有部分模型的调取费用压低至零，但李开复并不担忧价格战，甚至正面看待降价情形。不忧虑自家企业，全因零一万物模型性能优异，在多项国际评测中成绩斐然；不担心整体产业，则是因降价反映技术进展，更代表生成式AI将有机会扩散到更多地方。

他坚定表示，大语言模型至少还有两代巨大的模型提升，不只带动应用发展，同时降低推论成本的定价，未来两年生成式AI应用将会看到剧烈竞争。

在李开复眼裡，想在大型语言模型竞赛做出成绩，是最短的时间窗口之内，最有挑战性的难题。

正如《离骚》中所言，“路漫漫其修远兮，吾将上下而求索。”一辈子在人工智慧领域打滚，如今重返前线迎难而上，这是李开复的“吾虽艰险，心中乐之”。

李开复

出生：1961年

经历：曾任苹果、SGI和微软等企业高阶主管，于微软工作任内创立微软中国研究院（微软亚洲研究院），后至Google担任全球副总裁与大中华区总裁。2009年创立创投机构创新工场，2023年创办零一万物

荣誉：《时代杂志》百大全球最具影响力人物、《时代杂志》全球25大AI领袖