李开复解读大语言模型:两年内LLM至少还有两波迭代
《第22届华人领袖远见高峰会人物专访》
来源:《远见》
文/曾子轩
“我这个年纪创业(能招募人才),肯定不只是因零一万物的AI演算法做得比别人好。”说出这句话的,是年过花甲的李开复。当人工智能掀起巨潮,他却重回海景第一排逐浪,他究竟看见什麽?
李开复创办的“零一万物”,主攻瞩目程度最高、竞争也最激烈的大语言模型(Large Language Model, LLM)。既要对标美国世界级的玩家,也得和中文世界的大厂和新创业者抗衡,不只比拼模型性能,还要在价格上维持竞争力。
从硬件、基础建设、开发者工具、应用到模型,生成式AI的每个领域都已烽火连天。李开复如何深度解读这场大型语言模型之战?
注入智慧,AI赋能一切应用
自2009年创办并操盘“创新工场”,李开复在科技创投领域耕耘超过十年。去年3月隐士出山,亲自下场筹划,以基础模型为题创业,只因他已看见全新机会。
去年接受《远见》专访,李开复表示,在生成式AI的带动之下,软件应用将能重生、使用者界面出现改变、商业模式更会进化。一年过去,预言逐步成真。
ChatGPT全面进化,已能读懂图片和声音,微软让笔电搭载Copilot,苹果更宣言,将在手机中注入AI,从装置到应用,让时隔一年再度接受《远见》专访的李开复乐观表示,“Super Intelligence”时代已然来临。
他分析,电脑时代能用“Computer on every desktop”总结,当人们的办公桌放上电脑,提升生产力的Office便成为杀手级应用。“Anywhere Anytime Computing”则是移动网路时代的标记,四处迁徙的消费者时刻连网,应用程式能获取位置资讯,Uber、美团因此带来价值。
将时间快转至今,得到AI赋能的应用,不再只是解决疑难杂症,甚至代理人类完成工作。生成式AI与大语言模型之所以标志AI 2.0的开展,正是因为AI做为生产要素的成本下降,从专用走向通用,运算不再昂贵,应用就此得到智慧,“你要善用这些应用程式的聪明才智,做过去不方便或不可能做的任务。”
推论成本将是关键
不过,虽然生成式AI颳起的旋风未停,但目前获益最多的,仍是卖铲子的人。云端服务商对AI伺服器的需求激增,催动辉达等晶片生产商接满订单,效应也外溢到台厂协力厂商,但真正让消费者有感的应用还在半途,软件厂商也在寻觅应用场景。
李开复解读,无论是对企业或者消费者,生成式AI都有市场。前者在企业后勤单位如财务、人资领域中,增加员工效率的效益已浮现,帮助消费者完成任务的用法,也在陆续发生。
然而,AI时代和移动时代的巨大差异之一,在于每次大语言模型运作服务时,皆会产生推论成本。“在移动互联网时期,都是先获取大量用户,不收任何费用,待用得开心后,再从他们身上收费。”搜寻引擎、社群网络和短影音应用,皆遵循此法则。
但AI时代很难靠著补贴式战法打下江山,因为用户变多,不会带来规模经济成本降低的益处。“以前你去烧用户(成本补贴),烧不掉太多什麽,⋯⋯现在每次回答问题,我们都在烧GPU,最后用户不付费就破产。”无论是和ChatGPT对答,还是以Bing生成图像,OpenAI与微软都得在云端上消耗算力,这也是后者力推AI PC的原因之一。
即便向消费者收费,若费用无法超过获客成本和推论成本的总和,服务仍无法延续。李开复以近期他提倡的的概念“TC-PMF”(Technology Cost- Product Market Fit)提醒生成式AI创业者,在寻找产品与市场契合程度时,需关照技术成本的变动。
静态来说,要在模型价格和生成内容品质之间取捨,例如,GPT-4表现优异但所费不赀,GPT-3.5同等模型效果差却便宜。动态来看,每过9到12个月,基础模型能力便会显著升级,例如GPT-3.5至GPT-4的换骨夺胎,以及GPT-4到GPT-4o的化蛹为蝶。
当新模型面世,调用旧等级的模型费用,将下降到原先的十分之一,因此创业者不能只看PMF,而要考虑变动的TC,惟有掌握动态变化,才能生存。
李开复认为,自研基础模型、搭建AI基础设施、推出AI优先应用的“三位一体”战略,是大模型创业者第一时间捕捉到TC-PMF的关键,零一万物目前正在实践当中。
中美AI竞争各有优势
有许多人关注科技战,对中国发展AI带来负面影响。李开复表示,添购显卡的问题没有想像中严重,关键差异在融资。“美国的创业公司,比中国公司更愿意花钱买GPU,理由就是美国市场给这些有能力做大模型的公司,更高的估值。”
这既影响企业发展走向,也影响商业模式。李开复解释,虽然中国大语言模型企业算力较少,但人们愿意花心思、下苦功,“刻苦耐劳做一些不那麽光鲜耀眼的事情。”例如,调校GPU、修改架构和配合软体,挤出每张显卡的最大价值。
李开复分析,美国企业人才顶尖,能开拓出科技最尖端的创新,中国则擅长改善产品、在成本效益间找到甜蜜点。“美国公司做不出拼多多,但是中国公司也做不出Google。”即便大语言模型领域中国落后半年,但很难说后发一定无法先至。
以大型语言模型企业来看,对比中、美环境,李开复分析,后者消费者付费意愿和客单都高于前者,这让中国创业者需要在商业模式上下功夫。“因为用户付费习惯不够多,反而要逼自己找新的商业模式。”例如,当年主打免费的淘宝,便是靠著收取广告费的另闢蹊径击败eBay。
观察零一万物发展,既有面向消费者的应用“万知”,同时也在中国海外推行企业用服务。万知背后旗舰模式YI-Large,中文能力足以和GTP-4o相提并论,因此消费者愿意埋单,这正是由技术实力撑起;在海外市场拓展也颇有成绩,无论是付费意愿或者平均客单价都高过中国竞业,稳定的SAAS服务,让零一万物不用在客制化AI、无法规模化的红海中,与他人争抢微薄利润。
虽然阿里巴巴、百度和科大讯飞等大厂在价格战中逐底,甚至有部分模型的调取费用压低至零,但李开复并不担忧价格战,甚至正面看待降价情形。不忧虑自家企业,全因零一万物模型性能优异,在多项国际评测中成绩斐然;不担心整体产业,则是因降价反映技术进展,更代表生成式AI将有机会扩散到更多地方。
他坚定表示,大语言模型至少还有两代巨大的模型提升,不只带动应用发展,同时降低推论成本的定价,未来两年生成式AI应用将会看到剧烈竞争。
在李开复眼裡,想在大型语言模型竞赛做出成绩,是最短的时间窗口之内,最有挑战性的难题。
正如《离骚》中所言,“路漫漫其修远兮,吾将上下而求索。”一辈子在人工智慧领域打滚,如今重返前线迎难而上,这是李开复的“吾虽艰险,心中乐之”。
李开复
出生:1961年
经历:曾任苹果、SGI和微软等企业高阶主管,于微软工作任内创立微软中国研究院(微软亚洲研究院),后至Google担任全球副总裁与大中华区总裁。2009年创立创投机构创新工场,2023年创办零一万物
荣誉:《时代杂志》百大全球最具影响力人物、《时代杂志》全球25大AI领袖
相关推荐
李开复解读大语言模型:两年内LLM至少还有两波迭代
AI大语言模型LLM,为啥老被翻译成“法学硕士”?
博弈论如何让大语言模型更聪明?
阿里云领投李开复 AI 公司新一轮融资,首款大模型正式发布
承诺十年不套现 62岁的李开复要陪AI大模型“长跑”
李开复被大模型绊了一跤
万字长文:大语言模型兴起后,心理学不存在了?
李开复:大模型即将“洗牌”,估计活下来的不多
独家对话李开复:大模型公司的灵魂考验是什么
大模型赛道:风浪越大“鱼”越贵
网址: 李开复解读大语言模型:两年内LLM至少还有两波迭代 http://www.xishuta.com/newsview123665.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 94831
- 2人类唯一的出路:变成人工智能 18279
- 3报告:抖音海外版下载量突破1 17828
- 4移动办公如何高效?谷歌研究了 17547
- 5人类唯一的出路: 变成人工智 17382
- 62023年起,银行存取款迎来 10009
- 7网传比亚迪一员工泄露华为机密 8000
- 8顶风作案?金山WPS被指套娃 6446
- 9大数据杀熟往返套票比单程购买 6423
- 1012306客服回应崩了 12 6370