首页科技快讯大模型走到下半场，真正的“卷点”应该在哪？

大模型走到下半场，真正的“卷点”应该在哪？

来源：晰数塔互联网快讯时间：2024年07月05日 22:23

　　来源：陆玖商业评论

　　一方面，让普通人以更小的成本，去了解和使用大模型和AI应用；另一方面，企业也能在不断的AI应用中，了解模型使用的具体场景，以及能带来的实际价值。

　　自2022年底大语言模型面世以来，全球范围内便掀起了新一轮AI浪潮，有的甚至最快是“以周为单位”进行产品迭代。

　　根据一些公开资料，截至去年10月，国内发布的大模型就已超过230个，而6月份的时候这一数字还不到80个，短短4个月的时间就翻了近三倍。“百模赶考”实至名归。

　　然而行业走到今天，有不少从业者发现，大模型的终点并不在数量的多少，诸如“我们真的需要这么多模型吗”“模型之间卷规模到底有没有用”“那真正的卷点应该被设定在哪”等这般话题，正被业内反复讨论。

　　产生这种质疑之声的原因，其实不难理解。毕竟放眼于应用层，除了基于开源大模型不断调优的“套壳应用”，真正称得上“能干”的应用，却是凤毛麟角。

　　这也正如百度创始人李彦宏在上海世界人工智能大会上所说的，“AI时代，‘超级能干’的应用比只看DAU的‘超级应用’更重要。”换言之，在广泛的、实际的场景中，企业真正需要的是超级能干的应用，有能力去解决实际问题，而不只是一个看似很大的超级应用。

　　随着大模型“卷应用”的浪潮逐步在金融、交通、政务等领域落地开花，更多的人开始意识到，生成式AI的下半场，或许更大的机会在应用上。而中国的AI产业，有望从应用层实现弯道超车。

　　警惕“超级APP陷阱”

　　从PC时代到移动互联时代，互联网产品的形态与发展路径，是截然不同的。

　　近二十年前，受限于通信技术与硬件水平，软件产品的容量不可能做得太大，承载信息的能力自然也有限。

　　随着硬件算力和通信技术的发达，智能手机作为应用终端，开始成为信息集散地。在这个时代成长起来的互联网大厂，无一不靠大DAU，大用户量的“超级APP”，触及用户生活的方方面面。也据此完成了“前AI时代”的资本积累。

　　当互联网走入生成式AI时代，以往“一个超级APP”走天下的逻辑，是否还能通用？但如今，这也变成了一个值得商榷的问题。

　　毕竟此前几乎无人可以预见，在人工智能时代，用户最常用的AI功能是什么。到目前为止，C端用户最常使用的AI功能，多用于文档解析、初级文案生成，文生图、文生视频虽然在商业领域已经有初步引用，但水平依旧无法在短时间取代专业人士。

　　基于同样的原因，虽然底层模型已经初步产生马太效应，资源和商业效益开始向头部大厂聚集，但像移动互联网时代超过1亿日活的“现象级应用”，却尚未诞生。其中一个原因，是大语言模型的所有能力，尚未被应用层开发者挖掘完毕。

　　与之相对的是，除了少数行业人士，市场对于生成式AI应用的认知和关注点，更多落在基础模型的进展上。而李彦宏和百度，则更多希望通过站位未来，来调控这艘大船今天的业务方向。

　　相较于移动互联网时代动辄比拼DAU规模，李彦宏认为，不同时代下，应用的发展路径和模式都是不一样的。避免掉入“超级应用陷阱”，不要用移动时代的思维看问题，这是其在本次大会上给出的一个结论。

　　在他看来，AI时代下，“超级能干”的应用远比只看DAU的“超级应用”，来得更加重要。“只要对产业、对应用场景能产生大的增益，整体的价值就比移动互联网要大多了。”李彦宏如是说。

　　仔细想来，其实这并不难理解。

　　眼下及未来很长一段时间里，如果再像移动互联网时代那般，把绝大多数精力放在底层模型，一来，不断地重复开发基础大模型，也是对社会资源的极大浪费；二来，也是更重要的是，这或将错失更大的机会，特别是锚定产业价值层面的机会。

　　卷模型与卷应用，从来不是二选一

　　在人们讨论AI大模型数量过多的时候，伴生而来还会注意到另一个现象：数百个大模型问世，这些大模型之间的差异性到底体现在哪儿？而仅从国内生成式AI的竞争演变，就能看出这个情况——

　　过去一年多，无论是模型层还是应用层，都出现了从“百模大战”到“补贴大战”的转变，起码在底层模型层，行业已经出现相对饱和；另一方面，行业出清的迹象已经产生。以文心一言为代表的世界领先水平的一批国产大模型已经出现。

　　从过往连篇累牍的报道中也能发现，从无到有训练一个底层大模型，数亿乃至数十亿的资本投入、一卡难求的算力投入、可遇而不可求的AI细分行业人才，只是万里长征第一步。后续的模型迭代、生态培养等成本，远非中小AI团队可以承担。

　　正因如此，对于行业的大多数人来说，除非是成规模的大厂，抑或是拿到“龙傲天”剧本的明日之星，卷模型都是一个“无底洞”。无论是积累用户，抑或是解决实际场景下的实际问题，都是应用层的机会更大。

　　而在这个过程中，行业大模型有关开源、闭源谁更具有优势的争辩，一直未曾停止。

　　支持开源的行业人士认为，开源模型的意义，在于所有团队都站在一个起跑线上，拿着同样的厨具和食材，能炒出什么样的菜，各凭本事，这是一种公平竞争。

　　但大模型的开源，或许与一般意义上的软件开源，存在根本上的差异。譬如一般软件开源时，开发者可以获取软件的源代码，并据此修改或者增加新功能。

　　大模型内部代码，则分为预训练代码、微调代码和推理代码三层，对于微调代码，市场上已有很多公开方法。而大模型要被用起来，需要推理代码，至于训练过程和数据集，往往也是大模型厂商的核心所在。此外还有算力层面的考量。

　　在这种背景下，拥有经验证商业模式的闭源模型，更适合在竞争激烈的大模型行业里聚集人才和算力，进而实现商业化落地。这也是李彦宏的判断。

　　尽管在大会上，他并未否定开源在某些环境中的使用价值，但他也提到，“当你处在一个激烈竞争的市场环境当中的时候，你需要是让自己业务的效率比你的同行更高，成本比你的同行更低，这个时候商业化的闭源模型是最能打的。”

　　当然更值得强调的是，“没有应用，光有基础模型，不管是开源还是闭源都一文不值。所以，我从去年下半年就开始讲大家不要卷模型了，要去卷应用。”

　　李彦宏透露，在更通用的领域当中，比如说代码生成，像文心快码这样的软件，在不同的领域正在逐步的渗透，“而在百度内部，我们有30%左右的代码，已经用AI生成的，代码的采用率超过了44%。”

　　下一个爆发点在哪？

　　无论是重构的百度文库，抑或是作为底层模型能力终端的文心一言，都只是生成式AI应用落地的初步形态。在李彦宏看来，智能体是大模型落地最有前景的发展方向，也被认为是最接近AGI的方向。

　　从具体功能来看，智能体不止有对话能力、还有反思、协作能力。在未来的行业应用上，多个智能体协作，去解决复杂的任务，将是非常前沿的技术趋势。某种意义上说，这也是“超级能干”的又一种体现。

　　“制作一个好的智能体通常并不需要编码，只要用人话把智能体的工作流说清楚，再配上专有的知识库，一般就是一个很有价值的智能体了。”随着基础模型的日益强大，开发应用也越来越简单了，智能体也成为李彦宏最看好的AI应用方向之一。

　　事实上，百度对于智能体的布局较早。早在去年4月份，基于文心一言的文心智能体已经上线。今年6月，中国工程院朱有勇院士及团队与百度共同打造的首个农业智能体——“农民院士智能体”正式发布。

　　智能体学习朱有勇院士的研究成果以及相关的农业知识之后，农民只需通过简单的提问，就能得到关于旱地稻种植条件、培育技术、病虫害防治等实际问题的专业解答。

　　值得一提的是，在文心智能体的平台上，已经有16万多名开发者和超5万家企业入驻，覆盖了100多个应用场景，智能体生态已然初具规模。

　　在无数个细分领域，随着各行各业对于生成式AI的理解不断加深，基于闭源小模型的智能体，也将为行业增效发挥巨大作用。企业多数重复琐碎的工作，将会被“超级能干”的智能体所替代，人类大脑深处的潜能，将会投入到更具创造性的工作中去。

　　而这，就是“超级能干”的大模型应用落地的价值内核：一方面，让普通人以更小的成本，去了解和使用大模型和AI应用；另一方面，企业也能在不断的AI应用中，了解模型使用的具体场景，以及能带来的实际价值。

　　真相无法揭露，只能接近

　　作者：胡家铭监制：大曼排版：洋洋

发布于：北京

大模型走到下半场，真正的“卷点”应该在哪？

推荐科技快讯

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

人类唯一的出路：变成人工智能（三）

饿了么口碑：今年计划招5000名员工、增80万骑手

盖茨力劝美国用核技术解决气候变化愿掏数十亿腰包

大模型走到下半场，真正的“卷点”应该在哪？

推荐科技快讯

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

人类唯一的出路：变成人工智能（三）

饿了么口碑：今年计划招5000名员工、增80万骑手

盖茨力劝美国用核技术解决气候变化 愿掏数十亿腰包

盖茨力劝美国用核技术解决气候变化愿掏数十亿腰包