首页 科技快讯 李开复发布零一万物“闪电模型” 称没有放弃预训练也未亏钱拉新

李开复发布零一万物“闪电模型” 称没有放弃预训练也未亏钱拉新

来源:晰数塔互联网快讯 时间:2024年10月16日 23:15

10月16日,李开复携零一万物的最新旗舰模型 Yi-Lightning(直译为闪电模型)进行了线上发布,并接受了包括新京报贝壳财经在内的媒体采访,回答了包括“是否放弃预训练”、“定低价是否亏钱拉新”、“如何看待中美大模型差距”等问题。

李开复表示,在国际权威盲测榜单 LMSYS 上,Yi-Lightning超越了GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中国第一。不过他也坦承,由于算力等直观差距,要缩短中美的大模型技术差距,难度很高。

李开复线上接受包括新京报贝壳财经在内的媒体采访 线上会议视频截图

辟谣“放弃预训练” 国内大模型“六小虎”弹药充足

此前,零一万物曾在行业传闻中被指“放弃了预训练”。对此,李开复在发布会上用 Yi-Lightning进行了“直接回应”,“Yi-Lightning在盲测模型擂台里达到了一万次以上的投票,最后结果是,排在我们之前的模型基本只有两个硅谷头部公司,就是OpenAI的几个模型,Google的两个模型,另外我们和马斯克的xAI Grok打平,并列第六名。从这里可以看到有关当前讲的大模型预训练中国不能做,这个事情我们正式辟谣。零一万物绝不放弃预训练,而且我们的预训练做得又快又好。”

李开复表示,做好预训练模型是一个技术活,而且要非常多有才华的人在一起工作,慢工出细活,“如果一个公司能有幸拥有这么多优秀的人才,能够跨领域的合作,那我相信中国是绝对可以做出世界排名前十的预训练的通用模型,但不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司训练做预训练。”

事实上,在AI最热的高光时刻逐渐过去,国内六家独立大模型初创公司(又被称为“六小虎”)均受到不同程度的质疑,有传言称其中已经有两家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用。

对此,李开复直言,据他所知这六家公司融资额度都是够的,“我们做预训练的production run(流水线生产),训练一次三四百万美元,这个钱也是头部公司都付得起,我觉得中国的六家大模型公司只要有够好的人才,想做预训练的决心,融资额跟芯片都不会是问题的。”

定价0.99元/百万token但没有“亏钱拉新” 中美大模型差六个月已经是很好结果

本次,Yi-Lightning在盲测榜单LMSYS上排名第六,该榜单排名第一的是发布于9月3日的最新版本GPT-4o-latest,而OpenAI于5月13日发布的GPT-4o排名第七,在Yi-Lightning之后,这也让李开复感到骄傲,此前有说法称中美大模型的差距是六个月,而随着该榜单的出现,有声音认为这说明中美大模型的差距已经被零一万物拉近到了五个月。

对于能否继续拉进中美在大模型技术之间的差距,李开复坦言道缩短时间差非常困难,“我不预测我们可以缩短这个时间差。因为毕竟人家是用十万张GPU训练出来,我们用的是两千张GPU训练出来,我们能够达到这个时间差只是因为我们的模型、AI infra(基础设施)等团队都热心聪明,去使用和理解对方做出来的东西,再加上我们自己每家的研发有特色,这一套方法论在零一万物已经成熟了,我们有信心把自己的创新加上一些特长,再关注OpenAI和其他公司发布的新技术,能够尽快地去了解这些技术的核心重要性,然后把它的能力在我们自己的产品里面发挥出来,我觉得这套方法保持在六个月左右,就已经是很好的结果了。如果期待破局,可能需要一个前所未有的算法才有机会。”

“我们千万不要认为落后六个月是一个很羞耻的事情,或者一定是要追赶的事情,因为我很多美国朋友都认为中国会远远落后,也有美国朋友包括一些中国朋友认为按照这个打法,基于算力的差距,我们要被甩掉三年、五年甚至十年都有可能,但现在从零一万物证明了不会落后这么多,而且这次LMSYS的榜单上也有两家其他中国公司表现也不错,也不是只有我们一家在做。所以对于奋力图强、勤奋努力、聪明多元化的团队,用类似零一万物的打法去贴近美国最顶尖的公司,不落后超过六个月,我觉得是可能,而且不只是我们一家可能,但难度是高的。”李开复说。

目前,零一万物将最新旗舰模型 Yi-Lightning的API价格降至每百万token收费0.99元,直逼行业最低价。值得注意的是,此前国内大模型陷入“价格战”时,李开复曾对新京报贝壳财经等媒体表态,“零一万物不参与价格战。不能只看模型价格,还要看模型性能是否足够好。”

那么,为何本次李开复又主动降价了呢?对此,他表示在Yi-Lightning的定价上并没有亏本,“零一万物也在做App,我们知道做App需要控制成本,所以我们不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天0.99元/百万token的价格。”

记者联系邮箱:luoyidan@xjbnews.com

新京报贝壳财经记者 罗亦丹 编辑 陈莉 校对 柳宝庆

发布于:北京

相关推荐

李开复发布零一万物“闪电模型” 称没有放弃预训练也未亏钱拉新
李开复旗下“零一万物”大模型被指抄袭LLaMA
李开复筹办的AI大模型公司“零一万物”上线,百亿级模型已内测|钛媒体焦点
李开复被大模型绊了一跤
李开复孵化的AI独角兽,零一万物完成数亿美元新一轮融资
李开复孵化的 AI 独角兽,零一万物完成数亿美元新一轮融资
李开复大模型公司“零一万物”官网上线:打造全新的 AI 2.0平台
阿里云领投李开复 AI 公司新一轮融资,首款大模型正式发布
李开复AI公司回应大模型抄袭:尊重开源社区的反馈,将更新代码
对话李开复:这次大模型创业,我十年都不会变现

网址: 李开复发布零一万物“闪电模型” 称没有放弃预训练也未亏钱拉新 http://www.xishuta.com/newsview126760.html

所属分类:行业热点

推荐科技快讯