国产大模型,什么时候能搞出 Sora ?
来源:技术领导力
作者| Mr.K
这几天AIGC圈子炸了,OpenAI发布了文生视频模型Sora,给本来就火热的AIGC赛道,又添了一把柴火。Sora模型生成的视频质量和真实度,都达到了前所未有的高度。360董事长周鸿祎感慨地说,Sora的出现意味着AGI的实现从十年缩短到一两年。
很多读者问我,Sora的出现意味着中美两国在AI领域的差距越来越大吗?国产大模型聚焦应用难道错了吗?中国版的Sora,还要多久?下面谈谈我的看法。
01
Sora发布,多模态大战提速
大模型本质上是世界模型,代表着AI对人类世界的认知。以文字生成为例,大模型不是简单预测下一个最有可能出现的文字是什么,而是基于海量知识预训练的结果,去理解人类输入文字的语义,然后给出基于对世界认知的答案。
相对于文字和图片处理来说,视频所包含的信息量更丰富,这就意味着需要耗费更大的算力来训练,工程复杂度也较高。
1)文生视频是大模型的“最后一块拼图”
如果说AIGC是AI技术领域的皇冠,那么文生视频就是皇冠上的宝石。Sora的出现,好比视频领域的GPT-3时刻的到来,这是具有颠覆性的事件,它完成了大模型技术的最后一块拼图,标志着大模型的竞争进入到了比拼多模态的阶段。
2)为什么Sora加速了AGI的实现
如周鸿祎所说:“Sora只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。” “有强劲的大模型做底子,基于对人类语言的理解,对人类知识和世界模型的了解,我们距离AGI的实现将越来越近。”
基于这些理解,不难得出结论:接下来的大模型之战,谁能打赢多模态这场战役,就有可能赢得整个战争。
02
中美在AI领域的差距,正在加大吗?
业内的观点普遍认为,Sora的出现说明在AI领域,中美的差距正在加大。我却有不同看法,先来聊聊美国的大模型。
1)美国大模型搞到什么程度了?
根据公开数据,到2023年5月,美国10亿级参数规模以上的基础大模型就已突破100 个,也是妥妥的“百模大战”。高盛预测,美国2025年大模型相关投资可达千亿美元,约全球的1/2。从资金投入上看,美国也是遥遥领先的。
除了ChatGPT之外,美国具有代表性的通用大模型公司有:Anthropic、Cohere、Google、Meta等。
美国大模型的行业应用方面,主要集中在金融、医疗、教育等领域。比如:在线教育组织Khan Academy于4月发布的基于GPT-4模型的AI助教Khanmigo,并且已经实现商业化。还有谷歌的Med-PaLM2,它在美国医师执照考试(USMLE)中获得85分以上。
2)国产大模型,现状盘点
据不完全统计,2023年中国约有300多家公司先后发布了大模型。一类是头部科技企业,如:阿里、百度、腾讯、华为等;以及新创立的公司,如:智谱AI、百川智能、MiniMax等;还有传统AI企业,如:科大讯飞、商汤科技等。许多高校研究院,如:清华、复旦、中科院等,也都已经深度布局大模型。
中国的大模型公司很多是从产业端实战出来的,这跟美国从实验室里孵化成熟再推出的做法是有所区别的。比如:阿里、百度、腾讯的大模型应用在了广告推送、图像识别、内容分发等业务场景上,你能感知到广告推送越来越准了,视频和图文推荐越来越好看了,这背后就是大模型的功劳。
3)中美大模型,差距在加大吗?
据《金融时报》报道,中国已在全球前10的大模型研发机构中占据4席,分别是百度、BAAI智源研究院、清华大学以及阿里巴巴研究院。
百度的“文心一言”、阿里巴巴的“通义千问”等都是我国自研的大模型,其性能以及各项测评指标,跟美国大模型可以一较高下。
个人认为,相对来说美国企业更加重视底层研发能力,中国企业更偏框架、行业应用层面的研发。也就是说,以ChatGPT-4、Sora为代表的基础大模型方面,美国具备一定的技术领先优势。但是在大模型的AI应用和行业解决方案方面,中国有着更广阔的市场和丰富的应用场景。
因此,从整体大模型发展来看,其实很难做到Apple to Apple的比较,而大模型很重要的特征是:应用和技术的双轮驱动。也就是说,大模型应用产生的数据反哺模型本身,形成一个正反馈,不断迭代发展,最终倒逼底层技术的突破。从长远来看,中国的基础大模型技术赶超美国只是时间问题。
这不是盲目乐观,只要回顾一下中国互联网发展史就很清晰了:PC时代的电商系统,移动时代的支付、打车、外卖,都经历过这样的技术演进过程。从全世界范围来看,也只有中国才有“12306”全民秒杀火车票、春节十几亿人抢红包这样的场景。中国互联网经过20多年的野蛮生长,场景应用倒逼底层技术突破,时至今日我们打造出世界领先的电商系统、支付系统、分布式技术、数据存储技术。中国的大模型正在经历同样的过程。
03
中国版的Sora,还需要多久?
这是许多业内人最关心的问题,中国版的Sora,究竟还需要多久?
1)“他们996搞了1年”,我们需要多久?
根据AI研究领域大神谢赛宁透露,他的好友Bill Peebles也就是Sora的领队,整整高强度工作了一年,最终发布了这个惊艳世界的视频模型。
谢赛宁表示,对于Sora这样复杂的系统,人才第一,数据第二,算力第三,其他都没有什么是不可替代的。对于中国科技巨头来说,以上三个条件都是具备的,剩下的也只是时间问题。
我问了几位大厂的朋友,得到的回复是“在搞了”,都处于保密状态,个人感觉应该就是这几个月吧。
2)中国版Sora最大的挑战
K哥以为,比起问“我们什么时候能搞出中国版Sora?”,也许我们更应该问“当中国版Sora出现的时候,我们是否准备好了?” 在不久的将来,如美剧《黑镜》这样的故事情节即将成为现实,如何保护个人信息和隐私不被恶意使用和传播?如何防止某些组织从中非法牟利?都需要有一个成熟完善的监控体系。
结束语
追赶这一波潮流不仅仅在于技术突破,更在于我们对未来的准备。国产大模型的发展不只是技术的竞争,也是对世界认知和文化的较量。
技术进步带来的不仅是便利,也有伦理、法律和社会挑战。在追求技术创新的同时,我们更应思考如何让这些技术服务于社会,如何在科技创新与秩序之间找到平衡。
相信国产大模型会越来越好,更深度地参与和引领这场AI技术革命,成为推动人类文明进步的重要力量。
发布于:北京
相关推荐
Sora:大模型从读万卷书到行万里路
模型Sora来了! 国内专家:哪些从业者恐失业?
Sora给中国AI带来的真实变化
Sora带来广阔市场空间 AI产业链发展迎重大机遇期
OpenAI刷屏的Sora模型,是如何做到这么强的?
技惊四座的Sora模型,参数只有30亿?
Sora “拯救”元宇宙,世界模型的潜力才刚释放
一场新的“革命”已经开始,揭秘OpenAI文生视频模型Sora技术报告
AI大神贾扬清评价新晋网红大模型Sora……
Sora互联网纪实:卖课割韭菜、A股大涨停
网址: 国产大模型,什么时候能搞出 Sora ? http://www.xishuta.com/newsview109073.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 94849
- 2人类唯一的出路:变成人工智能 18398
- 3报告:抖音海外版下载量突破1 18010
- 4移动办公如何高效?谷歌研究了 17665
- 5人类唯一的出路: 变成人工智 17505
- 62023年起,银行存取款迎来 10028
- 7网传比亚迪一员工泄露华为机密 8029
- 8顶风作案?金山WPS被指套娃 6562
- 9大数据杀熟往返套票比单程购买 6535
- 1012306客服回应崩了 12 6389