月之暗面回应大模型称9.11大于9.9:边界案例有助于我们增加对大模型能力边界的了解
【#月之暗面回应大模型称9.11大于9.9#:边界案例有助于我们增加对大模型能力边界的了解】今日,#大模型测不出9.11和9.9哪个大#登上微博热搜,有媒体记者测试了12个国内外主流大模型,其中ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量等模型均答错了,认为9.11大于9.9。
对此,@新浪科技 向上述企业问询了解背后的技术原理。截止发稿,月之暗面回应表示:“其实我们人类对大模型的能力探索——无论是大模型能做到什么,还是大模型做不到什么——都还处于非常早期的阶段。我们非常期待用户在使用中能够发现和报告更多的边界案例(Corner Case),不管是最近的‘9.9和9.11哪个大、13.8和13.11哪个大’,还是之前的‘strawberry有几个r’,这些边界案例的发现,有助于我们增加对大模型能力边界的了解。”
同时,月之暗面也表示,“要彻底解决问题,又不能仅仅依赖于逐一修复每个案例,原因在于这些情况就像自动驾驶会遇到的场景一样是很难穷尽的,我们更加要做的是不断增强底层基础模型的智能水平,让大模型变得更加强大和全面,能够在各种复杂和极端情况下依然表现出色。”
另有企业内部人员对新浪科技表示,“在一些场景,9.11确实比9.9大,版本号9.11是比9.9大,日期9.11是比9.9大,章节9.11章节也比9.9大……”该人士指出,“大模型学到的更多是上述这样的内容,之前也没人类来这么问他,所以他就没有跟人类的需求对齐,下一步对齐一下就好了。”(新浪科技)
发布于:北京
相关推荐
强力覆盖导购、本地生活,月之暗面推出多个“Kimi分身”,大模型应用元年加速到来?
月之暗面反割阿里一把?
大模型公司月之暗面融资超10亿美元:阿里领投 创始人为清华90后学霸杨植麟
月之暗面创始团队持股不足半,为何他们不担心?
月之暗面的反差:资本运作高手,AI能力低能儿?
大模型Kimi爆火,能解国产GPT的“意难平”么?
200亿估值后,月之暗面们的考验真正开始
谁才是大模型“四小龙”?
谷歌微软阿里华为都爱上大模型,AI开发边界被打破
消息称AI创业公司月之暗面将获蚂蚁、阿里投资,估值15亿美元
网址: 月之暗面回应大模型称9.11大于9.9:边界案例有助于我们增加对大模型能力边界的了解 http://www.xishuta.com/newsview122399.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 94776
- 2人类唯一的出路:变成人工智能 17816
- 3报告:抖音海外版下载量突破1 17333
- 4移动办公如何高效?谷歌研究了 17092
- 5人类唯一的出路: 变成人工智 16921
- 62023年起,银行存取款迎来 9962
- 7网传比亚迪一员工泄露华为机密 7919
- 812306客服回应崩了 12 6329
- 9山东省大数据局副局长禹金涛率 6096
- 10从TikTok在美困境看全球 6058