华为申请人工智能模型的量化方法专利,减少AI模型占用的内存
本文源自:金融界
金融界2025年1月31日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“人工智能模型的量化方法、处理系统和量化单元”的专利,公开号 CN 119378614 A,申请日期为 2023年7月。
专利摘要显示,一种人工智能模型的量化方法、人工智能模型的处理系统、量化单元和计算设备。量化单元可以基于运行AI模型的计算设备的各个计算单元的处理粒度,将量化矩阵分割成多个适用于各个计算单元的处理粒度的分块量化矩阵。量化单元可以对分块量化矩阵进行量化处理,以得到量化后的分块量化矩阵,并存储在存储器中,可以减少AI模型占用的内存。量化矩阵可以是权重矩阵,也可以是激活矩阵。量化单元量化过程中,是基于运行AI模型的计算设备的各个计算单元的处理粒度进行量化,并不需要基于张量级别进行离群值的统计,实现AI模型对权重矩阵和激活矩阵都可以进行实时量化。
天眼查资料显示,华为技术有限公司,成立于1987年,位于深圳市,是一家以从事计算机、通信和其他电子设备制造业为主的企业。企业注册资本4084113.182万人民币。通过天眼查大数据分析,华为技术有限公司共对外投资了49家企业,参与招投标项目5000次,知识产权方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可1353个。
发布于:北京
相关推荐
华为申请人工智能模型的量化方法专利,减少AI模型占用的内存
性能不打折,内存占用减少90%,Facebook提出极致模型压缩方法Quant-Noise
AI大模型,如何打破“内存墙”?
端侧大模型,手机厂商的下一次入口级机会
中国电信申请网元发现方法专利,极大地减少NRF之间的信息传输量以及所占用的NRF存储资源
AMD公布North Star计划:全新AI PC芯片将支持300亿参数大模型
AMD公布North Star计划:全新AI PC芯片将支持300亿参数大模型,每秒可生成100个Token
海光信息申请内存诊断方法专利,提高内存故障诊断的效率和计算机的稳定性
隐秘AI巨头“幻方量化”:大模型,不止用来炒股 | 焦点分析
华阳国际申请三维实体有限元模型的生成方法、装置、终端及存储介质专利,专利技术能有效提高三维实体有限元模型的生成效率
网址: 华为申请人工智能模型的量化方法专利,减少AI模型占用的内存 http://www.xishuta.com/newsview132160.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 95067
- 2人类唯一的出路:变成人工智能 20174
- 3报告:抖音海外版下载量突破1 19974
- 4移动办公如何高效?谷歌研究了 19396
- 5人类唯一的出路: 变成人工智 19282
- 62023年起,银行存取款迎来 10229
- 7网传比亚迪一员工泄露华为机密 8346
- 8五一来了,大数据杀熟又想来, 7727
- 9滴滴出行被投诉价格操纵,网约 7350
- 10顶风作案?金山WPS被指套娃 7158