50s完成7B模型量化4bit达到新SOTA大模型低比特量化有新招了NeurIPS2024Oral

更新时间：2025-05-21 03:44:49 发布时间：72天前评论：0

收藏

分享

内容摘要　　，他们针对LLM权重激活量化提出了两种正交变换，有效降低了outliers现象，达到了4-bit的新SOTA。　　简单理解，在大语言模型（LLM）中，有一些中间层输出的数值（激活值 Activation）会变得非常大，它们被称为“outliers（离群值）”，这些 outliers给模型量化带来了挑战。　　这种outliers不同于以往发现的Normal Outl

　　，他们针对LLM权重激活量化提出了两种正交变换，有效降低了outliers现象，达到了4-bit的新SOTA。

　　简单理解，在大语言模型（LLM）中，有一些中间层输出的数值（激活值 Activation）会变得非常大，它们被称为“outliers（离群值）”，这些 outliers给模型量化带来了挑战。

　　这种outliers不同于以往发现的Normal Outliers，表现为大于绝对值几百的异常值并局限于个别的tokens中——

　　它们导致现有的量化算法（如SmoothQuant和OmniQuant）在将模型的权重和激活值量化为4位二进制数时表现不佳。

　　DuQuant通过学习旋转和置换变换矩阵，在Activation矩阵内部将outliers转移到其他通道，最终得到平滑的激活矩阵，从而大幅降低了量化难度。

　　在每个Transformer块的常见模块中，多头自注意力（MSA）和前馈网络（FFN）基本上都由线性层组成，将其表示为：

　　模型量化通过将浮点数（FP16, BF16）表示的模型权重或激活值转换为低位的浮点数或整数来减少内存占用，权重激活量化可以通过使用低比特乘法的算子进一步加快模型推理的速度。

　　遵循主流量化方法，作者对激活

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: 50s完成7B模型量化4bit达到新SOTA大模型低比特量化有新招了NeurIPS2024Oral

本文链接: http://31dou.com/news/show-563630.html (转载时请保留)

0 条

康佳智能锁售后服务热线号码24小时实时资讯今+日+汇+总

观点 jindinglaye ⋅ 16阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09
古丽康智能锁热线-全国统一400客服24小时服务热线实时资讯今+日+汇+总

观点 tjskytd ⋅ 16阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09
温典指纹锁服务热线24小时-售后热线号码实时资讯今+日+汇+总

观点 cchg201108 ⋅ 17阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09
秉秉防盗门维修售后热线24小时丨全国400服务点实时资讯今+日+汇+总

观点 aoshen518 ⋅ 18阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09
耐仕拉（NEXSLA）智能锁售后维修热线号码-人工售后热线号码实时资讯今+日+汇+总

观点 tjskytd ⋅ 6阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09
世安智能锁全国统一服务热线-全国24小时服务中心实时资讯今+日+汇+总

观点 cchg201108 ⋅ 14阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09
溥畔智能门锁|全国服务实时资讯今+日+汇+总

观点 cchg201108 ⋅ 7阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09
汇香天泽指纹锁售后维修热线号码-人工售后热线号码实时资讯今+日+汇+总

观点 aoshen518 ⋅ 5阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09
威士迪指纹锁售后服务热线号码-全国各售后热线号码实时资讯今+日+汇+总

观点 tnki ⋅ 14阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09
好太太指纹锁24小时全国售后热线实时资讯今+日+汇+总

观点 pink8 ⋅ 7阅读量 ⋅ 0评论 ⋅ 11天前

2025-05-09

喷墨打印机如何保养：看这篇就够了

行业 ⋅ 10阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21
固态电池何时更进一步国轩高科：准固态电池将在5年内推向市场

行业 ⋅ 1阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21
鸿蒙电脑居然是折叠屏：华为杀手级大招太多了



行业 ⋅ 19阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21
技嘉RTX 5060小雕首发评测：超越RTX 4060 Ti！2K也有一战之力

行业 ⋅ 5阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21
为AI推理和专业工作站量身定制英特尔锐炫Pro B60/B50专业显卡来了



行业 ⋅ 13阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21
鸿蒙电脑横空出世：PC行业要变天了



行业 ⋅ 3阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21
摩尔线程显卡300.110版驱动发布：《生化危机4：重制版》帧率飙升200%

行业 ⋅ 4阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21
苹果WWDC25详细日程出炉！史上变化最大的iOS 19来了可升级机型曝光

行业 ⋅ 10阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21
对标华为鸿蒙电脑非凡大师！苹果巨型折叠屏已在路上

行业 ⋅ 4阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21
快手上线算法推荐优化功能：支持自我评估信息茧房、一键破茧

行业 ⋅ 14阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21

移远通信拟定增募资不超23亿 2019上市两募资共20亿

经济资讯站长 ⋅ 11阅读量 ⋅ 0评论 ⋅ 2025-04-01 18:01

2025-04-01
华资实业终止不超过2.96亿元定增 2024年扣非亏损

经济资讯站长 ⋅ 18阅读量 ⋅ 0评论 ⋅ 2025-04-01 18:01

2025-04-01
破发股盛泰集团股东拟减持 2021年上市两募资共12.6亿



经济资讯站长 ⋅ 19阅读量 ⋅ 0评论 ⋅ 2025-04-01 18:01

2025-04-01
破发股井松智能某股东拟减持上市即巅峰华安证券保荐

经济资讯站长 ⋅ 5阅读量 ⋅ 0评论 ⋅ 2025-04-01 16:01

2025-04-01
破发股汇宇制药第二大股东拟减持上市即巅峰募24.7亿

经济资讯站长 ⋅ 15阅读量 ⋅ 0评论 ⋅ 2025-04-01 16:01

2025-04-01
子公司项目节能审查亮“红灯” 新和成：或涉环保问题非设备风险

经济资讯站长 ⋅ 8阅读量 ⋅ 0评论 ⋅ 2025-04-01 16:01

2025-04-01
收评：三大指数涨跌不一化学制药板块涨幅居前



经济资讯站长 ⋅ 1阅读量 ⋅ 0评论 ⋅ 2025-04-01 16:01

2025-04-01
厦门环能终止上交所主板IPO 原拟募11亿海通证券保荐



经济资讯站长 ⋅ 7阅读量 ⋅ 0评论 ⋅ 2025-04-01 12:01

2025-04-01
宝钛股份拟发不超35亿元可转债 2021年定增募20亿元

经济资讯站长 ⋅ 20阅读量 ⋅ 0评论 ⋅ 2025-04-01 12:01

2025-04-01
晶华新材不超2.27亿定增获上交所通过东方证券建功

经济资讯站长 ⋅ 20阅读量 ⋅ 0评论 ⋅ 2025-04-01 12:01

2025-04-01

iQOO Neo10 Pro+散热黑科技加持，性能释放无惧高温挑战

科技站务管理账号 ⋅ 4阅读量 ⋅ 0评论 ⋅ 3小时前

2025-05-21
（2025年05月19日）今日醋酐价格行情最新报价

五金站务管理账号 ⋅ 18阅读量 ⋅ 0评论 ⋅ 1天前

2025-05-20
（2025年05月16日）今日PMMA价格行情最新报价

五金站务管理账号 ⋅ 2阅读量 ⋅ 0评论 ⋅ 3天前

2025-05-17
Apple Watch实时字幕、头部跟踪，苹果将上新一系列辅助功能

科技站务管理账号 ⋅ 7阅读量 ⋅ 0评论 ⋅ 5天前

2025-05-15
蔚来李斌和沈斐开着乐道L60一块电池从上海到了合肥：全程467公里

科技站务管理账号 ⋅ 6阅读量 ⋅ 0评论 ⋅ 5天前

2025-05-15
工商银行好运锦鲤金条100克价格今天多少一克（2025年05月13日）

五金站务管理账号 ⋅ 15阅读量 ⋅ 0评论 ⋅ 7天前

2025-05-14
特斯拉无人驾驶出租车安全性遭调查 FSD系统成焦点

科技站务管理账号 ⋅ 17阅读量 ⋅ 0评论 ⋅ 7天前

2025-05-14
05月13日今日茯苓市场价格多少钱一斤查询

农村致富站务管理账号 ⋅ 3阅读量 ⋅ 0评论 ⋅ 7天前

2025-05-13
05月13日今日虾价格多少钱一斤查询

养殖知识站务管理账号 ⋅ 19阅读量 ⋅ 0评论 ⋅ 7天前

2025-05-13
（2025年5月13日）今日江西废铁回收价格查询

五金站务管理账号 ⋅ 9阅读量 ⋅ 0评论 ⋅ 7天前

2025-05-13

站务管理账号

去ta空间

24小时热闻

今日推荐

(c)2016-2021 SOQUANMAO.COM All Rights Reserved搜全贸版权所有浙ICP备19001410号-1

浙ICP备19001410号-1