From Local to Global: Revisiting Structured Pruning Paradigms for Large Language Models

发布时间：2026/7/5 15:15:59

From Local to Global: Revisiting Structured Pruning Paradigms for Large Language Models

文章总结与翻译一、主要内容本文聚焦大型语言模型（LLMs）的结构化剪枝技术，针对主流局部剪枝范式任务无关、下游性能提升有限的问题，重新审视全局结构化剪枝并提出GISP（Global Iterative Structured Pruning）方法。核心背景结构化剪枝因能生成硬件友好的紧凑架构，成为LLMs高效部署的关键技术，但现有局部剪枝（如Wanda、SparseGPT）通过层-wise重构优化，忽视任务目标，难以利用任务特定校准信号。全局剪枝虽能关联模型级损失，但传统单步全局剪枝在高稀疏度下稳定性差、易导致困惑度崩溃。GISP方法核心设计全局迭代剪枝：采用逐步剪枝策略（线性调度器控制每步剪枝比例），避免单步大量权重移除，在高稀疏度（40%-50%）下稳定模型性能，无需中间微调。结构级重要性评估：基于一阶损失信息，通过块归一化聚合注意力头和MLP通道的重要性，自然实现非均匀剪枝。任务特定适配：支持自定义任务目标，实例化两种损失函数——语言建模的困惑度损失、决策类任务的边际损失（Preserve正确/错误答案的损失差距）。“一次剪枝，多端部署”：迭代轨迹形成嵌套子网络，单次剪枝可生成不同稀疏度的模型，摊销计算成本。

Pot Desktop：跨平台划词翻译软件完整使用指南 - 5分钟实现高效多语言工作流

Pot Desktop：跨平台划词翻译软件完整使用指南 - 5分钟实现高效多语言工作流

2026/7/5 15:15:56 ID: 215868

高效技巧怎么用 AI 做表格，搭配 AI 导出鸭一站式搞定表格生成与导出工作

高效技巧怎么用 AI 做表格，搭配 AI 导出鸭一站式搞定表格生成与导出工作

2026/7/5 15:15:46 ID: 215867

深度解析Bottles：如何在Linux上轻松运行Windows游戏和软件

深度解析Bottles：如何在Linux上轻松运行Windows游戏和软件

2026/7/5 15:15:36 ID: 215866

终极macOS下载神器：三分钟获取苹果原版系统

终极macOS下载神器：三分钟获取苹果原版系统

2026/7/5 16:01:16 ID: 216564

从零到专业：FreeCAD三维设计能力成长指南

从零到专业：FreeCAD三维设计能力成长指南

2026/7/5 16:01:16 ID: 216563

Android FFmpeg视频转码实战指南：开源Video Transcoder深度解析与最佳实践

Android FFmpeg视频转码实战指南：开源Video Transcoder深度解析与最佳实践

2026/7/5 16:01:16 ID: 216562

终极指南：如何用Arnis将现实世界完美复刻到Minecraft中

终极指南：如何用Arnis将现实世界完美复刻到Minecraft中

2026/7/5 16:01:13 ID: 216561

从零开始：5分钟掌握AI变声神器RVC的完整终极指南

从零开始：5分钟掌握AI变声神器RVC的完整终极指南

2026/7/5 16:01:10 ID: 216560

从混乱到秩序：如何用系统化方法解决AI编程助手的工作流困境

从混乱到秩序：如何用系统化方法解决AI编程助手的工作流困境

2026/7/5 16:01:10 ID: 216559

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

2026/7/5 0:00:00 ID: 201947

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

2026/7/5 0:00:46 ID: 201948

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

2026/7/5 0:00:53 ID: 201949

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

2026/7/5 0:00:00 ID: 201947

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

2026/7/5 0:00:46 ID: 201948

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

2026/7/5 0:00:53 ID: 201949

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案

2026/7/4 17:50:58 ID: 132550

基于Dify与DeepSeek构建私有知识库问答系统实战指南

基于Dify与DeepSeek构建私有知识库问答系统实战指南

2026/7/5 14:41:18 ID: 132551

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

2026/7/4 3:31:24 ID: 132552