一键安装此插件:
42plugin install ovachiever/droid-tings/model-pruning
使用Wanda和SparseGPT等剪枝技术,无需重新训练即可压缩模型,实现50%稀疏度且精度损失最小,或在硬件加速器上实现更快推理。涵盖非结构化剪枝、结构化剪枝、N:M稀疏、幅度剪枝和单次剪枝方法。
从属套包
ovachiever/kit/droid-tings