⚡

模型量化

Name: 模型量化
Rating: 5
Author: ovachiever

一键安装此插件：

42plugin install ovachiever/droid-tings/bitsandbytes42plugin install ovachiever/droid-tings/bitsandbytes

插件介绍

将大语言模型量化为8位或4位，实现50-75%的内存节省且精度损失最小。适用于GPU内存有限、需要部署更大模型或追求更快推理的场景。支持INT8、NF4、FP4格式、QLoRA训练和8位优化器，兼容HuggingFace Transformers。