一键安装此插件:

42plugin install ovachiever/droid-tings/bitsandbytes

插件介绍

将大语言模型量化为8位或4位,实现50-75%的内存节省且精度损失最小。适用于GPU内存有限、需要部署更大模型或追求更快推理的场景。支持INT8、NF4、FP4格式、QLoRA训练和8位优化器,兼容HuggingFace Transformers。

从属套包

ovachiever/kit/droid-tings

插件信息

类型
许可证MIT
来源GitHub
发布时间2026年1月14日
更新时间2026年1月14日

插件评分

活水指数
4.7
文档清晰
内容质量
示例丰富
规范程度
可信程度