一键安装此插件:

42plugin install ovachiever/droid-tings/gptq

插件介绍

为大型语言模型提供训练后4位量化,在精度损失最小的情况下实现4倍内存压缩和3-4倍推理加速,支持在消费级GPU上部署70B/405B大模型,并与transformers和PEFT框架集成进行QLoRA微调。

从属套包

ovachiever/kit/droid-tings

插件信息

名称gptq
类型
许可证MIT
来源GitHub
发布时间2026年1月14日

插件评分

活水指数
4.6
文档清晰
内容质量
示例丰富
规范程度
可信程度