⚡

GPTQ量化

Name: GPTQ量化
Rating: 5
Author: ovachiever

⚡Skill

AI工具软件开发博士生 DevOps工程师后端开发者

代码生成自动化云部署

一键安装此插件：

42plugin install ovachiever/droid-tings/gptq42plugin install ovachiever/droid-tings/gptq

插件介绍

为大型语言模型提供训练后4位量化，在精度损失最小的情况下实现4倍内存压缩和3-4倍推理加速，支持在消费级GPU上部署70B/405B大模型，并与transformers和PEFT框架集成进行QLoRA微调。

从属套包

ovachiever/kit/droid-tings

插件信息

名称gptq

作者

ovachiever

类型

⚡Skill

许可证MIT

来源GitHub

发布时间2026年1月14日

更新时间2026年6月28日

报告问题

插件评分

活水指数

4.9

文档清晰

高

内容质量

高

示例丰富

高

规范程度

高

可信程度

高

⚡

GPTQ量化

⚡Skill

AI工具软件开发博士生 DevOps工程师后端开发者

代码生成自动化云部署

一键安装此插件：

42plugin install ovachiever/droid-tings/gptq42plugin install ovachiever/droid-tings/gptq

插件介绍

从属套包

ovachiever/kit/droid-tings

插件信息

名称gptq

作者

ovachiever

类型

⚡Skill

许可证MIT

来源GitHub

发布时间2026年1月14日

更新时间2026年6月28日

报告问题

插件评分

活水指数

4.9

文档清晰

高

内容质量

高

示例丰富

高

规范程度

高

可信程度

高