语言模型训练器

一键安装此插件:

42plugin install huggingface/skills/model-trainer

插件介绍

当用户希望使用 TRL(Transformer 强化学习)在 Hugging Face Jobs 基础设施上训练或微调语言模型时使用。涵盖 SFT、DPO、GRPO 和奖励建模训练方法,以及本地部署的 GGUF 转换。包括 TRL Jobs 的指导。

从属套包

huggingface/kit/skills

插件信息

类型
许可证Complete
来源GitHub

插件评分

总分
4.4
文档清晰
内容质量
示例丰富
规范程度
可信程度