一键安装此插件:
42plugin install huggingface/skills/model-trainer42plugin install huggingface/skills/model-trainer插件介绍
当用户希望使用 TRL(Transformer 强化学习)在 Hugging Face Jobs 基础设施上训练或微调语言模型时使用。涵盖 SFT、DPO、GRPO 和奖励建模训练方法,以及本地部署的 GGUF 转换。包括 TRL Jobs 的指导。
一键安装此插件:
42plugin install huggingface/skills/model-trainer42plugin install huggingface/skills/model-trainer当用户希望使用 TRL(Transformer 强化学习)在 Hugging Face Jobs 基础设施上训练或微调语言模型时使用。涵盖 SFT、DPO、GRPO 和奖励建模训练方法,以及本地部署的 GGUF 转换。包括 TRL Jobs 的指导。