一键安装此插件:

42plugin install ovachiever/droid-tings/openrlhf

插件介绍

基于Ray+vLLM加速的高性能RLHF框架,支持7B-70B+大模型的PPO、GRPO、RLOO、DPO训练,采用分布式架构和GPU资源共享,比DeepSpeedChat快2倍。

从属套包

ovachiever/kit/droid-tings

插件信息

名称openrlhf
类型
许可证MIT
来源GitHub
发布时间2026年1月14日

插件评分

活水指数
4.0
文档清晰
内容质量
示例丰富
规范程度
可信程度