一键安装此插件:
42plugin install k-dense-ai/claude-scientific-skills/stable-baselines3
该插件支持多种强化学习算法(如 PPO、SAC、DQN 等),允许用户创建自定义 Gym 环境,并实现监控和控制的回调功能。它还支持使用向量化环境进行并行训练,便于与深度 RL 工作流程集成。
从属套包
k-dense-ai/kit/claude-scientific-skills