一键安装此插件:
42plugin install muratcankoylan/agent-skills-for-context-engineering/evaluation42plugin install muratcankoylan/agent-skills-for-context-engineering/evaluation插件介绍
该插件用于评估代理性能、构建测试框架和测量代理质量。 当用户请求“评估代理性能”、“构建测试框架”、“测量代理质量”或提到 LLM-as-judge、多维评估、代理测试或代理管道的质量门时,可以使用此技能。它帮助用户创建评估标准,确保代理在不同维度上的表现符合预期。