一键安装此插件:

42plugin install muratcankoylan/agent-skills-for-context-engineering/evaluation

插件介绍

该插件用于评估代理性能、构建测试框架和测量代理质量。 当用户请求“评估代理性能”、“构建测试框架”、“测量代理质量”或提到 LLM-as-judge、多维评估、代理测试或代理管道的质量门时,可以使用此技能。它帮助用户创建评估标准,确保代理在不同维度上的表现符合预期。

从属套包

muratcankoylan/kit/agent-skills-for-context-engineering

插件信息

类型
来源GitHub
发布时间2026年1月10日
更新时间2026年1月10日

插件评分

活水指数
4.2
文档清晰
内容质量
示例丰富
规范程度
可信程度