一键安装此插件:
42plugin install muratcankoylan/agent-skills-for-context-engineering/advanced-evaluation42plugin install muratcankoylan/agent-skills-for-context-engineering/advanced-evaluation插件介绍
用于实现 LLM 作为评审、比较模型输出和创建评估标准的插件。 该技能适用于用户请求“实现 LLM 作为评审”、“比较模型输出”、“创建评估标准”、“减轻评估偏差”,或提到直接评分、成对比较、位置偏差、评估流程或自动化质量评估的场景。通过使用此插件,用户可以更有效地进行模型评估和比较。