一键安装此插件:

42plugin install applied-artificial-intelligence/claude-code-toolkit/llm-evaluation

插件介绍

提供全面的LLM评估和测试工具。 LLM评估和测试模式,包括提示测试、幻觉检测、基准创建和质量指标。在测试LLM应用程序、验证提示质量、实施系统评估或测量LLM性能时使用。

从属套包

applied-artificial-intelligence/kit/claude-code-toolkit

插件信息

类型
许可证MIT
来源GitHub
发布时间2025年12月21日
更新时间2026年1月24日

插件评分

活水指数
4.6
文档清晰
内容质量
示例丰富
规范程度
可信程度