一键安装此插件:
42plugin install applied-artificial-intelligence/claude-code-toolkit/llm-evaluation42plugin install applied-artificial-intelligence/claude-code-toolkit/llm-evaluation插件介绍
提供全面的LLM评估和测试工具。 LLM评估和测试模式,包括提示测试、幻觉检测、基准创建和质量指标。在测试LLM应用程序、验证提示质量、实施系统评估或测量LLM性能时使用。
从属套包
applied-artificial-intelligence/kit/claude-code-toolkit
插件信息
插件评分
活水指数
4.6
文档清晰
高
内容质量
高
示例丰富
高
规范程度
中
可信程度
高