一键安装此插件:
42plugin install applied-artificial-intelligence/claude-code-toolkit/llm-evaluation42plugin install applied-artificial-intelligence/claude-code-toolkit/llm-evaluationLLM评估助手支持提示测试、幻觉检测、基准创建和质量指标等功能。适用于测试LLM应用程序、验证提示质量以及实施系统评估,帮助用户全面测量LLM性能。