42plugin
活水插件增强你的 AI
插件套包探索
42plugin活水插件|增强你的AI

© 2026 42plugin.com. All rights reserved.

    ⚡

    大模型评估套件

    ⚡Skill
    科学研究AI工具博士生博士后教授
    测试AI助手元能力

    一键安装此插件:

    42plugin install ovachiever/droid-tings/lm-evaluation-harness42plugin install ovachiever/droid-tings/lm-evaluation-harness

    插件介绍

    在60多个学术基准(如MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag)上评估大语言模型。适用于模型质量基准测试、模型比较、学术结果报告或训练进度跟踪。EleutherAI、HuggingFace及主要实验室采用的行业标准,支持HuggingFace、vLLM和API。

    从属套包

    ovachiever/kit/droid-tings

    插件信息

    名称lm-evaluation-harness
    作者
    ovachiever
    类型
    ⚡Skill
    许可证MIT
    来源GitHub
    发布时间2026年1月14日
    更新时间2026年2月6日

    插件评分

    活水指数
    4.6
    文档清晰
    中
    内容质量
    高
    示例丰富
    高
    规范程度
    高
    可信程度
    高