返回博客列表活水发布精选42eval 技能评估套件上线:用数据代替直觉,衡量你的 AI 技能值不值得用技能越来越多,但哪个真的有用?42eval 用断言测试 + 盲测对比,量化每个技能的实际贡献。42plugin CLI 0.3.9 起内置,一条命令开启。活水AI实验室2026年3月13日13 分钟发布公告技能评估CLI质量工程