模型服务与部署助手

一键安装此插件:

42plugin install ancoleman/ai-design-components/model-serving

插件介绍

用于推理的 LLM 和 ML 模型部署。在生产环境中提供模型、构建 AI API 或优化推理时使用。涵盖 vLLM(LLM 服务)、TensorRT-LLM(GPU 优化)、Ollama(本地)、BentoML(ML 部署)、Triton(多模型)、LangChain(编排)、LlamaIndex(RAG)等。

从属套包

ancoleman/kit/ai-design-components

插件信息

作者
类型
许可证MIT
来源GitHub

插件评分

总分
4.5
文档清晰
内容质量
示例丰富
规范程度
可信程度