⚡

CPU推理引擎

Name: CPU推理引擎
Rating: 4.5
Author: ovachiever

一键安装此插件：

42plugin install ovachiever/droid-tings/llama-cpp42plugin install ovachiever/droid-tings/llama-cpp

插件介绍

在CPU、Apple Silicon及消费级GPU上运行LLM推理，无需NVIDIA硬件。适用于边缘部署、M1/M2/M3 Mac、AMD/Intel GPU或CUDA不可用场景，支持GGUF量化（1.5-8位），相比CPU版PyTorch可减少内存占用并提速4-10倍。

CPU推理引擎 - ovachiever的技能 | 活水插件 | 活水插件