llama.cpp
llama.cpp. 国内直接从官网 https://github.com/ggml-org/llama.cpp/ 下载比较困难,需要一些技术手段。这里提供一个国内的镜像下载地址列表,方便网友下载。
llama.cpp 是一个面向本地大模型推理的 C/C++ 运行时项目,强调高可移植性、量化支持和在多种硬件上的本地部署能力。 围绕它的发布资产通常包含命令行程序、示例工具和不同平台的构建产物,体积也经常较大。 为 llama.cpp 提供镜像页面后,开发者获取本地推理工具链会更稳定。