llama.cpp

llama.cpp. 国内直接从官网 https://github.com/ggml-org/llama.cpp/ 下载比较困难，需要一些技术手段。这里提供一个国内的镜像下载地址列表，方便网友下载。

llama.cpp 是一个面向本地大模型推理的 C/C++ 运行时项目，强调高可移植性、量化支持和在多种硬件上的本地部署能力。围绕它的发布资产通常包含命令行程序、示例工具和不同平台的构建产物，体积也经常较大。为 llama.cpp 提供镜像页面后，开发者获取本地推理工具链会更稳定。