Ollama

zhuonixian2026/5/29大约 1 分钟

Ollama

本地大语言模型运行工具，让开发者在个人设备上轻松部署和运行开源 LLM。

简介

Ollama 是一个开源的本地 LLM 运行框架，以极简的命令行界面让用户在 macOS、Linux 和 Windows 上运行各种开源大语言模型。它自动处理模型下载、GPU 加速和量化，大幅降低了本地部署的门槛。

支持的模型

Ollama 支持丰富的开源模型家族：

LLaMA 系列：Meta 的 LLaMA 2/3/3.1/4 全系列
Mistral：Mistral AI 的 Mistral 和 Mixtral 系列
Gemma：Google 的 Gemma 系列开源模型
Qwen：阿里的通义千问系列
DeepSeek：深度求索系列
Phi：Microsoft 的小参数高性能模型

通过 Modelfile 机制，用户可以导入任何 GGUF 格式的模型。

使用方式

# 安装后即可使用
ollama run llama3.1    # 下载并运行模型
ollama list             # 列出已安装模型
ollama pull mistral     # 下载模型
ollama create mymodel -f Modelfile  # 自定义模型

API 接口

Ollama 提供兼容 OpenAI API 格式的 REST 接口（默认端口 11434），可直接替换 OpenAI API 端点，便于本地开发和测试：

curl http://localhost:11434/api/chat -d '{
  "model": "llama3.1",
  "messages": [{"role": "user", "content": "Hello"}]
}'

在隐私场景中的价值

数据不离开本地设备，满足隐私合规要求
适合处理敏感代码和文档
离线环境下的 AI 能力保障
降低 API 调用成本，适合微调实验和原型开发

Ollama

Ollama

简介

支持的模型

使用方式

API 接口

在隐私场景中的价值

相关页面