【2026最新】Ollama下载、安装和使用一篇搞定(附官网安装包)

Ollama安装包下载地址:Ollama安装包(官网正版)

Ollama 是一款免费的本地大语言模型运行工具,它的核心功能是让你在个人电脑上轻松下载、运行和管理各种开源 AI 大模型,比如 Llama、Mistral、Gemma、Qwen 等。不需要联网,不需要租云服务器,只要你的电脑有合适的配置,Ollama 就能把强大的 AI 模型带到你的本地环境中运行。

同领域的本地 AI 运行工具各有特点,简单对比一下:

软件 是否免费 主要特点 适合人群
Ollama 免费、开源 一键运行、模型管理方便、跨平台 绝大多数本地 AI 用户首选
LM Studio 免费 图形化界面、内置模型搜索 更喜欢 GUI 操作的用户
llama.cpp 免费、开源 底层运行时、性能最优化 开发者、深度定制用户
GPT4All 免费、开源 安装简单、自带聊天界面 新手入门、教育场景

Ollama 最大的优势在于把复杂的模型部署过程简化到了极致。以前要跑一个大模型,需要配置 Python 环境、安装 PyTorch、下载模型文件、写推理代码……一套流程下来能劝退绝大多数人。Ollama 直接把这一切打包成一条命令,安装后打开终端,输入一行命令就能下载并启动模型,几分钟内就能开始对话。

截止到发文,Ollama 的最新稳定版是 Ollama 0.30.7,新增了多模态模型支持、并发请求处理能力,优化了内存占用和推理速度,支持 Windows、macOS 和 Linux 三大平台。

Ollama下载

Ollama安装包下载地址:Ollama安装包(官网正版)

软件完全免费开源,没有任何使用限制。下载时需要注意,Ollama 提供了针对不同操作系统的安装包。Windows 用户下载 .exe 安装程序,macOS 用户下载 .dmg 安装包,Linux 用户执行如下命令安装 Ollama:

curl -fsSL https://ollama.com/install.sh | sh

Ollama安装

Ollama的安装过程非常简单,基本上就是标准的软件安装流程。

1)我使用的是 Windows 系统,下载 .exe 格式的可执行文件。双击这个文件启动安装程序:


2)直接点击 Install,开始安装:


3)安装完成后,点击"Cancel"按钮退出安装程序,Ollama 会自动启动:

修改Ollama模型存储路径

非 Windows 平台用户可以跳过这一步。

Ollama 默认将模型存储到 C 盘(通常为 C:\Users\Administrator\.ollama\models),这对 C 盘可用容量有限的小伙伴非常不友好,我们可以手动将其修改为其它非系统盘。

修改的方法很简单,进入“Settings”界面,参照下图完成修改:

Ollama下载模型

Ollama 主要通过命令行界面进行操作。打开终端(Windows 用户可以使用 PowerShell 或 CMD),就可以开始使用 Ollama 了。

访问 Ollama 官网模型库:https://ollama.com/library,找到你想使用的 AI 模型,比如 deepseek:


点击 deepseek-r1,进入下图的页面,就能看到运行它的命令,是不是很简单:


这里以 qwen2.5 模型为例,在 CMD 窗口执行如下命令:
ollama run qwen2.5

耐心等待模型下载完,下载过程可能需要一些时间,具体取决于模型大小和网络速度。7B 模型大约需要 4GB 存储空间,13B 模型需要 8GB,70B 模型则需要 40GB 以上:


一切准备就绪后,就可以和 AI 模型聊天了:


Ollama 模型库里的不同模型各有侧重,下面这张表可以帮助你快速找到最适合自己的那一款:

模型名称 大小 优势 推荐场景
llama3.1(8B) 4.7GB Meta 旗舰系列,通用能力均衡,中英文对话质量高,生态最完善 ⭐ 首选推荐,日常对话、写作、翻译、脑暴都适合
qwen:7b 4.3GB 阿里通义千问系列,中文理解和生成能力出色,符合国内用户表达习惯 ⭐ 中文用户首选,写中文文案、处理中文文档、中文问答
mistral(7B) 4.1GB Mistral AI 出品,推理速度快,在同参数量级模型中表现优异 追求响应速度、英文任务为主的场景
gemma:2b 1.4GB Google 出品,体积小巧,集成显卡或无独显的电脑也能流畅运行 低配置电脑、入门体验、简单问答
codellama(7B) 3.8GB Meta 出品,基于 Llama 2 微调,专注代码生成、补全和调试 程序员写代码、Debug、学习编程
deepseek-r1:7b 4.5GB 深度求索出品,推理能力强,在数学和逻辑类任务上表现突出 数学解题、逻辑推理、编程算法

Ollama常用管理操作

除了下载和运行模型,Ollama 还有几个日常管理命令值得掌握。

1)查看本地模型

查看本地已下载了哪些模型,执行的命令:
ollama list
它会列出所有模型名称、大小和修改时间,一目了然。

2)删除本地模型

如果想删除不再需要的模型释放磁盘空间,执行的命令:
ollama rm 模型名
比如 ollama rm gemma:2b 就能删掉对应的模型文件。

3)停用正在运行的模型

如果你在对话中想退出当前模型,输入 /bye 即可。如果想从终端外部停用某个后台运行的模型,执行的命令是:
ollama stop 模型名
比如 ollama stop llama3.1 就能把对应的模型进程停掉,释放内存和显存资源。

4)更新本地模型

更新已下载的模型用的命令是:
ollama pull 模型名
如果模型有新版发布,Ollama 也会自动下载增量更新。

Ollama常见使用问题

1)下载模型时发现速度非常慢,甚至经常中断

这是因为模型文件托管在海外服务器上,国内下载速度确实不太理想。

下载中途中断了也不要紧,Ollama 支持断点续传,如果中途断了重新执行下载命令会从断点继续,不需要重新开始。

2)运行模型时提示内存不足或推理速度很慢

通常是电脑配置跟不上模型要求的缘故。大模型对内存和显存要求比较高,7B 参数的模型建议至少 8GB 内存,13B 的模型建议 16GB 以上。

如果你电脑配置偏低,可以换成更小的模型,比如 gemma:2b 只需要 2GB 左右的内存就能流畅运行。另外,关闭其他正在运行的程序释放内存,也能有效改善推理速度。

3)在终端里输入中文问题后显示乱码

因为 Windows 终端默认编码的问题。在 CMD 中输入 chcp 65001 切换为 UTF-8 编码后再启动 Ollama,中文就能正常显示了。

总结

Ollama 是目前在个人电脑上运行 AI 大模型最简单的方式,没有之一。从 Ollama 下载安装到跑起第一个模型,整个过程不会超过十分钟。

Ollama 把原本需要大量技术储备才能完成的事情,简化成了几条命令就能搞定。无论你是 AI 爱好者、开发者,还是只想在本地安全地使用 AI 工具,Ollama 都值得一试。先从 Llama 3.1 或 Qwen 入手体验一下,你会发现在本地跑 AI 模型其实没想象中那么复杂。