安装大模型最新王者 Qwen3

官网

https://qwenlm.github.io/zh/blog/qwen3/

Qwen3 模型发展历程

第一阶段

2025年4月29日，阿里推出了 Qwen3 模型，包含8个模型，覆盖各种 GPU 要求。

两个 MoE 模型：Qwen3-235B-A22B 和 Qwen3-30B-A3B
六个 Dense 模型：Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B

其中 Qwen3-235B-A22B 是最优模型，各项评分超过 DeepSeek-R1、Qwen32B 和 OpenAI-o1，与 Gemini-2.5-Pro 的比较中，各有优势，官方比较指标如下：

Qwen3-30B-A3B 相较于上一代的 Qwen32B，也更胜一筹。

综合官方的比较，发现 Qwen3 的8个模型的从优到劣分别是：Qwen3-235B-A22B > Qwen3-32B > Qwen3-30B-A3B > ...，本地24G显存可以部署 Qwen3-32B 和 Qwen3-30B-A3B 的量化版。

第二阶段

2025年7月21日到8月8日，阿里推出了 Qwen3 的升级模型，核心包含6个模型。

Qwen3-235B-A22B-Instruct-2507 和 Qwen3-235B-A22B-Thinking-2507，是针对上一代旗舰模型 Qwen3-235B-A22B 的升级，前者是非思考模式，后者是思考模式模型。是新的旗舰模型。
Qwen3-30B-A3B-Instruct-2507 和 Qwen3-30B-A3B-Thinking-2507，是针对 Qwen3-30B-A3B 的升级，前者是非思考模式，后者是思考模式模型。
Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507，是针对 Qwen3-4B 的升级，前者是非思考模式，后者是思考模式模型。

其中 Qwen3-235B-A22B-Instruct-2507 与其他开闭源模型的性能对比如下，可以说是遥遥领先。

Qwen3-30B-A3B-Thinking-2507 的性能评测图如下，在大部分场景超过了上一代的 Qwen3-235B-A22B 模型的思考模式。

Qwen3-30B-A3B-Instruct-2507 的性能评测图如下，全面大幅度超过了上一代的 Qwen3-235B-A22B 模型非思考模式。

本地24G显存最高可以部署 Qwen3-30B-A3B-Instruct-2507 和 Qwen3-30B-A3B-Thinking-2507 的量化版本。

第三阶段

2025年9月5日，阿里推出了当前系列的最强模型 Qwen3-Max-Preview，估计很快就会推出 Qwen3-Max 正式版，该模型具有1万亿参数，是同系列 Qwen3-235B-A22B 参数的四倍。官方测评如下，超过了 Qwen3-235B-A22B-Instruct-2507/Kimi K2/Claude Opus4/Deepseek-V3.1.

该模型当前可以在 https://chat.qwen.ai/ 免费使用。

核心亮点

增强的 Agent 能力

优化了 Qwen3 模型的 Agent 和代码能力，同时也加强了对 MCP 的支持。

多种思考模式

Qwen3 模型支持两种思考模式：

思考模式：在这种模式下，模型会逐步推理，经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。
非思考模式：在此模式中，模型提供快速、近乎即时的响应，适用于那些对速度要求高于深度的简单问题。

这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度。例如，复杂的问题可以通过扩展推理步骤来解决，而简单的问题则可以直接快速作答，无需延迟。至关重要的是，这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。

多语言

Qwen3 模型支持 119 种语言和方言。这一广泛的多语言能力为国际应用开辟了新的可能性，让全球用户都能受益于这些模型的强大功能。

模型下载

通过 ollama 进行安装，确保先安装过 ollama，若无，先看安装大模型本地运行利器 ollama。如果已经安装过 ollama，需要将 ollama 更新到 0.6.6 版本及以上。

在此处选择一个适合自己显存的模型进行下载，24G 显存可下载 Qwen3-32B 和 Qwen3-30B-A3B 的 Q4_K_M 模型。下载的过程中，如果发现突然变慢，可以 ctrl+c 终止下载流程，之后继续使用如下命令进行下载（会接着之前的进度）

复制命令，在 cmd 中执行，即可下载并运行模型

shell

# ollama run qwen3:32b
ollama run qwen3:30b-a3b

如果模型没有下载过，则会先下载模型，再运行。

终端中使用

shell

C:\Users\Administrator>ollama run qwen3:30b-a3b
>>> 0.8和0.11谁大
<think>
嗯，用户问的是0.8和0.11哪个大。这个问题看起来挺简单的，但可能需要仔细分析一下。首先，我得确认用户是不是在问小数的大
小比较。不过，也有可能用户对小数点后的位数有误解，或者有不同的表达方式？

...

所以最终结论是0.8比0.11大。
</think>

0.8 和 0.11 的大小比较可以通过以下步骤分析：

1. **直接比较小数位数**：
   - 0.8 是一位小数，可视为 **0.80**（补零不影响数值）。
   - 0.11 是两位小数。
   - 从左到右逐位比较：
     - 第一位小数：**8**（0.80） vs **1**（0.11），显然 **8 > 1**，因此 **0.8 > 0.11**。

2. **分数转换法**：
   - 0.8 = **8/10 = 4/5**
   - 0.11 = **11/100**
   - 通分后比较：
     - 8/10 = **80/100**
     - 11/100 = **11/100**
     - 显然 **80/100 > 11/100**，因此 **0.8 > 0.11**。

3. **直观举例**：
   - 若将 1 元视为 1，0.8 元 = **8 角**，0.11 元 = **1 角 1 分**。
   - 显然 **8 角 > 1 角 1 分**。

**结论**：
**0.8 比 0.11 大**。

默认情况下该模型开启的是思考模式，我们可以通过输入 hi /nothink 关闭思考模式，也可以通过 hi /nothink 0.8与0.11谁大 关闭思考模式，可以通过 hi /think 开启思考模式，如下：

shell

>>> hi /nothink
<think>

</think>

Hello! How can I assist you today? 😊

此时就关闭了思考模式，我们再测试一下：

shell

>>>  0.8与0.11谁大
<think>

</think>

0.8 比 0.11 大。

**原因**：
- 0.8 可以看作 0.80，而 0.11 是 0.11。
- 比较小数时，从左到右逐位比较：
  - 第一位小数：8（0.80） > 1（0.11），所以 **0.8 > 0.11**。

此时关闭了思考模式。

目前在终端中就可以使用 Qwen3-32B 和 Qwen3-30B-A3B 模型了，但是终端的界面不太友好，接下来通过 PageAssist 图形化界面进行使用，关于 PageAssist 的安装和使用见安装大模型 UI 浏览器插件 PageAssist。也可以使用 OpenWebUI 图形界面使用，关于 OpenWebUI 的安装和使用见安装大模型 UI 界面 OpenWebUI

文章的最后，如果您觉得本文对您有用，请打赏一杯咖啡！感谢！

安装大模型最新王者 Qwen3 ​

Qwen3 模型发展历程 ​

第一阶段 ​

第二阶段 ​

第三阶段 ​

核心亮点 ​

增强的 Agent 能力 ​

多种思考模式 ​

多语言 ​

模型下载 ​

终端中使用 ​

安装大模型最新王者 Qwen3

Qwen3 模型发展历程

第一阶段

第二阶段

第三阶段

核心亮点

增强的 Agent 能力

多种思考模式

多语言

模型下载

终端中使用