Skip to content

安装大模型最新王者 Qwen3

2025年4月29日,阿里推出了 Qwen3 模型,包含8个模型,覆盖各种 GPU 要求。

  1. 两个 MoE 模型:Qwen3-235B-A22BQwen3-30B-A3B
  2. 六个 Dense 模型:Qwen3-32BQwen3-14BQwen3-8BQwen3-4BQwen3-1.7BQwen3-0.6B

其中 Qwen3-235B-A22B 是最优模型,各项评分超过 DeepSeek-R1Qwen32BOpenAI-o1,与 Gemini-2.5-Pro 的比较中,各有优势,官方比较指标如下:

img.png

Qwen3-30B-A3B 相较于上一代的 Qwen32B,也更胜一筹。

img_1.png

综合官方的比较,发现 Qwen3 的8个模型的从优到劣分别是:Qwen3-235B-A22B > Qwen3-32B > Qwen3-30B-A3B > ...,本地24G显存可以部署 Qwen3-32BQwen3-30B-A3B 的量化版。

核心亮点

增强的 Agent 能力

优化了 Qwen3 模型的 Agent 和代码能力,同时也加强了对 MCP 的支持。

多种思考模式

Qwen3 模型支持两种思考模式:

  • 思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。
  • 非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。

这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度。例如,复杂的问题可以通过扩展推理步骤来解决,而简单的问题则可以直接快速作答,无需延迟。至关重要的是,这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。

多语言

Qwen3 模型支持 119 种语言和方言。这一广泛的多语言能力为国际应用开辟了新的可能性,让全球用户都能受益于这些模型的强大功能。

模型下载

通过 ollama 进行安装,确保先安装过 ollama,若无,先看 安装大模型本地运行利器 ollama。如果已经安装过 ollama,需要将 ollama 更新到 0.6.6 版本及以上。

此处 选择一个适合自己显存的模型进行下载,24G 显存可下载 Qwen3-32BQwen3-30B-A3B 的 Q4_K_M 模型。下载的过程中,如果发现突然变慢,可以 ctrl+c 终止下载流程,之后继续使用如下命令进行下载(会接着之前的进度)

复制命令,在 cmd 中执行,即可下载并运行模型

shell
# ollama run qwen3:32b
ollama run qwen3:30b-a3b

如果模型没有下载过,则会先下载模型,再运行。

终端中使用

shell
C:\Users\Administrator>ollama run qwen3:30b-a3b
>>> 0.8和0.11谁大
<think>
嗯,用户问的是0.8和0.11哪个大。这个问题看起来挺简单的,但可能需要仔细分析一下。首先,我得确认用户是不是在问小数的大
小比较。不过,也有可能用户对小数点后的位数有误解,或者有不同的表达方式?

...

所以最终结论是0.8比0.11大。
</think>

0.8 0.11 的大小比较可以通过以下步骤分析:

1. **直接比较小数位数**
   - 0.8 是一位小数,可视为 **0.80**(补零不影响数值)。
   - 0.11 是两位小数。
   - 从左到右逐位比较:
     - 第一位小数:**8**(0.80) vs **1**(0.11),显然 **8 > 1**,因此 **0.8 > 0.11**

2. **分数转换法**
   - 0.8 = **8/10 = 4/5**
   - 0.11 = **11/100**
   - 通分后比较:
     - 8/10 = **80/100**
     - 11/100 = **11/100**
     - 显然 **80/100 > 11/100**,因此 **0.8 > 0.11**

3. **直观举例**
   - 若将 1 元视为 1,0.8 = **8**,0.11 = **1 1**
   - 显然 **8 > 1 1**

**结论**
**0.8 比 0.11 大**

默认情况下该模型开启的是思考模式,我们可以通过输入 hi /nothink 关闭思考模式,也可以通过 hi /nothink 0.8与0.11谁大 关闭思考模式,可以通过 hi /think 开启思考模式,如下:

shell
>>> hi /nothink
<think>

</think>

Hello! How can I assist you today? 😊

此时就关闭了思考模式,我们再测试一下:

shell
>>>  0.8与0.11谁大
<think>

</think>

0.8 0.11 大。

**原因**
- 0.8 可以看作 0.80,而 0.11 0.11。
- 比较小数时,从左到右逐位比较:
  - 第一位小数:8(0.80) > 1(0.11),所以 **0.8 > 0.11**

此时关闭了思考模式。

目前在终端中就可以使用 Qwen3-32BQwen3-30B-A3B 模型了,但是终端的界面不太友好,接下来通过 PageAssist 图形化界面进行使用,关于 PageAssist 的安装和使用见 安装大模型 UI 浏览器插件 PageAssist。也可以使用 OpenWebUI 图形界面使用,关于 OpenWebUI 的安装和使用见 安装大模型 UI 界面 OpenWebUI

文章的最后,如果您觉得本文对您有用,请打赏一杯咖啡!感谢!