安装大模型最新王者 Qwen3
2025年4月29日,阿里推出了 Qwen3 模型,包含8个模型,覆盖各种 GPU 要求。
- 两个 MoE 模型:
Qwen3-235B-A22B
和Qwen3-30B-A3B
- 六个 Dense 模型:
Qwen3-32B
、Qwen3-14B
、Qwen3-8B
、Qwen3-4B
、Qwen3-1.7B
和Qwen3-0.6B
其中 Qwen3-235B-A22B
是最优模型,各项评分超过 DeepSeek-R1
、Qwen32B
和 OpenAI-o1
,与 Gemini-2.5-Pro
的比较中,各有优势,官方比较指标如下:
Qwen3-30B-A3B
相较于上一代的 Qwen32B
,也更胜一筹。
综合官方的比较,发现 Qwen3 的8个模型的从优到劣分别是:Qwen3-235B-A22B
> Qwen3-32B
> Qwen3-30B-A3B
> ...,本地24G显存可以部署 Qwen3-32B
和 Qwen3-30B-A3B
的量化版。
核心亮点
增强的 Agent 能力
优化了 Qwen3 模型的 Agent 和代码能力,同时也加强了对 MCP 的支持。
多种思考模式
Qwen3 模型支持两种思考模式:
- 思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。
- 非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。
这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度。例如,复杂的问题可以通过扩展推理步骤来解决,而简单的问题则可以直接快速作答,无需延迟。至关重要的是,这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。
多语言
Qwen3 模型支持 119 种语言和方言。这一广泛的多语言能力为国际应用开辟了新的可能性,让全球用户都能受益于这些模型的强大功能。
模型下载
通过 ollama 进行安装,确保先安装过 ollama,若无,先看 安装大模型本地运行利器 ollama。如果已经安装过 ollama,需要将 ollama 更新到 0.6.6 版本及以上。
在 此处 选择一个适合自己显存的模型进行下载,24G 显存可下载 Qwen3-32B
和 Qwen3-30B-A3B
的 Q4_K_M 模型。下载的过程中,如果发现突然变慢,可以 ctrl+c 终止下载流程,之后继续使用如下命令进行下载(会接着之前的进度)
复制命令,在 cmd 中执行,即可下载并运行模型
# ollama run qwen3:32b
ollama run qwen3:30b-a3b
如果模型没有下载过,则会先下载模型,再运行。
终端中使用
C:\Users\Administrator>ollama run qwen3:30b-a3b
>>> 0.8和0.11谁大
<think>
嗯,用户问的是0.8和0.11哪个大。这个问题看起来挺简单的,但可能需要仔细分析一下。首先,我得确认用户是不是在问小数的大
小比较。不过,也有可能用户对小数点后的位数有误解,或者有不同的表达方式?
...
所以最终结论是0.8比0.11大。
</think>
0.8 和 0.11 的大小比较可以通过以下步骤分析:
1. **直接比较小数位数**:
- 0.8 是一位小数,可视为 **0.80**(补零不影响数值)。
- 0.11 是两位小数。
- 从左到右逐位比较:
- 第一位小数:**8**(0.80) vs **1**(0.11),显然 **8 > 1**,因此 **0.8 > 0.11**。
2. **分数转换法**:
- 0.8 = **8/10 = 4/5**
- 0.11 = **11/100**
- 通分后比较:
- 8/10 = **80/100**
- 11/100 = **11/100**
- 显然 **80/100 > 11/100**,因此 **0.8 > 0.11**。
3. **直观举例**:
- 若将 1 元视为 1,0.8 元 = **8 角**,0.11 元 = **1 角 1 分**。
- 显然 **8 角 > 1 角 1 分**。
**结论**:
**0.8 比 0.11 大**。
默认情况下该模型开启的是思考模式,我们可以通过输入 hi /nothink
关闭思考模式,也可以通过 hi /nothink 0.8与0.11谁大
关闭思考模式,可以通过 hi /think
开启思考模式,如下:
>>> hi /nothink
<think>
</think>
Hello! How can I assist you today? 😊
此时就关闭了思考模式,我们再测试一下:
>>> 0.8与0.11谁大
<think>
</think>
0.8 比 0.11 大。
**原因**:
- 0.8 可以看作 0.80,而 0.11 是 0.11。
- 比较小数时,从左到右逐位比较:
- 第一位小数:8(0.80) > 1(0.11),所以 **0.8 > 0.11**。
此时关闭了思考模式。
目前在终端中就可以使用 Qwen3-32B
和 Qwen3-30B-A3B
模型了,但是终端的界面不太友好,接下来通过 PageAssist 图形化界面进行使用,关于 PageAssist 的安装和使用见 安装大模型 UI 浏览器插件 PageAssist。也可以使用 OpenWebUI 图形界面使用,关于 OpenWebUI 的安装和使用见 安装大模型 UI 界面 OpenWebUI
文章的最后,如果您觉得本文对您有用,请打赏一杯咖啡!感谢!
