多模态大模型最新王者 Qwen3-VL

官网

Qwen3-VL 模型种类

本地 24G 显存可以部署的最优模型是 Qwen3-VL-8B-Thinking。

由于安装相对麻烦，故制作了一键整合包，关注本公众号，回复 qwen3vl 获取。安装包仅提供了软件代码和环境依赖，模型文件可以自行去如下提供的 modelscope 地址下载。所以如果是24G显存，可以下载 8B 模型，如果显存不足，可以尝试 4B 模型。

shell

conda create -n qwen3_vl_env python=3.12 -y
conda activate qwen3_vl_env
git clone https://github.com/QwenLM/Qwen3-VL.git
cd Qwen3-VL

修改 requirements_web_demo.txt 文件如下（否则会有兼容性问题）：

shell

gradio==5.46.1
gradio_client==1.13.1
transformers-stream-generator==0.0.5
transformers==4.57.0
accelerate

继续安装依赖

shell

pip install -r requirements_web_demo.txt
pip uninstall torch
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu126

在项目根目录 Qwen3-VL 下新建文件夹 model，用于存储模型文件。从这里下载全部文件到 model 文件夹中。

shell

python web_demo_mm.py -c model/ --backend hf

核心启动参数如下：

启动之后，打开 UI 界面，上传文件，输入文本，发送即可

文章的最后，如果您觉得本文对您有用，请打赏一杯咖啡！感谢！