PuLID:逼真的 ID 定制化(换脸)工具
功能介绍
上传一张参考图片图片,编写提示语,调整参数(如果有必要的话),点击生成,即可结合参考图中的脸部特征和提示语来生成图片。如下图所示:
注意两个关键参数:
- timestep to start inserting ID:值越小,脸部越像,生成图像的想象力会被约束的越厉害;值越大,脸部越不像,生成的图像的想象力越放飞。官方推荐写实场景,使用4; 非写实场景,使用0-1。
- true CFG scale:绝大多数情况,使用1,仅调整 Guidance 参数就行,Guidance 默认是4;在非写实场景下,如果发现生成图片的面部不像参考图或者风格不遵循提示语的意思,则可调整 true CFG scale=5 & Guidance=1 进行尝试
一键整合包
下载地址:百度网盘 安装方式:下载后,选择文件夹中的所有文件(约37G),右键选择“7-Zip” => “Extract Here”,解压完成后,双击压缩包中的 “启动.bat” 文件即可启动程序。如果想要自行进行安装,继续查看“安装应用”小节。
安装应用
系统要求:至少 12G 显存。 下面以 Windows11 为例,演示安装流程,需要前置安装好 Git/Miniconda/VisualStudio/FFmpeg,具体参考 “环境搭建” 部分。之后在 cmd 中依次输入以下命令
shell
cd D:\ai\package // 选择软件安装的目标目录
git clone https://github.com/ToTheBeginning/PuLID.git // 下载源码
cd PuLID // 进入源码目录
conda create -n pulid python=3.10 -y // 创建虚拟环境
conda activate pulid // 激活虚拟环境
pip install -r requirements_fp8.txt // 安装项目依赖
pip install torchsde // 启动时报错缺失模块 torchsde,则进行安装
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install gradio==3.50.2 // 启动时报错 PydanticSchemaGenerationError,需要降级 https://blog.csdn.net/blink182007/article/details/142165489
模型下载
由于 ae.safetensors 的下载需要登录授权,故需要手动下载,之后放置到主目录的 models 文件夹下。 其余模型会在服务启动的时候自动下载。
启动应用
PuLID 的启动方式根据显存大小有四种组合。下面仅介绍消费级显卡可用的启动方式: 在 cmd 中输入以下命令
shell
python app_flux.py --offload --fp8 // 24G显存使用该命令
python app_flux.py --offload --fp8 --onnx_provider cpu // 16G显存使用该命令
python app_flux.py --aggressive_offload --fp8 --onnx_provider cpu // 12G显存使用该命令,速度很慢
在 cmd 中看到如下日志,表示成功(首次启动会从 HuggingFace 上拉取模型)
shell
Running on local URL: http://127.0.0.1:8080
此时浏览器输入 http://127.0.0.1:8080,展示界面如下
文章的最后,如果您觉得本文对您有用,请打赏一杯咖啡!感谢!
