最强文生图提示语增强器 Hunyuan-PromptEnhancer
功能介绍
PromptEnhancer 是一个通过思维链模式来进行文生图提示语的重写工具,可以在保留原始提示语意图的情况下对其进行重构,从而生成更清晰、层次分明、逻辑一致的提示语,以便生成更好的图像。
具有如下特性:
- 保留关键元素(主题/动作/数量/样式/布局/关系/属性/文本等)的意图
- 鼓励“总体-细节-总结”叙述,首先描述主要元素,然后描述次要/背景元素,最后以简洁的风格/类型总结结束
- 可配置推理参数(temperature、top_p、max_new_tokens)用于平衡确定性和多样性。
增强示例
原始的提示语:
text
一个时尚的女生,穿着紧身牛仔裤增强后的提示语:
text
一名身材高挑、姿态自信的时尚年轻女性,站在一个现代简约风格的室内空间中央。她留着一头及肩的深棕色波浪长发,妆容精致,强调眼部轮廓和自然的唇色。她上身穿着一件白色的短款露脐T恤,材质为纯棉,剪裁合身。下身是一条浅蓝色的高腰紧身牛仔裤,采用紧身剪裁,勾勒出腿部线条,裤脚略微卷起,露出脚踝。她的脚上穿着一双白色的厚底运动鞋。在她身后是一面纯灰色的背景墙,墙面平整光滑。光线从画面的左侧柔和地照射过来,在她的身体右侧形成自然的阴影,凸显了服装的质感和人物的轮廓。这张图片采用了商业时尚摄影的风格。可以看到增强效果非常好。
安装软件
为了简化使用,制作了一键整合包,关注本公众号,回复 prompt 获取。
shell
git clone https://github.com/Hunyuan-PromptEnhancer/PromptEnhancer.git
cd PromptEnhancer
conda create -n prompt_enhancer_env python=3.12 -y
conda activate prompt_enhancer_env
pip install -r requirements.txt
pip uninstall torch
pip install torch --index-url https://download.pytorch.org/whl/cu126
pip install tiktoken下载模型
将 https://huggingface.co/tencent/HunyuanImage-2.1/tree/main/reprompt 下的所有文件下载后,放置到 models/promptenhancer-7b 文件夹下。
7b 模型实际需要 20G 显存。
开始使用
在项目根目录下新建 use_prompt_enhancer.py 文件,内容如下:
shell
from inference.prompt_enhancer import HunyuanPromptEnhancer
models_root_path = "./models/promptenhancer-7b"
enhancer = HunyuanPromptEnhancer(models_root_path=models_root_path, device_map="auto")
# Enhance a prompt (Chinese or English)
user_prompt = "一个时尚的女生,穿着紧身牛仔裤"
new_prompt = enhancer.predict(
prompt_cot=user_prompt,
# Default system prompt is tailored for image prompt rewriting; override if needed
temperature=0.7, # >0 enables sampling; 0 uses deterministic generation
top_p=0.9,
max_new_tokens=256,
)
print("Enhanced:", new_prompt)参数说明
models_root_path:模型路径device_map:默认autopredict(...):prompt_cot(str): 要重写的输入提示语temperature(浮点数):越大思维越发散;越小越趋向于确定性top_p(浮点数)max_new_tokens(int):要生成的新 token 的最大数量。
运行 use_prompt_enhancer.py 文件即可。
文章的最后,如果您觉得本文对您有用,请打赏一杯咖啡!感谢!
