Skip to content

最强文生图提示语增强器 Hunyuan-PromptEnhancer

功能介绍

PromptEnhancer 是一个通过思维链模式来进行文生图提示语的重写工具,可以在保留原始提示语意图的情况下对其进行重构,从而生成更清晰、层次分明、逻辑一致的提示语,以便生成更好的图像。

具有如下特性:

  1. 保留关键元素(主题/动作/数量/样式/布局/关系/属性/文本等)的意图
  2. 鼓励“总体-细节-总结”叙述,首先描述主要元素,然后描述次要/背景元素,最后以简洁的风格/类型总结结束
  3. 可配置推理参数(temperature、top_p、max_new_tokens)用于平衡确定性和多样性。

增强示例

原始的提示语:

text
一个时尚的女生,穿着紧身牛仔裤

增强后的提示语:

text
一名身材高挑、姿态自信的时尚年轻女性,站在一个现代简约风格的室内空间中央。她留着一头及肩的深棕色波浪长发,妆容精致,强调眼部轮廓和自然的唇色。她上身穿着一件白色的短款露脐T恤,材质为纯棉,剪裁合身。下身是一条浅蓝色的高腰紧身牛仔裤,采用紧身剪裁,勾勒出腿部线条,裤脚略微卷起,露出脚踝。她的脚上穿着一双白色的厚底运动鞋。在她身后是一面纯灰色的背景墙,墙面平整光滑。光线从画面的左侧柔和地照射过来,在她的身体右侧形成自然的阴影,凸显了服装的质感和人物的轮廓。这张图片采用了商业时尚摄影的风格。

可以看到增强效果非常好。

安装软件

为了简化使用,制作了一键整合包,关注本公众号,回复 prompt 获取。

shell
git clone https://github.com/Hunyuan-PromptEnhancer/PromptEnhancer.git
cd PromptEnhancer

conda create -n prompt_enhancer_env python=3.12 -y
conda activate prompt_enhancer_env

pip install -r requirements.txt
pip uninstall torch
pip install torch --index-url https://download.pytorch.org/whl/cu126

pip install tiktoken

下载模型

https://huggingface.co/tencent/HunyuanImage-2.1/tree/main/reprompt 下的所有文件下载后,放置到 models/promptenhancer-7b 文件夹下。

7b 模型实际需要 20G 显存。

开始使用

在项目根目录下新建 use_prompt_enhancer.py 文件,内容如下:

shell
from inference.prompt_enhancer import HunyuanPromptEnhancer

models_root_path = "./models/promptenhancer-7b"

enhancer = HunyuanPromptEnhancer(models_root_path=models_root_path, device_map="auto")

# Enhance a prompt (Chinese or English)
user_prompt = "一个时尚的女生,穿着紧身牛仔裤"
new_prompt = enhancer.predict(
    prompt_cot=user_prompt,
    # Default system prompt is tailored for image prompt rewriting; override if needed
    temperature=0.7,   # >0 enables sampling; 0 uses deterministic generation
    top_p=0.9,
    max_new_tokens=256,
)

print("Enhanced:", new_prompt)

参数说明

  • models_root_path:模型路径
  • device_map:默认 auto
  • predict(...)
    • prompt_cot(str): 要重写的输入提示语
    • temperature(浮点数):越大思维越发散;越小越趋向于确定性
    • top_p(浮点数)
    • max_new_tokens(int):要生成的新 token 的最大数量。

运行 use_prompt_enhancer.py 文件即可。

文章的最后,如果您觉得本文对您有用,请打赏一杯咖啡!感谢!