Skip to content

最顶级的开源的图片与视频高清放大软件 SeedVR2

效果展示

图片高清

前后对比图: img.png

原图: img.png

高清后的图: img.png

视频高清

原视频:

高清后的视频:

硬件要求

  • 最小显存(8G):使用 GGUF Q4_K_M 模型,并且开启 BlockSwap 和 VAE tiling;
  • 中等显存 (12-16GB): 使用 FP8 模型,并且开启 BlockSwap 或者 VAE tiling;
  • 高级显存 (24GB+): 使用 FP16 模型,可以获得更高的质量和推理速度

安装插件

使用插件管理器安装,安装 插件,重启应用。

安装模型

模型均会在首次使用时自动下载,也可以手动下载。

标准模型可以从 此处 下载;gguf 模型可以从 此处 下载。

核心介绍下标准模型:

  • (必须)ema_vae_fp16.safetensors
  • seedvr2_ema_3b_fp16.safetensors
  • seedvr2_ema_7b_fp16.safetensors
  • seedvr2_ema_7b_sharp_fp16.safetensors:个人觉得效果最好

开始使用

图片高清化

img.png

视频高清化

img_1.png

核心节点

SeedVR2 (Down)Load DiT Model

核心参数如下:

  • model:大模型
  • device:推理设备 (e.g., cuda:0)
  • offload_device:DiT模型不运行时卸载到哪里
    • none:不卸载
    • cpu:卸载到内存
    • cuda:X:卸载到其他的 GPU
  • blocks_to_swap: BlockSwap 内存优化策略,值越大,越节省显存;需要 device 和 offload_device 设置为不同的值且 offload_device不为 none
    • 0: 不开启 (默认)
    • 1-32: 使用 3B 模型推荐值
    • 1-36: 使用 7B 模型推荐值
  • swap_io_components: 开启后,与 blocks_to_swap 结合使用时可节省额外的显存;需要 device 和 offload_device 设置为不同的值且 offload_device不为 none

SeedVR2 (Down)Load VAE Model

核心参数如下:

  • model:vae 模型
  • device:推理设备 (e.g., cuda:0)
  • offload_device:vae 模型不运行时卸载到哪里
    • none:不卸载
    • cpu:卸载到内存
    • cuda:X:卸载到其他的 GPU
  • encode_tiled: 编码阶段开启分片处理机制,可节省显存,如果发现 "Encoding" 编码阶段发生 OOM,则开启
  • encode_tile_size: Encoding tile size in pixels (default: 1024),宽高同值, 值越小越节省显存但是会增加推理时间
  • encode_tile_overlap: Encoding tile overlap in pixels (default: 128),用于减少 tile 之间的接缝问题
  • decode_tiled: 解码阶段开启分片处理机制,可节省显存,如果发现 "Decoding" 编码阶段发生 OOM,则开启
  • decode_tile_size 和 decode_tile_overlap 与 encode_tile_size 和 encode_tile_overlap 类似

SeedVR2 Video Upscaler

核心参数如下:

  • resolution: 放大后的图片/视频的短边长度 (default: 1080),长边等比例缩放
  • max_resolution: 长和宽任何一个的最大的长度 (default: 0 = 不限制)
  • batch_size: 每批处理的帧数(必须是4n+1),使用批处理为了计算保持帧之间的一致性,防止单帧处理造成的一致性问题,值越高越好,但是可能会 OOM,OOM 发生后优先进行节点1和节点2中的优化,搞不定再动这个值
  • uniform_batch_size (default: False):处理最后一批明显小于前面批次而产生的 temporal artifacts 问题,当使用 batch_size 较大且视频长度不是 batch_size 的倍数时,建议开启
  • temporal_overlap: 两次批处理之间的重叠帧数 (范围是 0-16 帧,默认是 0),与图片分片处理的 tile_overlap 类似,为了减少批次间的“接缝”问题
  • prepend_frames: 当视频的开始部分不自然,可以设置该值 (范围是 0-32 帧 frames,默认是 0)
  • color_correction: 颜色矫正算法(推荐 lab),当颜色不满意时,可以调整到其他选项
  • latent_noise_scale: 在推理过程中添加噪声,可以柔化过多的细节(范围是 0.0-1.0,默认是 0.0)
  • offload_device: 与节点1和节点2类似,显存不足,则打开

文章的最后,如果您觉得本文对您有用,请打赏一杯咖啡!感谢!