最顶级的开源的图片与视频高清放大软件 SeedVR2

官方文档

https://github.com/ByteDance-Seed/SeedVR

https://github.com/numz/ComfyUI-SeedVR2_VideoUpscaler

效果展示

图片高清

前后对比图：

原图：

高清后的图：

视频高清

原视频：

高清后的视频：

硬件要求

最小显存（8G）:使用 GGUF Q4_K_M 模型，并且开启 BlockSwap 和 VAE tiling；
中等显存 (12-16GB): 使用 FP8 模型，并且开启 BlockSwap 或者 VAE tiling；
高级显存 (24GB+): 使用 FP16 模型，可以获得更高的质量和推理速度

安装插件

使用插件管理器安装，安装插件，重启应用。

安装模型

模型均会在首次使用时自动下载，也可以手动下载。

标准模型可以从此处下载；gguf 模型可以从此处下载。

核心介绍下标准模型：

（必须）ema_vae_fp16.safetensors
seedvr2_ema_3b_fp16.safetensors
seedvr2_ema_7b_fp16.safetensors
seedvr2_ema_7b_sharp_fp16.safetensors：个人觉得效果最好

开始使用

图片高清化

视频高清化

核心节点

SeedVR2 (Down)Load DiT Model

核心参数如下：

model：大模型
device：推理设备 (e.g., cuda:0)
offload_device：DiT模型不运行时卸载到哪里
- none：不卸载
- cpu：卸载到内存
- cuda:X：卸载到其他的 GPU
blocks_to_swap: BlockSwap 内存优化策略，值越大，越节省显存；需要 device 和 offload_device 设置为不同的值且 offload_device不为 none
- 0: 不开启 (默认)
- 1-32: 使用 3B 模型推荐值
- 1-36: 使用 7B 模型推荐值
swap_io_components: 开启后，与 blocks_to_swap 结合使用时可节省额外的显存；需要 device 和 offload_device 设置为不同的值且 offload_device不为 none

SeedVR2 (Down)Load VAE Model

核心参数如下：

model：vae 模型
device：推理设备 (e.g., cuda:0)
offload_device：vae 模型不运行时卸载到哪里
- none：不卸载
- cpu：卸载到内存
- cuda:X：卸载到其他的 GPU
encode_tiled: 编码阶段开启分片处理机制，可节省显存，如果发现 "Encoding" 编码阶段发生 OOM，则开启
encode_tile_size: Encoding tile size in pixels (default: 1024)，宽高同值，值越小越节省显存但是会增加推理时间
encode_tile_overlap: Encoding tile overlap in pixels (default: 128)，用于减少 tile 之间的接缝问题
decode_tiled: 解码阶段开启分片处理机制，可节省显存，如果发现 "Decoding" 编码阶段发生 OOM，则开启
decode_tile_size 和 decode_tile_overlap 与 encode_tile_size 和 encode_tile_overlap 类似

SeedVR2 Video Upscaler

核心参数如下：

resolution: 放大后的图片/视频的短边长度 (default: 1080)，长边等比例缩放
max_resolution: 长和宽任何一个的最大的长度 (default: 0 = 不限制)
batch_size: 每批处理的帧数（必须是4n+1），使用批处理为了计算保持帧之间的一致性，防止单帧处理造成的一致性问题，值越高越好，但是可能会 OOM，OOM 发生后优先进行节点1和节点2中的优化，搞不定再动这个值
uniform_batch_size (default: False)：处理最后一批明显小于前面批次而产生的 temporal artifacts 问题，当使用 batch_size 较大且视频长度不是 batch_size 的倍数时，建议开启
temporal_overlap: 两次批处理之间的重叠帧数 (范围是 0-16 帧，默认是 0)，与图片分片处理的 tile_overlap 类似，为了减少批次间的“接缝”问题
prepend_frames: 当视频的开始部分不自然，可以设置该值 (范围是 0-32 帧 frames，默认是 0)
color_correction: 颜色矫正算法（推荐 lab），当颜色不满意时，可以调整到其他选项
latent_noise_scale: 在推理过程中添加噪声，可以柔化过多的细节(范围是 0.0-1.0，默认是 0.0)
offload_device: 与节点1和节点2类似，显存不足，则打开

文章的最后，如果您觉得本文对您有用，请打赏一杯咖啡！感谢！

最顶级的开源的图片与视频高清放大软件 SeedVR2 ​

效果展示 ​

图片高清 ​

视频高清 ​

硬件要求 ​

安装插件 ​

安装模型 ​

开始使用 ​

图片高清化 ​

视频高清化 ​

核心节点 ​

SeedVR2 (Down)Load DiT Model ​

SeedVR2 (Down)Load VAE Model ​

SeedVR2 Video Upscaler ​

最顶级的开源的图片与视频高清放大软件 SeedVR2

效果展示

图片高清

视频高清

硬件要求

安装插件

安装模型

开始使用

图片高清化

视频高清化

核心节点

SeedVR2 (Down)Load DiT Model

SeedVR2 (Down)Load VAE Model

SeedVR2 Video Upscaler