第一部分 环境搭建
核心内容
介绍 AI 应用的前置基础软件安装
- 安装 Miniconda
- 安装 Git
- 安装 Visual Studio
- 安装 NVIDIA drivers/CUDA/cuDNN
- 安装 triton-windows
- 安装 FlashAttention-windows
- 安装 SageAttention-windows
- 安装 nunchaku
- 安装 FFmpeg
- 安装 NodeJS
- 安装 WSL2
- 安装 docker-windows
- 安装 pyopenjtalk
- 安装 espeak-ng
- 安装 natten-windows
- 安装 rust
第二部分 AI 图像编辑去水印
核心内容
介绍当下最好用的最全面的图像编辑工具
- MagicQuill:智能的交互式图像编辑系统
- IOPaint:免费开源的局部重绘和图像扩展工具
- OmniGen:通过自然语言生成/编辑/合成图像
- ICEdit:开源的高效的通过自然语言编辑图像
- DreamO:字节开源的统一图像定制框架
- NanoBanana:自然语言图像编辑新王
第三部分 AI 换脸
- FaceFusion:行业领先的开源免费换脸平台
- PuLID:逼真的 ID 定制化(换脸)工具
- EcomID:阿里开源的的 ID 定制化(换脸)工具
- instantID 一键图片换脸整合包/遮罩自动处理
第四部分 AI 拟声与数字人
- CosyVoice2:最逼真的声音克隆工具
- Spark-TTS
- IndexTTS1.5:B站开源的最强语音克隆/TTS工具
- IndexTTS2:最逼真的具有情感控制的开源语音克隆/TTS工具
- FireRedTTS2:多个说话人对话生成的长时间 TTS 系统
- HeyGem:功能最全开源数字人
- LatentSync:最强开源数字人
- DiffRhythm:全长歌曲生成工具
- ACE-Step:最强歌曲生成工具
- AudioX:声音/音乐生成工具
- MMAudio:参考视频生成声音
- HunyuanVideo-Foley:参考视频生成声音
- 数字人插件 Sonic
第五部分 ComfyUI 实用工作流
基础
- 初识 ComfyUI - 最强大最灵活的AI生图/视频/音频工具
- 安装 ComfyUI 管理器
- 搭建 Flux 文生图工作流
- 搭建 Flux 图生图工作流
- Flux 使用 Lora 工作流
- Flux 使用 ControlNet 工作流
- Flux 官方 Canny 边缘控制工作流
- Flux 官方 Depth 边缘控制工作流
- 使用 flux-dev-fill 实现高质量局部重绘
- OneReward:效果顶尖的通过遮罩编辑图像模型
- 使用 flux-dev-redux 实现风格参考
- USO:风格和主题驱动框架
- Flux Kontext:最好的自然语言编辑图像工具
- 搭建 HiDream 工作流
- 最强中文文生图开源模型 Qwen-Image
- 顶级图像编辑模型 Qwen-Image-Edit
- 顶级图像编辑模型 Qwen-Image-Edit-2509
- 视频生成框架 HunyuanVideo
- 视频生成框架 SkyReels
- 最强视频生成框架 Wan2.1
- 最强视频/数字人生成框架 Wan2.2
插件
- 安装 ComfyUI 资源监控插件
- 安装推理加速插件 WaveSpeed
- 高速推理引擎 nunchaku
- 安装最强提示语反推插件 JoyCaption2
- 安装提示语翻译插件 AlekPet
- 强大的风格参考插件 IPAdaptorPlus
- 本地大语言模型插件 ComfyUI-Ollama
- 细节增强插件 ComfyUI-Detail-Daemon
- 局部重绘辅助插件 CropAndStitch
- 自然语言局部重绘插件 FlowEdit
- 遮罩智能分割插件 SegmentAnything2
- 妆容迁移插件 CSDMT
- 模型可视化管理器 ModelPreview
- 图生视差动画插件 DepthFlow
- 表情复刻插件 HelloMeme
- 人体运动视频插件 MimicMotion
- 交互式插帧插件 Framer
- 视频插帧插件 GIMM-VFI
- 最强抠图插件 BEN2
- 音乐生成插件 YUE
- 媒体分析与自然语言图像生成插件 Gemini-Flash2.0-Exp
- 换脸插件 InfiniteYou
- 视频处理插件 ComfyUI-FFmpeg
模型
工作流
- 使用 ComfyUI_PuLID_Flux_ll 实现换脸
- 使用 flux-dev-fill 实现高质量扩图
- FluxFill 修手工作流
- 真人转3D动漫形象工作流
- 真人转3D大头娃娃动漫形象工作流
- Flux 万能人物风格迁移工作流
- 动漫转真人工作流
- 顶级的动漫转真人工作流(基于 qwen-image-edit)
- 真人转吉卜力风格动漫工作流
- 人物风格迁移工作流汇总
- 图生艺术字工作流
- 历史人物复活工作流
高清放大
EchoMimic2 整合包/数字人/图片开口说话/音频驱动图片转视频
LivePortrait 整合包/表情
一键生成自己的证件照工作流
老照片修复工作流
面部修复工作流/彻底解决生图面崩问题
文生图无限高清放大工作流
图生图无限高清放大工作流
风格选择器
第六部分 大模型
- 安装大模型本地运行利器 ollama
- 安装开源大模型之王 DeepSeek
- 创新型钢炮模型 DeepSeek-OCR
- 安装大模型 UI 界面 OpenWebUI
- 安装大模型 UI 浏览器插件 PageAssist
- 使用 spring AI + ollama 调用 DeepSeek 模型
- DeepSeek 官方提示语模板库
- DeepSeek 使用场景之中英翻译
- DeepSeek 使用场景之增强 ComfyUI 提示语
- 安装本地大模型之王 QwQ-32B
- 开源智能体框架 OpenManus
- 最易用的本地可部署开源智能体框架 JManus
- 智能体框架 JManus4.x(最新版本)本地部署与使用
- 开源智能体框架 OWL
- 安装全模态模型 Qwen2.5-Omni
- 安装大模型最新王者 Qwen3
- 多模态大模型最新王者 Qwen3-VL
- 基于 ollama 和 Qwen32B 定义模型角色和模型破限的最简方式
- 各种 mcp-server 介绍
- n8n:AI 时代的流程节点编排工具
第七部分 SpringAI
SpringAI
- 第一章 第一个 SpringAI 程序
- 第二章 统一门面接口 ChatClient
- 第三章 提示语 Prompt 与模板 PromptTemplate
- 第四章 结构化输出 Structured Output
- 第五章 模型 Model
- 第六章 记忆组件 ChatMemory
- 第七章 链式组件 Advisors
- 第八章 工具调用 Tool Calling
- 第九章 模型上下文协议 MCP
- 第十章 向量数据库 Vector Databases
- 第十一章 检索增强模式 RAG
- 第十一章 设计一个 Single-Agent 单智能体
- 第十二章 设计一个 Multi-Agent 多智能体
AI 编码工具
AI 辅助工具
第八部分 小工具
AI
- 至简的 LORA 训练器 FluxGym
- 最方便的图片高清工具 Topaz Photo AI
- 最强证件照一键制作工具 HivisionIDPhotos
- 强大易用低显存高速开源放大神器 HYPIR
- 顶级的视频高清放大工具 FlashVSR
其他
- 手动创建 jre
- 创建 Java 整合包
- 常用 windows 命令
- RedisForWindows 安装与使用
- 极简主义的待办工具 KITE
- 磁盘管理工具 EaseUSPartitionMaster
- 媒体下载工具 Cobalt
- 媒体下载工具 YouGet
- 图片压缩工具 PicSmaller
- Github 2FA 验证流程
- 微信公众号 markdown 工具
- 小而美的录屏工具 Captura
第九部分 优质提示语库
文章的最后,如果您觉得本文对您有用,请打赏一杯咖啡!感谢!
