功能最全开源数字人 HeyGem
项目介绍
HeyGem 是一款专为 Windows
系统设计的全 离线
视频合成工具,它能够精确克隆您的外貌和声音,让您的形象数字化。您可以通过文字和语音驱动虚拟形象,进行视频制作。
核心功能
- 精确克隆外貌与精确克隆声音
- 文字和语音驱动虚拟形象:让虚拟形象根据语音的节奏(文字会转为语音)、语调等进行相应的动作和表情变化,使虚拟形象的表现更加自然、生动
- 数字人的视频画面与声音高度同步,实现自然流畅的口型匹配
- 多语言:脚本支持八种语言,英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语
显著优势
- 全离线操作:无需联网即可使用
- 操作界面简洁直观
- 多模型支持:支持导入多个模型,并通过一键启动包进行管理,方便用户根据不同的创作需求和应用场景选择合适的模型。
软件安装
前置条件
- 必须有 D 盘:主要用于后续数字人、作品等数据存储,空闲空间要求:大于30G
- 标准版需要有一个空闲空间大于 100G 的硬盘(轻量版不需要),用于存储服务镜像文件(标准版有约70G的镜像文件;轻量版约13G,轻量版不支持输入文字来生成数字人),如果不使用 C 盘来存储,则需要在安装完成 docker 后,在下图的位置重新选一个剩余空间大于 100G 的磁盘文件夹。
- Windows 10 19042.1526 或更高版本
- 内存:至少 32G
- 必须有英伟达显卡
安装 NodeJS
安装 NVIDIA drivers
见 安装 NVIDIA drivers/CUDA/cuDNN
安装 WSL2
见 安装 WSL2
安装 docker windows 版
安装 HeyGem 服务端
shell
# 克隆代码到本地
git clone https://github.com/GuijiAI/HeyGem.ai.git
# 进入 deploy 目录下
cd HeyGem.ai\deploy
# 执行 docker 命令进行镜像下载
docker-compose up -d
看到如下输出,表示启动成功了。
同时也可以看下 docker-desktop 中的容器运行情况。
安装 HeyGem 客户端
在 官方 release 页面 下载 HeyGem-xxx-setup.exe
程序。点击安装即可。安装完成首次启动如下:
设置项包含:中英双语切换;日志查看;用户协议查看。通过查看日志,可以查看程序运行情况,对于排错/查看文件存储位置/运行机制都有较大帮助。
使用
第一步:点击顶部右侧“快速定制”按钮,提交视频,定制数字人模特
第二步:点击顶部左侧“短视频制作”按钮,选择数字人模特,上传文字或者音频,制作数字人视频。