Skip to content

功能最全开源数字人 HeyGem

项目介绍

HeyGem 是一款专为 Windows 系统设计的全 离线 视频合成工具,它能够精确克隆您的外貌和声音,让您的形象数字化。您可以通过文字和语音驱动虚拟形象,进行视频制作。

核心功能

  • 精确克隆外貌与精确克隆声音
  • 文字和语音驱动虚拟形象:让虚拟形象根据语音的节奏(文字会转为语音)、语调等进行相应的动作和表情变化,使虚拟形象的表现更加自然、生动
  • 数字人的视频画面与声音高度同步,实现自然流畅的口型匹配
  • 多语言:脚本支持八种语言,英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语

显著优势

  • 全离线操作:无需联网即可使用
  • 操作界面简洁直观
  • 多模型支持:支持导入多个模型,并通过一键启动包进行管理,方便用户根据不同的创作需求和应用场景选择合适的模型。

软件安装

前置条件

  1. 必须有 D 盘:主要用于后续数字人、作品等数据存储,空闲空间要求:大于30G
  2. 标准版需要有一个空闲空间大于 100G 的硬盘(轻量版不需要),用于存储服务镜像文件(标准版有约70G的镜像文件;轻量版约13G,轻量版不支持输入文字来生成数字人),如果不使用 C 盘来存储,则需要在安装完成 docker 后,在下图的位置重新选一个剩余空间大于 100G 的磁盘文件夹。 img.png
  3. Windows 10 19042.1526 或更高版本
  4. 内存:至少 32G
  5. 必须有英伟达显卡

安装 NodeJS

安装 NodeJS

安装 NVIDIA drivers

安装 NVIDIA drivers/CUDA/cuDNN

安装 WSL2

安装 WSL2

安装 docker windows 版

安装 docker-windows

安装 HeyGem 服务端

shell
# 克隆代码到本地
git clone https://github.com/GuijiAI/HeyGem.ai.git
# 进入 deploy 目录下
cd HeyGem.ai\deploy
# 执行 docker 命令进行镜像下载
docker-compose up -d

看到如下输出,表示启动成功了。 img.png

同时也可以看下 docker-desktop 中的容器运行情况。 img.png

安装 HeyGem 客户端

官方 release 页面 下载 HeyGem-xxx-setup.exe 程序。点击安装即可。安装完成首次启动如下:

img.png

设置项包含:中英双语切换;日志查看;用户协议查看。通过查看日志,可以查看程序运行情况,对于排错/查看文件存储位置/运行机制都有较大帮助。

使用

第一步:点击顶部右侧“快速定制”按钮,提交视频,定制数字人模特 img.png

第二步:点击顶部左侧“短视频制作”按钮,选择数字人模特,上传文字或者音频,制作数字人视频。 img_1.png