这两天试用了下 HeyGem,感觉确实是目前最强的开源数字人口播方案,嘴型效果是优于 LatentSync 1.5,当然缺点是只能正面人脸视频,安装方面也复杂一些,但是只要按照步骤来还是没问题的,下面分享下 HeyGem 的安装步骤,中间有什么问题可以直接问下 DeepSeek 之类的。

演示视频就是使用的 HeyGem 生成的, 初始定制视频打算使用即梦的对口型来生成,没想到即梦能自动检测出刘亦菲的形象,这也说明了Lora效果不错?然后就在可灵使用图片和一个美女正在讲话的提示词生成了初始视频,在剪映中加上音频就可以上车到HeyGem客户端来定制形象了。音频使用的CosyVoice2克隆生产的。


安装 Nodejs

在下面的地址下载并安装Nodejs
Nodejs下载网址:https://nodejs.org/zh-cn


安装 wsl

wsl 是一个在 Windows 10 及更高版本上能够让用户直接运行 Linux 二进制可执行文件的兼容层,相当于在win上运行的linux虚拟机。如果是 win10 系统要先把系统升级到最新版才行,底部栏搜索“检查更新”进行更新即可。

检查 wsl 是否安装

打开命令提示符(开始菜单右键选运行输入cmd),用 wsl –list –verbose 命令可以查看本机有没有安装过wsl,如下图就是已经安装过,无需再安装。

安装 wsl

如果没有安装使用 wsl –install 命令进行安装,如果失败,可能是网络问题,可以多试几次。

更新 wsl

使用 wsl –update 更新 wsl 到最新。


安装 Docker

从以下网址,下载 Docker 进行安装,安装过程中如果显示需要登录可以选择“Continue without signing in”跳过登录,也可以选择使用谷歌登录,安装时勾选”Use WSL 2″。

Docker下载网址:https://www.docker.com/

更改 Docker 镜像地址

Docker 镜像默认安装在C盘,如果空间不够,可以在 Settings -> Resources 里面选择一个新的地址。


拉取 HeyGem 项目

使用 git clone https://github.com/GuijiAI/HeyGem.ai.git 命令把 HeyGem 项目拉取到本地,没有安装 git 也可以在项目中下载压缩包解压。


安装服务端

打开上一步拉取的项目目录,进入到 deploy 目录,在地址栏输入cmd回车

• 如果体验完整服务,使用包括文字生成音频和语音交互等,运行如下命令,大约70G
docker-compose up -d

• 如果只是想生成数字人可以使用,运行如下命令,大约13.5G
docker-compose -f docker-compose-lite.yml up -d

下载完成后会在Docker看到三个服务正常运行,服务端就部署完成了


下载客户端

可以到下面的页面下载官方安装包,极简可以下载 Lite 版的

HeyGem客户端下载地址:

https://github.com/GuijiAI/HeyGem.ai/releases


HeyGem 使用

使用方法非常简单,打开安装的客户端,通过快速定制可以定制自己的角色,通过自己的角色和声音创建视频就行了。

定制角色的时候可以自己录制口播的视频,如果自己没有视频,推荐使用即梦的大师模式的对口型生成初始视频。
需要注意的是视频要大于8秒,而且必须是正面人脸才行。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注