今天逛GitHub发现了一个好玩的视觉小说引擎 WebGAL,可以使用可视化的编辑器进行开发,开发出来的内容就是可以用对话和旁白讲述小说或其他内容。试玩了一下感觉上手还是很简单的。下面小刚也会分享下使用方法和自己的工作流~

官方项目网址https://openwebgal.com/zh-cn/
里面有开发工具下载地址和使用教程,真的几分钟就可以上手。

体验网址https://comfyui.chat/honglou/
内容很少,仅仅做了几句对话,感觉内容长了也是个苦力活~

先通过下载网址下载适合自己系统的编辑器,windows系统可以下载直接解压后使用

双击运行程序会打开一个运行窗口然后会在浏览器里面打开http://localhost:3001/ 玩WebUI、ComfyUI的同学会很熟悉。新建一个游戏填写下基本信息,左边会显示基本概况,右边是场景信息。如果右边没有显示场景信息可以点击左下角最后的按钮显示出来。

另外顶部脚本编辑模式开关可以在图形编辑和脚本编辑之间切换,建议开始先使用图形编辑模式熟悉下流程,后面就可以使用脚本模式快速复制了。最常用的应该就是普通对话和切换立绘的功能吧

功能方面感觉确实没有太多可讲的东西,其实主要的还是内容的制作,下面小刚也分享下自己的流程。

一、角色立绘
我打算做一个红楼梦主题的,无疑陈晓旭老师版的红楼梦还是很深入人心的,希望人物尽量能贴近,于是打算使用 ComfyUI 来生成角色图片(最近没事的时候就断断续续的研究ComfyUI,感觉连连看的游戏还是比较有趣的)。我主要是使用了 IPAdapter_plus 插件和 ControlNet 实现风格和人脸的迁移,以及上次讲的 Allor Plugin 完成抠图。用了SDXL的容华大模型和工笔风格的LoRA,模型都可以在哩布哩布AI下载。这里就不细讲了,如果有同学对工作流感兴趣可以后台找我。

另外背景图片还是使用 Midjourney 来生成的,感觉相对来说MJ生成的场景图还是比其他的能稍强些。

二、对话音频

对应角色的对话我是使用的微软的 Speech Studio 有声内容创作平台,微软无疑是语音合成方面最强玩家,可以自定的内容很多。能够调整说话风格、语气、情绪、停顿、发音和韵律等。另外生成好之后还可以选择分段打包下载,这样我们只要把每个分段对应上角色就可以了,算是相当方便的。而且还有很大的免费额度供使用,基本相当于免费。

Speech Studio 网址https://speech.microsoft.com/audiocontentcreation

对于视觉小说引擎 WebGAL,总的感觉是上手容易,而且可以发布成自适应多端的web页面,还可以发布成可执行程序和安卓APP。但是要做长内容感觉还是要花费不少功夫,而且现在互动的能力还是太弱些了,真的是只适合做小说和内容引擎,做成游戏还是差的比较远。畅想一下,要是能使用这种形式做成跟AI虚拟人对话的应用就好了,就是除了基本的对话之外还能根据对话的内容切换不同的场景,根据对话的内容解锁不同的关卡,这会比现在大多数的虚拟人应用更进了一步,当然这也可能并不是这个系统的目标~_~