小白都会用的一站式 AI 数字人镜像(Heygem+Multitalk+Flux)

作者:微信小助手

发布时间:2025-08-18T19:38:25

前言

       AI数字人今年特别火热,百度数字人、京东数字人等应用纷纷投入获客,用来解决企业营销困境、老板出镜难、拍摄文案剪辑成功高等问题。

但普通人想要使用,费用高昂,市面上服务收费高达3~5元/分钟,开源方案(如heygem/multitalk)部署复杂,使用门槛极高。

以下是一家数字人小程序的价格截图。

   

一站式AI数字人

为解决以上痛点,作者在国内最好的 GPU 平台:仙宫云,集合顶尖开源大模型,打造一站式AI数字人web镜像,实现一键部署,网页操作,使用体验极简高效。只有有网就能用,还能共享给同事朋友。

   

Flux生成(可选)

采用顶级开源Flux大模型生成超写实主播形象,支持多风格定制,从商务精英到虚拟偶像全覆盖。

   

Flux-kontext改图(可选)

革命性"用嘴改图"技术,通过语音指令实时修改数字人形象细节,服装、场景、表情随心调整。

不会英文?不怕,用上页面自带的豆包智能体,输入中文提示词,就能获得优化后的英文提示词,一键粘贴。

   

Multitalk图片生成视频

使用上生成的单张图片,即可生成数字人视频样本,上传口播音频,底层依靠阿里 Wan 视频大模型,生成自然度媲美真人主播。

建议只生成 5-10s 样本视频即可,生成 5s 视频大概耗时5 分钟(48G4090D)。

拿到主播5s样本视频,扔给后续 Heygem 去快速生成。

   
没有音频?使用内置的 IndexTTS 开源音色克隆模型,内置多种热门音色。
B 站开源的 IndexTTS,克隆音色又快又像,超赞!

Heygem快速生成短视频

Heygem 作为开源顶流数字人,虽然速度快,但是部署起来超级难。

这次我们内置到镜像,同时优化成(语音+文本)双模式驱动。(heygem 本身只有音频驱动)

同时支持管理数字人形象,上传的同时设置为常用,可以避免每次上传,下次使用只要下拉列表,就能选择上传过的数字人形象啦!

   速度真的超级快!30 多秒的口播视频,只用了 1 分半钟。

   一个小时大概能生成 20 分钟视频,如果按市面数字人费用 算,20*5=100 块。
  
  但是在仙宫云1 个小时显卡才2 块左右,性价比超 50 倍。
而且镜像内置优化了 Heygem,可以上传无音视频,特别适合从即梦或者可灵生成的无配音AI 视频。(解决了heygem 必须要用带音频的样本视频问题)

其实这种方式是最快的,免去了前面的操作,但是要注意侵权问题

(ps:怎么去视频水印,👇进群交流)

怎么使用

1️⃣ 先访问仙宫云平台,通过邀请注册就能白嫖5个小时4090 显卡https://www.xiangongyun.com/register/ICEKVE

2️⃣ 然后选择本镜像一键部署(根据使用选择不同显卡配置)https://www.xiangongyun.com/image/detail/f0ceaf6d-749c-4c14-8eb4-aadcd8ccf9b0?r=ICEKVE

3️⃣ 部署成功后,通过“小白都会用的 web 端”进入 web 页面

刚部署成功后,如果生成失败,请稍等2-4 分钟,请后台服务启动成功。

4️⃣ 尽情使用吧(一定要仔细看使用说明后再用

技术交流

       📧 微信:yyllff2025
       💬 社群:扫描下方二维码加入技术交流群


                                     

 视频版教程