随心逆向破解论坛,全网火爆原创辅助基地,集技术交流、视频教程、资源共享、游戏辅助,网站源码,辅助破解,手机软件破解,软件开源,专注收集并分享.各类教程

 找回密码
 立即注册
论坛邀请码购买 论坛邀请码购买 论坛邀请码购买 论坛邀请码购买 论坛邀请码购买
小玲辅助 678游戏辅助 辅助购买24自动发卡 辅助购买24自动发卡 辅助购买24自动发卡
PC迅雷游戏加速器免费获取口令兑换会员 无限流量咔俛费办/送主站/无限分站 无限流量咔俛费办/送主站/无限分站 【站长推荐】网创VIP会员20/月 【站长推荐】网创VIP会员20/月
文字广告位120/月 文字广告位120/月 文字广告位120/月 易语言5.8完美破解版 易语言 v5.9.0 完美破解版
随心论坛安卓 逆向工具1.6 随心论坛安卓逆向工具1.6 随心论坛虚拟机10.0 随心论坛虚拟机10.0 随心论坛虚拟机12.7
随心论坛虚拟机12.7 随心论坛虚拟机41.1 随心论坛虚拟机41.1 随心破解论坛工具集1.8 随心破解论坛工具集1.8
快手极速版秒得8--60元 随心辅助万能通杀器 随心辅助万能通杀器 随心通杀器使用教程 随心通杀器使用教程
支付宝扫红包必得现金红包 支付宝扫红包必得现金红包 花贝 信用咔 白条 分期乐 vx收猪/三百一天/日节 网站搭建
★ 网站代更新 ★ 外链资源-5元一条 文字广告位120/月 随心创业项目网 随心创业项目网
随心创业项目网 随心创业项目网 文字广告位120/月 文字广告位120/月 文字广告位120/月

温馨提示:请在上面搜索| 查找更多免费资源,如需广告位请联系站长QQ:1469437475

全站
2024-05-28 10:25:49

AI数字人制作工具SadTalker软件与教程

2023-11-06 11:28:43 发布

PC电脑软件 /[辅助工具] 154981141 8 0

968

主题

1019

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
14791
发表于 2023-11-6 11:28:43 | 显示全部楼层 |阅读模式
这款AI一键让照片说话的模型叫SadTalker,是由西安交通大学的研究人员提出的,它可以让照片里的人物跟随音频的输入动起来,且头部运动、面部表情比较真实,下图是官方展示的效果图,还在等什么呢,即刻拥有它!

可以根据一张图片、一段音频,合成面部说这段语音的视频。图片需要真人或者接近真人。目前项目已经支持stable diffusion webui,可以SD出图后,结合一段音频合成面部说话的视频。
1、启动软件
在下载下来的 SadTalker.zip 上点右键,选”解压到 SadTalker 文件夹”解压出来

打开解压出来的 SadTalker 文件夹,找到 WEBUI 运行.bat,打开它会弹出一个黑色窗口,稍等会,窗门里会出现 2行文字,如下图

把黑色窗口第一行那个网址 (就是http://127...1:7860这个) 复制一下只能选中后,按 Ctrl+C 复制,右键出不来菜单,然后粘贴Ctrl+v到浏览器地址栏里打开。

最好用谷歌浏览器,或微软 Edge浏览器。

打开那个网址后,浏览器显示的内容如下图所示:

注意:不可开着代理之类的,网络必须直连。

2、软件的使用
首先,上传相片,上传音频,如下图所示音频可以用文字转语音工具制作,也可以自己录制。

接着,设置一下右边的选项,有两种建议方案

第一种设置方案

该方案生成的数字人和原图一样大,头部动作幅度虽然较小但不会出现头部和身子分离的现象,身子不动。

请按照下图设置

第二种设置方案

该方案会对原图进行裁切,只生成头部视频,没有身子,生成的数字人表情动作比第一种方案更丰富,更生动,请按照下图设置。

3、下载生成视频
设置完成后,点"生成”,稍等一会,就会在左下方生成视频。原来的那个黑色窗口里会看到进度。

生成视频后,在生成的视频上点右键,会看到下载选项。

如果找不到下载选项,可以直接打开软件目录里的“results”文件夹再打开里面的文件夹,会看到几个 mp4文件,有的仅是头部,有的是普通画质,有的是超清画质,都打开看看,找个好的。

4、处理说明
处理方式说明。

crop:对原图进行裁切,只生成头部视频,没有身子,生成的数字人表情动作丰富,更生动。

resize:生成的数字人身子也稍微动,但效果很烂,太假,不建议使用。

full:生成的数字人和原图一样大,身子不动,如果勾选”静态模式”,则头部动作幅度较小,但不会出现头部和身子分离的现象;如果不勾选”静态模式”,则头部动作幅度更大,但有时候会出现头部和身子分离的现象。

extcrop、exfull: 与 crop、full 功能一样,但对头部的裁剪范围更大。

其他说明
姿态 Pose style: 头部晃动幅度,值越大,表情晃动越厉害。

expression scale: 脸部表情幅度,尤其是嘴唇,值越大,动作越大。

batch size in generation: 值越大,处理越快,但对显卡要求越高。显卡不好选 1就行。

启用参考视频 Use Reference Video 。

下方的选项pose:生成的数字人的脸部姿势和参考视频一致。

blink:生成的数字人眨眼和参考视频一致。

pose+blink:生成的数字人脸部、眨眼与参考视频一致all:生成的数字人和参考视频全部保持一致,包括声音。
游客,如果您要查看本帖隐藏内容请回复


您需要登录后才可以回帖 登录 | 立即注册

1229582823 高级VIP用户组 2023-11-6 11:52:17

相当不错,感谢无私分享精神!

62xeg57i20 新手上路 2023-11-6 12:52:09

有道理。。。

long520666 金牌会员 2023-11-6 12:59:46

不错不错,楼主您辛苦了。。。

芳茵2717 新手上路 2023-11-6 13:01:31

我是来刷分的,嘿嘿

2607938414 新手上路 2023-11-6 13:13:38

路过,学习下

wbd4m4gw5m 新手上路 2023-11-6 13:19:49

过来看看的

71191958@qq.com 中级会员 2024-3-30 22:23:55

谢谢楼主分享

302744204 注册会员 2024-4-3 11:59:46

正需要,支持楼主大人了!

快速回复 返回顶部 返回列表