接上一篇文章,搭建好基本的AI训练环境,在这里使用WAV2Lip项目进行部署

1、克隆代码

https://github.com/anothermartz/Easy-Wav2Lip.git

2、安装依赖

进入代码目录,进行依赖安装,此步骤安装内容比较大其中一个包2G+,下载耗费时间长。

pip install -r requirements.txt

3、安装完成依赖后对代码进行编译

python install.py

4、编译成功后会在当前目录生成启动方法,主要如下:

Linux:
`./run_loop.sh`

Windows命令行:
`call run_loop.bat`

web方式:Wav2Lip启动.bat

window cmd启动: call run_loop.bat后修改弹出的配置文件路径,配置合成的声音和图像(video_file视频图片都可以):

video_file = 
vocal_file = 

win窗口执行页面:

web启动页面:

问题处理过程: 1、在启动过程中,一些遗漏的依赖也会提示缺少,按提示安装即可。 主要提示了如下依赖包需要安装(最好梯子或者替换源,因为速度慢):

No module named 'dlib'
#安装CMake之前,需要先安装VS for C++;
No module named 'CMake' 
No module named 'gdown'
No module named 'IPython'
No module named 'moviepy'
# 安装不了使用替代命令: pip3 install opencv-python
No module named 'cv2'
No module named 'librosa'
No module named 'batch_face'
No module named 'basicsr'

2、提示torchvision.transforms.functional_tensor错误问题, 是由于版本更新此方法名称以及变更,在报错的地方修改方法名称就可以了

提示错误方法:
torchvision.transforms.functional_tensor

修改为:
torchvision.transforms._functional_tensor

3、Pytorch版本问题,版本不对会导致cuda使用不到。 根据网站https://pytorch.org/get-started/locally/ 确认好自己使用的版本,主要s是跟cuda,cuDNN、Pytorch使用版本要适配

至此第一个模型wav2lip运行成功,可以通过微调实现需要的效果, 具体调试参数说明参考: https://github.com/anothermartz/Easy-Wav2Lip/blob/v8/README.md#advanced-tweaking