接上一篇文章,搭建好基本的AI训练环境,在这里使用WAV2Lip项目进行部署
1、克隆代码
https://github.com/anothermartz/Easy-Wav2Lip.git
2、安装依赖
进入代码目录,进行依赖安装,此步骤安装内容比较大其中一个包2G+,下载耗费时间长。
pip install -r requirements.txt
3、安装完成依赖后对代码进行编译
python install.py
4、编译成功后会在当前目录生成启动方法,主要如下:
Linux:
`./run_loop.sh`
Windows命令行:
`call run_loop.bat`
web方式:Wav2Lip启动.bat
window cmd启动: call run_loop.bat后修改弹出的配置文件路径,配置合成的声音和图像(video_file视频图片都可以):
video_file =
vocal_file =
win窗口执行页面:
web启动页面:
问题处理过程: 1、在启动过程中,一些遗漏的依赖也会提示缺少,按提示安装即可。 主要提示了如下依赖包需要安装(最好梯子或者替换源,因为速度慢):
No module named 'dlib'
#安装CMake之前,需要先安装VS for C++;
No module named 'CMake'
No module named 'gdown'
No module named 'IPython'
No module named 'moviepy'
# 安装不了使用替代命令: pip3 install opencv-python
No module named 'cv2'
No module named 'librosa'
No module named 'batch_face'
No module named 'basicsr'
2、提示torchvision.transforms.functional_tensor错误问题, 是由于版本更新此方法名称以及变更,在报错的地方修改方法名称就可以了
提示错误方法:
torchvision.transforms.functional_tensor
修改为:
torchvision.transforms._functional_tensor
3、Pytorch版本问题,版本不对会导致cuda使用不到。
根据网站https://pytorch.org/get-started/locally/
确认好自己使用的版本,主要s是跟cuda,cuDNN、Pytorch使用版本要适配
至此第一个模型wav2lip运行成功,可以通过微调实现需要的效果, 具体调试参数说明参考: https://github.com/anothermartz/Easy-Wav2Lip/blob/v8/README.md#advanced-tweaking