前言
本文将介绍一个可以快速搭建本地语音合成的服务,模型和代码已全部提供,不需要联网运行。项目使用的是VITS模型结构,能够很轻松地启动服务。
安装环境
- 安装Pytorch。
# 安装CPU版本的Pytorch
conda install pytorch torchvision torchaudio cpuonly -c pytorch
# 安装GPU版本的Pytorch
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
- 安装其他依赖库。
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
启动服务
- 执行
server.py
程序,启动上传音频文件识别服务。
python server.py
Android应用
使用Android Studio打开源码中的AndroidClient
目录,这是一个Android应用源码,打开之后首先就要修改服务t地址TTS_HOST
,将它修改为你上面使用的服务器IP地址,点击运行安装到Android手机上。
应用效果图: