# xtts2-fastapi **Repository Path**: google_tmac/xtts2-fastapi ## Basic Information - **Project Name**: xtts2-fastapi - **Description**: fastapi+xtts2实现中文语音合成功能,提供http服务,自动识别CPU、GPU模式 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-08 - **Last Updated**: 2026-01-08 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 1.普通方式部署及启动 ## 1.1 初始化环境 ``` # 创建虚拟环境 python版本 3.10.x py -3.10 -m venv .venv # 激活虚拟空间 .venv\Scripts\activate ``` ## 1.2 联网环境执行 ### 1.2.1 升级pip 可选(联网条件下执行) ``` # 升级pip python -m pip install --upgrade pip ``` ### 1.2.2 安装pytorch ``` pip install torch==2.2.1 torchvision==0.17.1 torchaudio==2.2.1 --index-url https://download.pytorch.org/whl/cu121 ``` ### 1.2.3 安装其他依赖 ``` pip install -r requirements.txt ``` ## 1.3 下载xtts_v2中文模型 > tts_models--multilingual--multi-dataset--xtts_v2 百度网盘下载地址: + 链接: https://pan.baidu.com/s/1ZXpqKfV1bsb_FBsNep9VJw?pwd=phwj + 提取码: phwj ## 1.4 离线导出/导入 导出依赖包 ``` pip freeze > requirements_freeze.txt pip download -r requirements_freeze.txt -d ./offline_pkgs --extra-index-url https://download.pytorch.org/whl/cu121 ``` 离线服务器导入 初始化环境 ``` # 创建虚拟环境 python版本 3.10.x py -3.10 -m venv .venv # 激活虚拟空间 .venv\Scripts\activate ``` 导入依赖 ``` pip install --no-index --find-links ./offline_pkgs -r requirements_freeze.txt ``` ## 1.5 启动 + 修改`app_coqui.py`的`MODEL_DIR`的路径地址,指向下载并解压好的xtts_v2路径 ``` $env:KMP_DUPLICATE_LIB_OK="TRUE" uvicorn app:app --host 0.0.0.0 --port 8001 ``` # 2.Docker部署 下载代码请复制以下命令到终端执行 ```bash git clone https://gitee.com/google_tmac/xtts2-fastapi.git cd xtts2-fastapi ``` 构建镜像 ```bash # 首次构建时,需要联网 sh build.sh ``` 上传模型文件 ```bash mkdir -p workspace/{app,models} # 通过1.3下载模型,放至workspace/models,目录结构如下 workspace/ └── models └── tts_models--multilingual--multi-dataset--xtts_v2 ├── accepted_cpml ├── config.json ├── configuration.json ├── dvae.pth ├── hash.md5 ├── LICENSE.txt ├── mel_stats.pth ├── mel_stats.pth.bak ├── model.pth ├── README.md ├── speakers_xtts.pth └── vocab.json ``` 启动容器 ```bash sh start_tts.sh ```