# xtts2-fastapi

**Repository Path**: google_tmac/xtts2-fastapi

## Basic Information

- **Project Name**: xtts2-fastapi
- **Description**: fastapi+xtts2实现中文语音合成功能，提供http服务，自动识别CPU、GPU模式
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-01-08
- **Last Updated**: 2026-01-08

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 1.普通方式部署及启动
## 1.1 初始化环境
```
# 创建虚拟环境 python版本 3.10.x
py -3.10 -m venv .venv

# 激活虚拟空间
.venv\Scripts\activate
```

## 1.2 联网环境执行
### 1.2.1 升级pip 可选（联网条件下执行）
```
# 升级pip
python -m pip install --upgrade pip
```

### 1.2.2 安装pytorch
```
pip install torch==2.2.1 torchvision==0.17.1 torchaudio==2.2.1 --index-url https://download.pytorch.org/whl/cu121
```

### 1.2.3 安装其他依赖
```
pip install -r requirements.txt
```

## 1.3 下载xtts_v2中文模型
> tts_models--multilingual--multi-dataset--xtts_v2 百度网盘下载地址：
+ 链接: https://pan.baidu.com/s/1ZXpqKfV1bsb_FBsNep9VJw?pwd=phwj
+ 提取码: phwj

## 1.4 离线导出/导入
导出依赖包
```
pip freeze > requirements_freeze.txt
pip download -r requirements_freeze.txt -d ./offline_pkgs --extra-index-url https://download.pytorch.org/whl/cu121
```

离线服务器导入

初始化环境
```
# 创建虚拟环境 python版本 3.10.x
py -3.10 -m venv .venv

# 激活虚拟空间
.venv\Scripts\activate
```

导入依赖
```
pip install --no-index --find-links ./offline_pkgs -r requirements_freeze.txt
```

## 1.5 启动
+ 修改`app_coqui.py`的`MODEL_DIR`的路径地址，指向下载并解压好的xtts_v2路径
```
$env:KMP_DUPLICATE_LIB_OK="TRUE"
uvicorn app:app --host 0.0.0.0 --port 8001
```

# 2.Docker部署
下载代码请复制以下命令到终端执行
```bash
git clone https://gitee.com/google_tmac/xtts2-fastapi.git

cd xtts2-fastapi
```

构建镜像
```bash
# 首次构建时，需要联网
sh build.sh
```

上传模型文件
```bash
mkdir -p workspace/{app,models}

# 通过1.3下载模型，放至workspace/models,目录结构如下
workspace/
└── models
   └── tts_models--multilingual--multi-dataset--xtts_v2
       ├── accepted_cpml
       ├── config.json
       ├── configuration.json
       ├── dvae.pth
       ├── hash.md5
       ├── LICENSE.txt
       ├── mel_stats.pth
       ├── mel_stats.pth.bak
       ├── model.pth
       ├── README.md
       ├── speakers_xtts.pth
       └── vocab.json
```

启动容器
```bash
sh start_tts.sh
```