# visual-vlogger

**Repository Path**: mazingan/visual-vlogger

## Basic Information

- **Project Name**: visual-vlogger
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-03-06
- **Last Updated**: 2026-03-06

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# Visual Vlogger - 数字人直播内容制作平台

基于 AI 视频生成技术的数字人直播内容制作和管理平台，支持从文案创作到视频发布的全流程自动化。

## 📋 项目概述

**核心功能**：
- 数字人形象上传与管理
- 文案编辑器
- 文本转语音（OpenTTS）
- 视频生成（Wan2.2-TI2V-5B）
- 视频预览与下载
- 内容管理

**技术栈**：
- 前端: Vue 3 + TypeScript + Vite + Pinia + Element Plus
- 后端: FastAPI + SQLAlchemy + Celery + Redis
- 数据库: PostgreSQL
- 消息队列: Redis + Celery
- 文件存储: MinIO
- AI 服务: Wan2.2-TI2V-5B + OpenTTS
- 部署: Docker Compose

## 🚀 快速开始

### 环境要求

- Python 3.10+
- Node.js 18+
- Docker & Docker Compose
- NVIDIA GPU (推荐 RTX 4070 Ti 或更高，16GB+ 显存)
- CUDA 11.8+

### 安装步骤

1. **克隆仓库**
```bash
git clone <repository-url>
cd visual-vloger
```

2. **启动基础服务**
```bash
docker-compose up -d postgres redis minio
```

3. **安装后端依赖**
```bash
cd src/backend
python -m venv venv
source venv/bin/activate  # Linux/Mac
# or: venv\Scripts\activate  # Windows
pip install -r requirements.txt
```

4. **安装前端依赖**
```bash
cd src/frontend
npm install
```

5. **下载 AI 模型**
```bash
# Wan2.2-TI2V-5B
huggingface-cli download Wan-AI/Wan2.2-TI2V-5B --local-dir ./models/wan2.2-ti2v-5b

# OpenTTS 模型（根据需要选择）
```

6. **配置环境变量**
```bash
cp .env.example .env
# 编辑 .env 文件，配置数据库、Redis、MinIO 等信息
```

7. **运行数据库迁移**
```bash
cd src/backend
alembic upgrade head
```

8. **启动服务**
```bash
# 启动后端
cd src/backend
uvicorn app.main:app --reload

# 启动前端
cd src/frontend
npm run dev

# 启动 Celery Worker（新终端）
cd src/backend
celery -A app.celery_app worker --loglevel=info
```

## 📁 项目结构

```
visual-vloger/
├── src/
│   ├── backend/          # FastAPI 后端服务
│   │   ├── app/
│   │   │   ├── api/      # API 路由
│   │   │   ├── core/     # 核心配置
│   │   │   ├── models/   # 数据库模型
│   │   │   ├── schemas/  # Pydantic 模型
│   │   │   ├── services/ # 业务逻辑
│   │   │   └── utils/    # 工具函数
│   │   ├── tests/        # 测试
│   │   └── alembic/      # 数据库迁移
│   ├── frontend/         # Vue 前端应用
│   │   ├── src/
│   │   │   ├── components/
│   │   │   ├── views/
│   │   │   ├── stores/
│   │   │   ├── api/
│   │   │   └── assets/
│   │   └── public/
│   └── ai-services/      # AI 模型服务
│       ├── wan2.2-service/
│       └── opentts-service/
├── tests/                # 集成测试
├── docs/                 # 文档
├── scripts/              # 工具脚本
├── docker-compose.yml    # Docker Compose 配置
├── .env.example          # 环境变量模板
└── README.md             # 项目说明
```

## 🔧 开发指南

### 后端开发

```bash
# 运行开发服务器
cd src/backend
uvicorn app.main:app --reload

# 运行测试
pytest

# 代码格式化
black app/
isort app/

# 类型检查
mypy app/
```

### 前端开发

```bash
# 运行开发服务器
cd src/frontend
npm run dev

# 构建生产版本
npm run build

# 代码格式化
npm run format

# 类型检查
npm run type-check
```

### AI 模型服务

```bash
# 测试 Wan2.2 模型
python scripts/test_wan2.2.py

# 测试 OpenTTS
python scripts/test_opentts.py
```

## 📚 文档

- [API 文档](docs/api.md)
- [部署指南](docs/deployment.md)
- [开发指南](docs/development.md)
- [架构设计](docs/architecture.md)

## 🤝 贡献

欢迎贡献！请查看 [贡献指南](CONTRIBUTING.md)

## 📄 许可证

本项目采用 MIT 许可证 - 查看 [LICENSE](LICENSE) 文件了解详情

## 🙏 致谢

- [Wan2.2](https://github.com/Wan-Video/Wan2.2) - 视频生成模型
- [OpenTTS](https://github.com/synesthesiam/opentts) - 语音合成
- [FastAPI](https://fastapi.tiangolo.com/) - 后端框架
- [Vue 3](https://vuejs.org/) - 前端框架