# visual-vlogger **Repository Path**: mazingan/visual-vlogger ## Basic Information - **Project Name**: visual-vlogger - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-03-06 - **Last Updated**: 2026-03-06 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Visual Vlogger - 数字人直播内容制作平台 基于 AI 视频生成技术的数字人直播内容制作和管理平台,支持从文案创作到视频发布的全流程自动化。 ## 📋 项目概述 **核心功能**: - 数字人形象上传与管理 - 文案编辑器 - 文本转语音(OpenTTS) - 视频生成(Wan2.2-TI2V-5B) - 视频预览与下载 - 内容管理 **技术栈**: - 前端: Vue 3 + TypeScript + Vite + Pinia + Element Plus - 后端: FastAPI + SQLAlchemy + Celery + Redis - 数据库: PostgreSQL - 消息队列: Redis + Celery - 文件存储: MinIO - AI 服务: Wan2.2-TI2V-5B + OpenTTS - 部署: Docker Compose ## 🚀 快速开始 ### 环境要求 - Python 3.10+ - Node.js 18+ - Docker & Docker Compose - NVIDIA GPU (推荐 RTX 4070 Ti 或更高,16GB+ 显存) - CUDA 11.8+ ### 安装步骤 1. **克隆仓库** ```bash git clone cd visual-vloger ``` 2. **启动基础服务** ```bash docker-compose up -d postgres redis minio ``` 3. **安装后端依赖** ```bash cd src/backend python -m venv venv source venv/bin/activate # Linux/Mac # or: venv\Scripts\activate # Windows pip install -r requirements.txt ``` 4. **安装前端依赖** ```bash cd src/frontend npm install ``` 5. **下载 AI 模型** ```bash # Wan2.2-TI2V-5B huggingface-cli download Wan-AI/Wan2.2-TI2V-5B --local-dir ./models/wan2.2-ti2v-5b # OpenTTS 模型(根据需要选择) ``` 6. **配置环境变量** ```bash cp .env.example .env # 编辑 .env 文件,配置数据库、Redis、MinIO 等信息 ``` 7. **运行数据库迁移** ```bash cd src/backend alembic upgrade head ``` 8. **启动服务** ```bash # 启动后端 cd src/backend uvicorn app.main:app --reload # 启动前端 cd src/frontend npm run dev # 启动 Celery Worker(新终端) cd src/backend celery -A app.celery_app worker --loglevel=info ``` ## 📁 项目结构 ``` visual-vloger/ ├── src/ │ ├── backend/ # FastAPI 后端服务 │ │ ├── app/ │ │ │ ├── api/ # API 路由 │ │ │ ├── core/ # 核心配置 │ │ │ ├── models/ # 数据库模型 │ │ │ ├── schemas/ # Pydantic 模型 │ │ │ ├── services/ # 业务逻辑 │ │ │ └── utils/ # 工具函数 │ │ ├── tests/ # 测试 │ │ └── alembic/ # 数据库迁移 │ ├── frontend/ # Vue 前端应用 │ │ ├── src/ │ │ │ ├── components/ │ │ │ ├── views/ │ │ │ ├── stores/ │ │ │ ├── api/ │ │ │ └── assets/ │ │ └── public/ │ └── ai-services/ # AI 模型服务 │ ├── wan2.2-service/ │ └── opentts-service/ ├── tests/ # 集成测试 ├── docs/ # 文档 ├── scripts/ # 工具脚本 ├── docker-compose.yml # Docker Compose 配置 ├── .env.example # 环境变量模板 └── README.md # 项目说明 ``` ## 🔧 开发指南 ### 后端开发 ```bash # 运行开发服务器 cd src/backend uvicorn app.main:app --reload # 运行测试 pytest # 代码格式化 black app/ isort app/ # 类型检查 mypy app/ ``` ### 前端开发 ```bash # 运行开发服务器 cd src/frontend npm run dev # 构建生产版本 npm run build # 代码格式化 npm run format # 类型检查 npm run type-check ``` ### AI 模型服务 ```bash # 测试 Wan2.2 模型 python scripts/test_wan2.2.py # 测试 OpenTTS python scripts/test_opentts.py ``` ## 📚 文档 - [API 文档](docs/api.md) - [部署指南](docs/deployment.md) - [开发指南](docs/development.md) - [架构设计](docs/architecture.md) ## 🤝 贡献 欢迎贡献!请查看 [贡献指南](CONTRIBUTING.md) ## 📄 许可证 本项目采用 MIT 许可证 - 查看 [LICENSE](LICENSE) 文件了解详情 ## 🙏 致谢 - [Wan2.2](https://github.com/Wan-Video/Wan2.2) - 视频生成模型 - [OpenTTS](https://github.com/synesthesiam/opentts) - 语音合成 - [FastAPI](https://fastapi.tiangolo.com/) - 后端框架 - [Vue 3](https://vuejs.org/) - 前端框架