# 多模态AI应用平台(深绘智创) **Repository Path**: yumeyo/dreamwork2 ## Basic Information - **Project Name**: 多模态AI应用平台(深绘智创) - **Description**: 本项目旨在构建一个基于SD-LoRA模型的校园图片生成系统,通过拍摄学校各个场景的图片训练LoRA模型,实现定制化的校园图片生成功能。后端负责处理AI请求、图片生成和模型管理,为前端提供强大的支持。 - **Primary Language**: Python - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-04-24 - **Last Updated**: 2025-06-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 深绘智创 校园图片生成系统 本系统是一个集成了DeepSeek大模型API与Stable Diffusion(SD)LoRA微调能力的多模态AI平台。用户可通过对话与AI互动,自动生成适合校园场景的图片,并可根据需求训练和调用LoRA模型,生成特定风格的校园图片。系统支持普通对话、智能绘画、参数自定义、历史记录管理等功能,适用于智慧校园、教育AI、创意设计等场景。 ![Image Description](./assets/前端界面.png) ## 项目概述 1. AI对话与推理 • 支持基于DeepSeek API的自然语言对话,分为普通对话和深度推理两种模式。 • 可流式返回AI推理过程,提升交互体验。 2. 智能绘画与参数生成 • 用户输入绘画需求,系统自动调用DeepSeek生成SD绘画参数(prompt、负面prompt、尺寸、风格、LoRA标签等)。 • 支持高级参数自定义,满足不同绘画需求。 3. SD图片生成与LoRA模型调用 • 自动将DeepSeek生成的参数传递给SD训练器,调用LoRA模型生成校园场景图片。 • 支持动漫、真实等多种风格,自动切换LoRA模型。 4. 历史记录与会话管理 • 支持对话与绘画历史的保存、查询、删除。 • 前端可展示历史记录,便于用户回溯与复用。 5. 多页面前端交互 • 首页、对话页、绘画页分离,界面美观,交互友好。 • 支持图片预览、下载、参数展示等功能。 ## 项目结构 ``` sd-lora-campus/ ├── frontend/ # 前端代码 (Flask模板和静态资源) ├── backend/ # 后端代码 (Flask应用和模型管理) ├── assets/ # 项目设计资源 │ ├── frontend_mockup_description.md # 前端界面设计说明 │ └── backend_architecture_description.md # 后端架构设计说明 ├── docs/ # 项目文档 │ ├── 前端任务书.md # 前端开发任务详情 │ └── 后端任务书.md # 后端开发任务详情 └── README.md # 项目说明文档 ``` ## 功能特点 - **友好的聊天界面**:类似DeepSeek的现代设计 - **流式响应**:AI回复逐字显示,提供更好的体验 - **批量图片生成**:支持一次生成多张图片 - **参数控制**:支持调整生成参数(分辨率、步数等) - **历史记录**:保存和恢复历史会话 - **多轮对话**:支持在同一会话中连续交互 - **校园LoRA模型**:定制化训练的校园场景模型 ## 技术栈 ### 前端 - Flask模板系统 - HTML/CSS/JavaScript - WebSocket (用于流式响应) ### 后端 - Python - Flask - Stable Diffusion - LoRA训练框架 - WebSocket服务 ## 开发指南 详细的开发指南请参考以下文档: - [前端任务书](./前端任务书.md) - [后端任务书](./后端任务书.md) - [样例场景](./assets/sample_scenarios.md) ## 数据收集指南 为了训练高质量的校园LoRA模型,需要收集以下场景的图片: 1. **教学楼**:外观、走廊、教室内部 2. **图书馆**:外观、阅览室、书架区域 3. **操场/运动场**:全景、跑道、体育活动场景 4. **食堂/餐厅**:内部环境、用餐场景 5. **校园景观**:主干道、绿地/花园、校门 每个场景建议收集20-30张高质量图片,尽量在不同时间、不同角度拍摄。 ## 启动项目 ### 安装依赖 ```bash # 安装前端依赖 cd frontend pip install -r requirements.txt # 安装后端依赖 cd ../backend pip install -r requirements.txt ``` ### 运行项目 ```bash # 启动后端服务 cd backend python app.py # 前端已集成在后端服务中,访问 http://localhost:5000 即可 ``` ## 联系方式 如有任何问题或建议,请联系项目负责人。