# 电影票房大数据分析系统 **Repository Path**: jypiot_admin/OmniReel ## Basic Information - **Project Name**: 电影票房大数据分析系统 - **Description**: 基于Django的电影票房大数据分析系统,提供数据抓取、分析与可视化功能,助力电影行业决策。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-05-23 - **Last Updated**: 2025-05-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # OmniReel - 电影数据管理与分析系统 OmniReel 是一个基于 Django 的电影数据爬取、存储与分析平台,实现了从豆瓣电影 Top250 爬取电影数据的功能,并提供了数据分析与可视化展示。 ## 项目功能 - 从豆瓣电影 Top250 爬取电影数据 - 电影数据的存储和管理 - 电影列表展示,支持分页、排序和筛选 - 电影详情展示 - 电影数据分析(评分分布、类型分布、国家/地区分布、年代趋势等) - 数据分析结果可视化展示 - 美化的管理界面 - 大数据处理:支持 HDFS 存储和分析 ## 技术栈 - **后端框架**: Django 5.2+ - **前端框架**: Bootstrap 5 - **数据爬取**: Beautiful Soup 4, Requests - **数据分析**: PySpark, Pandas, NumPy - **数据可视化**: Matplotlib - **管理界面美化**: django-admin-interface - **大数据处理**: Hadoop/HDFS, PySpark ## 安装和运行 ### 环境要求 - Python 3.8+ - pip ### 安装步骤 1. 克隆仓库 ```bash git clone https://github.com/your-username/OmniReel.git cd OmniReel ``` 2. 创建并激活虚拟环境(推荐) ```bash python -m venv .venv source .venv/bin/activate # Linux/Mac .venv\Scripts\activate # Windows ``` 3. 安装依赖 ```bash pip install -r requirements.txt ``` 4. 数据库迁移 ```bash python manage.py makemigrations python manage.py migrate ``` 5. 爬取电影数据 ```bash python manage.py crawl_douban_top250 ``` 6. 创建管理员账号(可选) ```bash python manage.py createsuperuser ``` 7. 运行开发服务器 ```bash python manage.py runserver ``` 8. 访问网站:http://127.0.0.1:8000/ 访问管理后台:http://127.0.0.1:8000/admin/ ## 项目结构 ``` OmniReel/ ├── OmniReel/ # 项目配置目录 ├── movie_crawler/ # 电影爬虫应用 │ ├── management/ # 自定义管理命令 │ ├── migrations/ # 数据库迁移文件 │ ├── admin.py # 管理界面配置 │ ├── models.py # 数据模型 │ ├── urls.py # URL路由 │ ├── utils.py # 工具函数(爬虫) │ └── views.py # 视图函数 ├── data_analysis/ # 数据分析应用 │ ├── migrations/ # 数据库迁移文件 │ ├── admin.py # 管理界面配置 │ ├── models.py # 数据模型 │ ├── urls.py # URL路由 │ ├── analysis.py # 分析工具函数 │ └── views.py # 视图函数 ├── templates/ # 模板文件 │ ├── admin/ # 管理界面自定义模板 │ ├── base.html # 基础模板 │ ├── movie_crawler/ # 电影应用模板 │ └── data_analysis/ # 数据分析应用模板 ├── static/ # 静态文件 │ ├── css/ # CSS文件 │ ├── js/ # JavaScript文件 │ └── images/ # 图片文件 ├── manage.py # Django管理脚本 └── requirements.txt # 项目依赖 ``` ## 特色功能 ### 电影数据分析 系统提供了多种数据分析功能: - 评分分布分析:了解观众对不同电影的评价差异 - 电影类型分布:分析不同类型电影的数量和评分情况 - 国家/地区分布:分析不同国家/地区电影的制作情况 - 年代趋势分析:了解电影行业的历史发展趋势 - 综合分析:多维度交叉分析 ### 大数据处理功能 系统集成了 HDFS(Hadoop 分布式文件系统)数据处理功能: - 支持将 CSV 数据存储到 HDFS - 数据分析模块自动从 HDFS 读取数据 - 基于 PySpark 的大规模数据处理 - 完整的数据处理流水线 #### HDFS 数据处理使用方法 1. 上传数据到 HDFS: ```bash python upload_to_hdfs.py ``` 2. 运行完整数据处理流水线: ```bash python hdfs_data_pipeline.py --full ``` 更多详细信息请查看 [HDFS_DATA_README.md](HDFS_DATA_README.md) ### 美化的管理界面 使用 django-admin-interface 对 Django 管理后台进行了美化,提供了更现代化的用户体验: - 自定义主题 - 更直观的数据展示 - 仪表盘功能 - 快捷操作区域 ## 许可证 MIT ![输入图片说明](readmePngimage.png) ![输入图片说明](readmePng/image.png) ![输入图片说明](readmePng/image.png)