# sysom2.0 **Repository Path**: wangdong_cmcc/sysom2.0 ## Basic Information - **Project Name**: sysom2.0 - **Description**: 致力于打造一个集主机管理、配置部署、监控报警、异常诊断、安全审计等一系列功能的自动化运维平台。 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: dev_wangdong - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 137 - **Created**: 2024-10-10 - **Last Updated**: 2026-04-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # SysOM 2.0 - 智能运维监控平台 ## 项目简介 SysOM 2.0 是一个面向大规模集群的智能运维监控平台,集主机管理、监控报警、智能诊断、安全审计于一体。 **核心特性:** - 跨平台部署:支持 macOS/Linux 开发环境 - 大模型智能诊断:交互式运维问答与分析 - 本机监控代理:无依赖独立运行 - 安全加固:密码哈希、JWT 环境变量化 --- ## 版本更新记录 ### v2.0 (2026-04) **跨平台部署** - 支持 macOS/Linux 双平台开发环境 - Docker 容器化部署方案 - MariaDB 11.4、Redis 7.2 最新稳定版 **安全加固** - 密码哈希存储(bcrypt) - JWT 密钥环境变量化 - 管理员密码初始化改进 **智能诊断助手** - 大模型驱动的交互式诊断(阿里百炼 glm-5) - 支持运维问题问答与分析 - 结合监控数据智能排查 - 流式响应实时显示 **本机监控代理** - 独立运行的本地监控服务(无需 sysom_utils) - CPU、内存、磁盘、网络实时采集 - 健康评分自动计算 --- ## 环境要求 | 组件 | 版本要求 | |------|---------| | Node.js | v16.x 或 v18.x | | Python | 3.9+ | | Docker | 20.10+ | | Docker Compose | 2.0+ | --- ## 编译与安装 ### 1. 前端编译 ```bash # 安装 Node.js v18(推荐使用 n 版本管理器) brew install n n 18 # 进入前端目录 cd sysom_web # 安装依赖 npm install --legacy-peer-deps # 开发模式运行 npm run dev # 生产构建 npm run build ``` ### 2. 后端服务 后端服务使用 Python,依赖已在各模块的 requirements.txt 中定义。 ```bash # 本机监控代理(独立运行) cd sysom_server/sysom_local_agent python main.py # 端口: 8089 # AI 智能诊断助手 cd sysom_server/sysom_ai_assistant python main.py # 端口: 8090 ``` --- ## 运行方式 ### 方式一:Docker 部署(推荐) ```bash # 启动基础设施服务 cd docker docker-compose -f docker-compose.simple.yml up -d # 查看服务状态 docker-compose -f docker-compose.simple.yml ps # 访问地址 # Grafana: http://localhost:3000 # Prometheus: http://localhost:9090 # 本机代理: http://localhost:8089 ``` ### 方式二:本地开发 ```bash # 1. 启动数据库和 Redis(Docker) docker-compose -f docker/docker-compose.simple.yml up -d mariadb redis # 2. 启动本机监控代理 cd sysom_server/sysom_local_agent /opt/miniconda3/bin/python main.py # 3. 启动 AI 智能助手 cd sysom_server/sysom_ai_assistant /opt/miniconda3/bin/python main.py # 4. 启动前端开发服务器 cd sysom_web npm run dev # 访问 http://localhost:8000 ``` ### 方式三:完整服务链 ```bash # 所有服务启动 docker-compose -f docker-compose.yml up -d # 服务端口映射 # 8000 - 前端 Web # 8080 - API 网关 # 8081 - 用户认证 # 8089 - 本机监控代理 # 8090 - AI 智能助手 # 3000 - Grafana # 9090 - Prometheus ``` --- ## 大模型智能诊断 ### 功能说明 AI 智能诊断助手基于阿里百炼大模型,提供: - 运维问题问答(如 "CPU 使用率 90% 如何排查?") - 结合监控数据的智能分析 - 多轮对话上下文保持 - Markdown 格式化输出 ### 使用方式 **Web 界面:** 访问诊断中心 → 智能助手 Tab **API 调用:** ```bash # 同步对话 curl -X POST http://localhost:8090/api/v1/ai/chat/sync \ -H "Content-Type: application/json" \ -d '{"message": "服务器内存不足如何排查?"}' # 流式对话 curl -X POST http://localhost:8090/api/v1/ai/chat \ -H "Content-Type: application/json" \ -d '{"message": "如何分析 IO 延迟问题?"}' ``` ### 配置说明 环境变量配置: ```bash # 大模型 API 配置 export LLM_API_KEY="your-api-key" export LLM_BASE_URL="https://coding.dashscope.aliyuncs.com/v1" export LLM_MODEL="glm-5" ``` --- ## 核心功能模块 ### 监控中心 - 多维度指标采集(CPU、内存、磁盘、网络) - Prometheus + Grafana 可视化 ### 智能诊断 - 一键诊断:触发诊断任务,自动收集系统信息 - AI 助手:大模型交互式问答 - 故障定位:使用标准 Linux 工具分析 ### 安全审计 - 操作日志审计 - CVE 漏洞扫描 - 权限变更追踪 ### 主机管理 - 主机批量导入与管理 - Agent 预部署模式 - 实时状态监控 --- ## API 接口 ### 本机监控代理 (8089) | 接口 | 说明 | |------|------| | GET /api/v1/local/host/info | 获取主机信息 | | GET /api/v1/local/metrics/current | 获取实时监控指标 | | GET /api/v1/local/metrics/health-score | 获取健康评分 | | GET /api/v1/local/health/check | 健康检查 | ### AI 智能助手 (8090) | 接口 | 说明 | |------|------| | POST /api/v1/ai/chat | 流式对话 | | POST /api/v1/ai/chat/sync | 同步对话 | | POST /api/v1/ai/diagnosis/analyze | 智能诊断分析 | --- ## 安全配置 ```bash export JWT_SECRET_KEY="your-32-char-secret-key" export SYSOM_ADMIN_PASSWORD="your-admin-password" export MYSQL_PASSWORD="your-mysql-password" ``` --- ## 文档索引 - [核心服务清单](CORE_SERVICES.md) - 服务端口与功能对照 - [开发指南](docs/develop_guide.md) - 微服务开发、框架使用 - [用户手册](docs/user_manual.md) - 功能使用说明 --- ## 许可证 本项目基于 Apache 2.0 许可证开源。