# 工程实践 **Repository Path**: baotianyi/engineering-practice- ## Basic Information - **Project Name**: 工程实践 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-05-20 - **Last Updated**: 2021-05-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 项目简介 使用常见的聚类算法以及社区划分算法对给定数据进行分析,以挖掘其内在价值。为了应对以后单机无法应对大量的数据, 所以将算法在分布式框架上进行实现。 # 主要工作 搭建hadoop,spark集群。前期采用Kmeans算法,简洁、并具有较好的效果,但存在收敛慢、需要事先确定参数等缺点。后采用基于图Louvain社区划分算法,进行改进,并把上述算法部署到集群上运行。 # 用例图 ![VS Code + draw.io](images/quickstart.drawio.svg)