# 糖尿病数据集分类器练习 **Repository Path**: d___y/second_job.ipynb ## Basic Information - **Project Name**: 糖尿病数据集分类器练习 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2018-07-28 - **Last Updated**: 2020-12-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 糖尿病数据集分类器练习 #### 项目介绍 在Pima Indians Diabetes Data Set(皮马印第安人糖尿病数据集)进行分类器练习。 需要提交代码文件,并给出必要的结果解释。 1) 训练数据和测试数据分割(随机选择20%的数据作为测试集);(10分) 2) 适当的特征工程(及数据探索);(10分) 3) Logistic回归,并选择最佳的正则函数(L1/L2)及正则参数;(30分) 4) 线性SVM,并选择最佳正则参数,比较与Logistic回归的性能,简单说明原因。(20分) 5) RBF核的SVM,并选择最佳的超参数(正则参数、RBF核函数宽度);(30分)