# DSMESP **Repository Path**: renhb912/DSMESP ## Basic Information - **Project Name**: DSMESP - **Description**: 甜味是食物中最重要的味觉之一,食品工业一直在积极地发现新的甜味分子来生产新型甜味剂。传统发掘方法费时费力,效率较低,本研究基于分子的甜味和分子结构相关的假设,利用文献、专利及数据库中的数据,建立甜味、非甜味和甜度数据库,采用随机森林和支持向量机算法建立定性构效关系模型定性预测分子的甜味;采用主成分回归、k最邻近回归、随机森林回归、偏最小二乘回归四种算法建立定量构效关系模型定量 预测甜味分子的甜度。模型建立完成后,联合利用定性和定量模型,发掘食物组分数据库(FooDB)中可能具有甜味的食物成分及其甜度。研究发现,随机森林算法模型的分类效果最好,接受者操作特性曲线下的面积为0.9803;随机森林回归模型的甜度预测效果最好,准确度为0.81,误差均方根为0.84,联用这两个模型在FooDB库中,发现12476个具有成为甜味剂潜力的天然食品组分分子。 - **Primary Language**: R - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2021-04-18 - **Last Updated**: 2021-04-30 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # DSMESP ## 介绍 甜味是食物中最重要的味觉之一,食品工业一直在积极地发现新的甜味分子来生产新型甜味剂。传统发掘方法费时费力,效率较低,本研究基于分子的甜味和分子结构相关的假设,利用文献、专利及数据库中的数据,建立甜味、非甜味和甜度数据库,采用随机森林和支持向量机算法建立定性构效关系模型定性预测分子的甜味;采用主成分回归、k最邻近回归、随机森林回归、偏最小二乘回归四种算法建立定量构效关系模型定量 预测甜味分子的甜度。模型建立完成后,联合利用定性和定量模型,发掘食物组分数据库(FooDB)中可能具有甜味的食物成分及其甜度。研究发现,随机森林算法模型的分类效果最好,接受者操作特性曲线下的面积为0.9803;随机森林回归模型的甜度预测效果最好,准确度为0.81,误差均方根为0.84,联用这两个模型在FooDB库中,发现12476个具有成为甜味剂潜力的天然食品组分分子。 ## 使用说明 ### 模型调用 #### 潜在甜味分子预测 ```R load("./RF_classification.RData") ``` #### 甜味分子甜度预测 ```R load("./RF_Model.RData") ``` #### 潜在甜味物质--番茄红素 ![Image text](番茄红素.png)