作者:孔清清; 宫会丽; 丁香乾; 刘明近红外光谱互信息shapley值遗传算法波长选择
摘要:在近红外光谱分析技术中,建立一个准确、稳健的定量模型至关重要。全光谱建模会增加建模和预测时间,降低模型的稳健性和预测精度,因此有效的变量选择方法对于模型构建至关重要。针对该问题,提出了基于互信息的遗传算法(GAs-MI)对特征变量进行选择,互信息筛选掉大量无关信息和冗余信息,遗传算法进一步选择出高辨别力的特征;并在遗传算法的变异过程中引入Shapley值方法,减少了人为设定参数的随机性。为了验证算法的有效性,选取有代表性的273个烟叶样本为实验材料,随机选择其中182个样本实现对烟叶总烟碱的PLS定量建模,剩余样本作为测试集,以相关系数(R)、交互验证均方差(RMSECV)和预测均方根误差(RMSEP)为模型评价指标。实验结果表明,通过该方法选择的波长建立的模型更加简单、预测能力更强。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社