近红外光谱技术检测石榴汁中花色苷含量

2015-02-22 01:24赵武奇乔瑶瑶王晓琴张清安
关键词:近红外光谱支持向量机

赵武奇, 乔瑶瑶, 王晓琴, 张清安

(陕西师范大学 食品工程与营养科学学院, 陕西 西安 710119)



近红外光谱技术检测石榴汁中花色苷含量

赵武奇,乔瑶瑶,王晓琴,张清安

(陕西师范大学食品工程与营养科学学院,陕西西安710119)

摘要:以不同产地的石榴汁样品为对象,对其近红外光谱数据进行预处理并通过小波变化处理提取光谱特征,采用遗传算法对支持向量机的三个参数进行优化,建立基于近红外光谱技术与支持向量机的石榴汁中花色苷含量检测模型。结果表明,模型对验证集的均方根误差为0.019766,决定系数为0.9992,模型预测性能良好。近红外光谱技术可用于石榴汁中花色苷含量的定量检测。

关键词:近红外光谱;石榴汁;花色苷;支持向量机

石榴汁含有丰富的糖、酸、抗坏血酸、维生素B、果胶、单宁等营养物质[1],是一种越来越受到消费者欢迎的高档饮品。石榴汁中花色苷是一种天然色素,具有消炎、抗癌、预防肥胖等生理功能[2-3],在食品和化妆品等领域有很好的发展前景[4],但石榴汁中花色苷受光照、pH值、氧气等因素影响较大,使其抗氧化性能下降[5-6]。花色苷决定石榴汁的色泽,是石榴汁的重要商品性状,是消费者判定其品质的重要外在标志[1]。目前花色苷的定量分析方法主要有单一pH法、pH示差法、差减法等[7],这些方法都要用到化学试剂,繁琐又费时,因此寻求简便、经济而又有效的花色苷分析方法具有较实际的意义。近红外光谱(NearInfraredSpectroscopy,NIR)分析技术是一项高效、快速、无损、绿色的定性定量分析技术,已广泛应用于石油化工、农业、制药、食品、烟草工业、生命科学以及环境保护等领域[8]。近年来,在果汁近红外光谱无损检测方面,已开展了月桂果汁酸度[9]、橙汁柠檬酸[10]、杨梅酸度[11]、苹果汁可溶性固形物[12]、红葡萄浆中总花色苷[13]等研究。支持向量机(SupportVectorMachine,SVM)是根据统计学理论提出的一类新型机器学习方法,能够较好地解决小样本、非线性、高维数和局部极小点等众多实际问题[14]。但支持向量机在实际应用中,三个参数的选取没有统一的理论和方法,目前常用的方法实质都是优化搜索的一种过程。遗传算法(GeneticAlgorithm,GA)是以自然选择和遗传理论为基础,将生物进化过程中适者生存规则与群体内部染色体的随机信息交换机制相结合的高效全局寻优搜索算法[15],用于支持向量机模型的参数选择是可行的[16]。文献[17]研究了石榴果实中花色苷的近红外检测技术,本文在此基础上使用遗传算法优化支持向量机的参数,建立石榴汁中花色苷含量检测的支持向量机模型,为石榴汁工业化生产过程中品质控制提供基础。

1材料与方法

1.1 材料与仪器

从石榴园、超市采购不同地区的石榴,进行筛选整理后冷藏保存,原产地包括陕西临潼、四川会理、云南蒙自及新疆和田等国内重要石榴产区。T22型可见分光光度计:上海光谱仪器有限公司;TDLS0—2B台式离心机:上海安亭科学仪器厂;InfraXact多功能近红外光谱仪:瑞典福斯公司。

1.2 样品制备及光谱采集

将石榴洗净,剥皮,榨汁,用两层纱布过滤,将过滤后的石榴汁于1500r/min,离心10min,获得石榴汁96个样品。测量时,将石榴汁样品置于浆状杯中,光谱数据间隔为2nm,每个样品重复扫描30次,通过计算机运行InfraXact光谱仪自带的ISIscan软件,获取石榴的光谱数据并存储。

1.3 成分测量

石榴汁花色苷含量用pH示差法[8]测定。

1.4 异常样品的剔除及样本集的划分

利用马氏距离剔除异常样品:马氏距离超过3.0的被视为异常样品,均被剔除。将剔除异常样品后的样品按样品序号,采用随机法分成定标集和验证集。

1.5 最佳预处理方法的确定

利用WinISI定标软件,对采集的光谱数据进行预处理后建立局部最小二乘法回归模型,以决定系数(R2)和交叉验证误差(SECV)为目标确定最佳的预处理方法。光谱数据预处理方式包括散射校正处理、导数处理和平滑处理。

1.6 支持向量机校正模型的建立

1.6.1光谱数据特征的提取用rbio3.5小波基函数对预处理后的光谱分别进行1—4级处理,提取相应的近似系数作为原始数据的特征矩阵,用以建立支持向量机模型,相关计算采用Matlab7.0软件编程实现。

1.6.2遗传算法优化支持向量机模型的参数将上述提取的近似系数作为输入,石榴汁的花色苷作为输出建立支持向量机模型,以模型对定标集预测的均方根误差(MSE)为适应度函数,径向基函数作为支持向量机的核函数,利用遗传算法优化支持向量机中惩罚因子c、核函数g及不敏感损失函数p3个参数,得出石榴汁中花色苷含量预测的支持向量机模型。遗传优化时群体规模为10,终止条件采用最大进化代数k与最优个体适应值连续保持不变的最大遗传代数Gp相结合的准则,k取100,Gp取10。遗传算法、支持向量机模型算法及相关计算均采用Matlab7.0软件编程实现。

1.6.3模型的验证用1.6.2建立的支持向量机模型对验证集预测,以相关系数和均方误差为指标检验模型的预测能力。

2结果与分析

2.1 异常样品的剔除及样本集划分结果

96个样本中共有2个样本马氏距离超过3.0,作为异常样本被剔除。表1为样本集划分结果,可以看出定标集与验证集的分布比较均匀、合理,具有较好的代表性。验证集样本也都被包容在校正集的空间内,满足建立近红外分析模型的要求。

表1 石榴汁样本集划分结果Tab.1 Diversity results of pomegranate juice samples

2.2 不同预处理方法对建模效果的影响

表2为不同预处理方法对建模效果的影响,表中数学处理方法中第一位数字表示求导的阶数,第二位数字表示做导数处理计算所采用的光谱点间隔数,第三位数字表示平滑处理的间隔点数,第四位数字表示二次平滑处理的间隔数.可以看出,对光谱数据不进行散射处理和数学处理为0011时,RSQ最大,SECV最小,即对光谱数据不进行任何处理时效果最好。

表2 不同散射校正和数学处理方法的建模效果Tab.2 Model result of different scatter correction and math treatment

2.3 小波处理结果

小波变换可把原光谱按不同的分辨率分解成一系列不同频率的块信号,使原光谱每一个波长点的各频率分量一目了然,分解得到的小波系数是原分析信号的主要特征参数,因此可以代表原分析信号的主要特征.用rbio3.5小波基函数对石榴汁光谱进行不同级数的分解,其各级近似集的建模效果如表3所示。可以看出,用2级分解的近似集建立的模型对定标集的均方根误差(MSE)最小,决定系数R2最大。因此选用二级小波分解得到的近似集作为支持向量机的输入向量进行建模。

表3 各级小波处理结果Tab.3 Wavelet processing results of each grade

2.4 遗传算法对支持向量机参数优化结果

遗传算法的优化过程见图1,当遗传代数为100时,满足终止条件,此时适应度最小,为0.11067。得出支持向量机的3个参数值分别为惩罚因子c=5.5302、核函数g=1.0001和不敏感损失函数p=0.010062。

图1 遗传算法适应度曲线Fig.1 GA fitness curve

2.5 支持向量机回归预测效果

建立的模型对验证集的预测结果如表4所示,其相关性见图2。

图2 验证集的预测值与实际值的相关性Fig.2 Correlation between the actual andpredicted values of test samples表4 预测值与实际值的对比Tab.4 The comparision between predictionvalue and actual value

mg/L

可以看出,预测值与实际值绝对误差的绝对值为0.8742~1.0730,预测均方根误差为0.019766,决定系数0.9992,相关系数为0.9995,相关性达到极显著水平(P<0.01).同时进行显著性t检验,查t分布表,当显著性水平α=0.05,自由度f=18时,t0.05,18=2.101,|t|=0.2699

3结论

通过小波变化处理提取石榴汁近红外光谱数据的特征,减少了建模的变量数;采用遗传算法(GA)对支持向量机(SVM)的3个参数进行优化,建立的基于近红外光谱技术与支持向量机的石榴汁中花色苷含量检测模型对验证集的均方根误差为0.019766,决定系数为0.9992,模型预测性能良好。近红外光谱技术可用于石榴汁中花色苷含量的定量检测。

参考文献:

[1]郭松年,董周永,孙海燕,等.石榴汁花色苷热稳定性及其降解动力学研究[J].农业工程学报,2008,24(3):256-259.

[2]李巨秀,张小宁,李伟伟.不同品种石榴花色苷、总多酚含量及抗氧化活性比较研究[J].食品科学,2011,32(23):143-146.

[3]SyedDN,AfaqF,MukhtarH.Pomegranatederivedproductsforcancerchemoprevention[J].SeminarsinCancerBiology,2007(17):377385.

[4]Al-MuammarMN,KhanF.Obesity:Thepreventiveroleofthepomegranate(Punicagranatum)[J].Nutrition,2012,28(6):595-604.

[5]AlighourchiH,BarzegarM.Somephysicochemicalcharacteristicsanddegradationkineticofanthocyaninofreconstitutedpomegranatejuiceduringstorage[J].JournalofFoodEngineering,2009,90(2):179-185.

[6]郭松年,徐驰,刘兴华,等.温度、pH值和光照对石榴汁花色苷稳定性的影响[J].食品与发酵科技,2009,45(5):29-31.

[7]唐琳,李子江,赵磊,等.两种pH值法测定玫瑰花花色苷含量的比较[J].食品科学,2009,30(18):310-313.

[8]刘发龙,马新刚,程福银,等.近红外光谱分析技术在快速分析上的应用[J].分析测试技术与仪器,2008,14(4):241-247.

[9]XieLijuan,YeXingqian,LiuDonghong,etal.Predictionoftitratableacidity,malicacid,andcitricacidinbayberryfruitbynear-infraredspectroscopy[J].FoodResearchInternational,2011,44(7):2198-2204.

[10]岑海燕,何勇,张辉,等.可见光/近红外光谱技术快速测定橙汁柠檬酸含量[J].光谱与光谱学分析,2009,27(9):1747-1750.

[11]邵咏妮,何勇.可见/近红外光谱预测杨梅汁酸度的方法研究[J].红外与毫米波学报2006,25(6):478-480.

[12]陆辉山,应义斌,傅霞萍,等.新鲜苹果汁可溶性固形物含量的傅里叶变换近红外光谱检测[J].光谱与光谱学分析,2007,27(3):494-498.

[13]JanikLJ,CozzolinoD,DambergsR,etal.Thepredictionoftotalanthocyaninconcentrationinred-grapehomogenatesusingvisible-near-infraredspectroscopyandartificialneuralnetworks[J].AnalyticaChimicaActa,2007,594(1):107-118.

[14]吴静珠,王一鸣,张小超,等.支持向量机-近红外光谱法用于真假奶粉的判别[J].农机化研究,2007(1):155-158.

[15]王莹,栾天奇,朴美子.基于神经网络和遗传算法的醋酸发酵培养基优化[J].中国食品学报,2012,12(5):88-93.

[16]付阳,李昆仑.支持向量机模型参数选择方法综述[J].电脑知识与技术,2010,6(28):8081-8082,8085.

[17]王晓琴,赵武奇,褚添天,等.石榴花色苷近红外光谱定量分析模型[J].食品科学,2013,34(13):75-78.

〔责任编辑程琴娟〕

第一作者:徐晓燕,女,硕士,主要研究方向为植物生理。E-mail:xuxiaoyan1986@stu.snnu.edu.cn.

Studyondeterminationofanthocyanincontentinpomegranatejuice

bynearinfraredspectroscopy

ZHAOWuqi,QIAOYaoyao,WANGXiaoqin,ZHANGQingan

(SchoolofFoodEngineeringandNutritionalScience,Shaanxi

NormalUniversity,Xi′an710119,Shaanxi,China)

Abstract:Pomegranatejuicesfromdifferentoriginswereservedasthesample.Preprocessingmethodofnearinfraredspectroscopydataweredeterminedandthefeaturewereextractedbywaveletanalysis.Thethreeparametersofsupportvectormachine(SVM)wereoptimizedbygeneticalgorithms(GA).Themodelfordeterminationofanthocyanincontentinpomegranatejuicebynearinfraredspectroscopyandsupportvectormachinewasestablished.Theresultshowedthatthemodelhadthepredicationperformance,therootmeansquareerrorofthevalidationandthedeterminationcoefficientswere0.019766and0.9992.Near-infraredspectroscopytechnologycouldbeusedforthequantitativedetectionofanthocyanincontentinpomegranatejuice.

Keywords:nearinfraredspectroscopy;pomegranatejuice;anthocyanin;supportvectormachine

通信作者:*惠伟,女,副教授。E-mail:huihui@snnu.edu.cn

基金项目:国家农业科技成果转化资金项目(2013GB23600662);陕西省科技攻关项目(2012NKC01-22)

收稿日期:2013-12-13

doi:10.15983/j.cnki.jsnu.2015.02.124

文章编号:1672-4291(2015)02-0103-06

中图分类号:S665.4

文献标志码:A

猜你喜欢
近红外光谱支持向量机
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于近红外光谱法的藜麦脂肪含量快速检测
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
利用油水稳定化和支持向量回归增强近红外光谱测定油中水分的方法
基于一元线性回归的近红外光谱模型传递研究