近红外光谱和人工神经网络的金苦荞氨基酸快速测定

2022-01-12 00:19朱丽伟严金欣石桃雄李洪有陈庆富陈其皎
光谱学与光谱分析 2022年1期
关键词:赖氨酸苦荞荞麦

朱丽伟,严金欣,黄 娟,石桃雄,蔡 芳,李洪有,陈庆富,陈其皎

贵州师范大学荞麦产业技术研究中心,贵州 贵阳 550001

引 言

荞麦属于蓼科荞麦属的一年生草本双子叶植物,因生育期短、抗逆性强,在农业生产中经常用来补种。金荞麦是一种传统中药材,研究发现金荞麦根茎活性成分通过抑制肿瘤细胞增殖和迁移,诱导肿瘤细胞凋亡和自噬等作用而抑瘤,同时还有清热解毒、消炎抗菌等功效[1-2]。金苦荞是金荞麦与苦荞杂交而培育的新型荞麦,特征介于双亲之间,再生力强[3],春季主要进行营养生长,生产大量苦荞叶。研究发现荞麦叶发酵茶可提高小鼠免疫功能,还具有防治急、慢性炎症的功能[4-7]。荞麦籽粒中还含有丰富的蛋白质,其蛋白质中必需氨基酸含量充足,富含谷类作物中比较缺乏的赖氨酸,使其具有较高的营养价值。本实验室前期的研究发现,荞麦叶中各营养成分比籽粒中含量更高[3],因此金苦荞叶片有极大研究开发价值。

目前常用的氨基酸测定方法预处理复杂、耗时长、价格昂贵。陶琳丽等研究发现,20种氨基酸在1 000~2 502 nm区域有非常明显的近红外光谱吸收且差异显著[8],这为利用近红外技术建立检测模型提供了可能性。Chang等[9]利用傅里叶变换-近红外分析技术建立了可快速测定菊花谷氨酸、天门冬酰胺和天冬氨酸的模型。通常采用偏最小二乘法(partial least squares,PLS)、主成分回归(principal component regression,PCR)、人工神经网络(artificial neural network,ANN)等化学计量学算法建立识别模型,我们前期应用线性相关系统的PCR法和PLS法尝试建立模型,所建立的模型维度太高,限制其应用。Viyona等[10]利用近红外光谱技术检测百香果中脂肪的方法,预处理光谱后,建立的前反馈(back propagation,BP)人工神经网络模型平均方差高达0.959。因此本工作选用BP人工神经网络算法建立金苦荞氨基酸的近红外光谱预测模型,从内部交叉验证平均相对误差(RSD)和相关系数(R2)等评价指标来看,多数氨基酸预测模型取得了令人满意的效果。

1 实验部分

1.1 材料

样品荞麦自交系叶片粉碎样采自贵州省贵阳市乌当区贵州师范大学荞麦中心实验基地,为得到化学值差异较大的样品,种植了85份遗传性状已稳定的金苦荞自交系,常规栽培管理,选择生长较为一致的植株,在其开花前采收上三叶、中三叶和下三叶,共255份样品,将其分别放于纸袋中,先于鼓风机105 ℃杀青,然后80 ℃烘24 h,然后使用高速粉碎机粉碎并过100目筛,备用。

1.2 方法

1.2.1 光谱采集与预处理

采用德国布鲁克光谱仪器公司生产的MPA傅里叶变换近红外光谱仪,OPUS光谱采集软件。采用漫反射的方法,扫描样品的近红外光谱,单次扫描64次,分辨率4 cm-1,扫描范围4 000~12 000 cm-1,每个样品均扫描多次,取平均光谱进行计算。原始谱数据中不仅包含与样品有关的信息,还包含各种干扰和无效信息,影响所建模型的可靠性。为降低仪器噪声和系统误差以提升光谱中的有效信息率,在建模前对原始光谱进行了数据预处理。本实验利用光谱分析软件OPUS执行自动优化程序,确定各组分建模的谱区范围和最佳预处理方法。

1.2.2 氨基酸的测定

参考程勇杰等的方法测定氨基酸的含量[11],略有改进。具体方法如下:称取0.100 0 g叶片粉末放于干净的水解管,加入6 mol·L-1盐酸15 mL,使用氮吹的方法清除管内氧气后封口。然后将水解管放于烘箱中,调整温度慢慢升至110 ℃后开始计时,水解24 h关机。取出冷却后的水解管,将水解液轻轻转移至50 mL容量瓶,去离子水冲洗水解管,冲洗液也倒入容量瓶,定容后混匀,然后吸取滤液1 mL,使用旋转蒸发仪慢慢蒸干,再用1 mL pH 2.2柠檬酸钠缓冲液溶解,滤膜过滤后上机,所用仪器为日立L-8900氨基酸自动分析仪。

1.2.3 数据处理

采用Matlab_R2014b分析软件,在iMac Pro(2017)计算机上进行模型的建设。为了验证模型的性能,使用了交叉验证(cross-validation)的方法,根据模型的R2和RSD,选择最佳模型。当RSD小于10%时表明模型效果良好,预测精度较高,建立的模型可用。

2 结果与讨论

2.1 金苦荞叶片氨基酸含量

实验发现样品中氨基酸的含量差异较大(表1),其中差异最明显的是必需氨基酸中的甲硫氨酸,所测样品的含量最低值为0.308 mg·g-1,最高值达3.049 mg·g-1,后者是前者的9.9倍;其次是非必需氨基酸中的酪氨酸,所测样品中含量最低为0.176 mg·g-1,最高达1.173 mg·g-1,后者是前者的6.7倍。说明所用建模样品间化学值差异明显的可满足建模需要。赖氨酸被称为谷物第一限制性氨基酸,高立成等(2019)研究发现,普通苦荞西农9904和黔苦3号籽粒的赖氨酸含量分别为3.4和4.5 mg·g-1,萌发期其籽粒赖氨酸含量分别升至3.8和5.2 mg·g-1,Bhinder等研究不同品种苦荞粉中氨基酸的含量,发现苦荞粉中赖氨酸含量的最高值为6.55 mg·g-1,其他必需氨基酸如缬氨酸、异亮氨酸、苏氨酸和亮氨酸的含量最高值分别是3.5,2.55,8.79和12.4 mg·g-1,均远低于本实验中金苦荞叶片赖氨酸的含量[12-13],证明金苦荞叶片具有极高的营养价值和开发潜力。

表1 金苦荞叶片氨基酸含量化学测定结果Table 1 Contents of amino acid in golden tartary buckwheat leaves using chemical method

2.2 网络结构

隐层节点数的选择与研究项目的要求、输入-输出节点的多少存在着直接的关系,其数目太少会使网络不能收敛,造成网络不能正确预测未知样本,容错性差,但太多又易造成网络学习时间过长及过拟合现象的出现。一般隐层节点数是远小于训练样本数的。通过调整输入层、隐层的节点数可以优化网络结构。经过多次预测模型的建立,得到了相关系数较高的结果,其网络结构为(1102-9-1)。

2.3 数据归一化

为了提高建模效率,需要预处理光谱数据,常用的方法有一阶导数、二阶导数、矢量归一等。按照4∶1的比例将化学值和光谱值随机生成训练集和测试集后,在处理的过程中发现光谱值以及化学值的特征值未在[0,1]的范围内,遂对其进行数据归一化处理。接着创建9个隐含层神经元的神经网络,并设置迭代次数为1 000、MSE均方根误差范围为[0,1×10-3]即[0,0.001]以及学习率为0.01。开始训练网络。训练完成后进行仿真测试和数据的反归一化,进而进行性能评价,测试相对误差以及决定系数。

2.4 模型的分析及评价

采用人工神经网络建模的方法对17种氨基酸进行了数学建模后,可直观的看出运用近红外光谱模型对未知样品的预测效果,预测化学值与真实值的相关性及其精确度的提升空间。现对建立的17种氨基酸数学模型进行分析。

2.4.1 必需氨基酸的建模效果

从图1和表2可知,7种必需氨基酸的近红外模型预测值与真实值的R2均在0.90以上,其中苯丙氨酸、亮氨酸、苏氨酸、缬氨酸、异亮氨酸和赖氨酸近红外模型测试过程,其预测值与真实值的RSD均低于10%,模型可用。

甲硫氨酸近红外模型的预测效果如图1(b)和表2所示,从测试结果可知,供试样品的真实值和预测值的R2虽然较高,达到0.914 9,然而参与测试的10组数据RSD达到25.98%,误差太大,模型不可用。

图1 必需氨基酸的近红外模型仿真测试效果(a):苯丙氨酸;(b):甲硫氨酸;(c):亮氨酸;(d):苏氨酸;(e):缬氨酸;(f):异亮氨酸;(g):赖氨酸Fig.1 Simulation results of near-infrared model of essential amino acids(a):Phenylalanine;(b):Methionine;(c):Leucine;(d):Threonine;(e):Valine;(f):Isoleucine;(g):Lysine

2.4.2 非必需氨基酸的建模效果

从表2和图2可知,天冬氨酸和精氨酸的建模效果最好,其模型真实值与预测值的R2均大于0.97,天冬氨酸模型仿真测试的10组数据,其RSD值为6.67%[图2(c)];参与精氨酸模型测试的10组数据,其RSD为4.22%[图2(e)],两种模型均较优秀。

从表2和图2还可知,丝氨酸、丙氨酸、组氨酸、甘氨酸和酪氨酸模型的预测值与真实值R2均较高,达到0.90以上,且仿真测试过程,5种氨基酸模型的RSD均低于10%,模型较好。脯氨酸模型的仿真测试中,应试样品真实值与预测值的R2为0.899 1,稍低于其他氨基酸模型,10组供试数据的RSD为7.86%,模型也可用。

半胱氨酸近红外模型的预测效果如表2和图2(b)所示,可知应试样品的预测值与真实值差异较大,二者的R2只有0.788 0,且10组数据的RSD为33.23%,该模型预测结果不理想,有待进一步研究,可设计更加精细的实验,使用代表性更强的样品,获得更加精准的化学值和光谱值数值,另外,采用更加合适的算法与光谱预处理方法,以达到更好的建模效果。

图2 非必需氨基酸的近红外模型仿真测试效果(a):谷氨酸;(b):半胱氨酸;(c):天冬氨酸;(d):丝氨酸;(e):精氨酸;(f):丙氨酸;(g):组氨酸;(h):甘氨酸;(i):脯氨酸;(j):酪氨酸Fig.2 Near infrared simulation of non-essential amino acids(a):Glutamic acid;(b):Cysteine;(c):Aspartic acid;(d):Serine;(e):Arginine;(f):Alanine;(g):Histidine;(h):Glycine;(i):Proline;(j):Tyrosine

表2 氨基酸近红外模型仿真测试效果Table 2 Simulation results of near-infrared model of amino acids

3 结 论

通过对苦荞叶氨基酸含量的测定,可知叶中的氨基酸,特别是必需氨基酸的含量远高于荞麦籽粒,使其具有极高的营养价值。常规氨基酸测定方法限制了高氨基酸苦荞的育种与开发工作。本文建立的17种氨基酸的非线性预测模型中,精氨酸和天冬氨酸建模效果较好,预测值与真实值R2均高于0.97,其RSD均低于7%;另外丙氨酸、苯丙氨酸、甘氨酸、谷氨酸、精氨酸、赖氨酸、酪氨酸、亮氨酸、丝氨酸、苏氨酸、缬氨酸、脯氨酸、异亮氨酸和组氨酸的模型预测值与真实值的R2均大于0.85,RSD均低于10%,可用于氨基酸的预测工作;而甲硫氨酸和半胱氨酸的近红外模型,RSD均大于10%,模型不可用,这两种氨基酸的近红外光谱非线性预测模型还需要进一步研究。

猜你喜欢
赖氨酸苦荞荞麦
红山荞麦看木森
我国科学家发现荞麦属新种
苦荞
荞麦
苦荞花
荞麦花开
2015年赖氨酸市场回顾及2016年趋势展望
2013年赖氨酸市场回顾及2014年趋势展望
苦荞黄酮的纯化及抗氧化活性的研究
2012年国内赖氨酸市场分析