开端:食物科学网
油茶籽油(CAO)富含VE、植物甾醇、角鲨烯、多酚等多种自然抗氧化剂和活性物资,有“东方橄榄油”之称。由于CAO的市集价钱相对较高,导致市集上坐法商贩用廉价食用植物油掺伪CAO冒充纯CAO出售。算作一种新兴的无损快速检测期间,低场核磁共振(LF-NMR)分析期间在食用油品性分析边界应用凡俗。撑握向量机(SVM)是一种基于结构风险最小化和统计学习表面的机器学习模子。SVM不仅具有邃密的泛化才调,且有用幸免了传统分类算法中过学习、维数可怜、局部极小化等裂缝,因而在小样分内类中获得凡俗应用。
上海理工大学健康科学与工程学院的林晓浪、傅利斌、王欣*等将LF-NMR检测期间与SVM分析智力相都集,在对CAO、几种通俗/氧化植物油及多种二元掺兑油样进行LF-NMR弛豫特点商议及主因素分析(PCA)的基础上,以ReliefF算法进行特征筛选,减少数据冗余;基于LF-NMR弛豫特征和PCA诡计SVM分类器,以收场更高效、更智能的CAO掺伪鉴识。商议可为LF-NMR都集化学计量学智力应用于CAO保真检测提供参考。
1 不同油样的LF-NMR弛豫特点
1.1 CAO的LF-NMR图谱
图2A标明,各品牌CAO的T2衰减弧线险些叠加,均以最大信号幅度(6 275.95±111.41)运转衰减并在1 300 ms傍边衰减弥散。图2B中,CAO的单组分图谱(T2W)散播在106.55~112.35 ms,互异较小,图2C的多组分弛豫图谱均呈典型双峰散播,其中,T21峰位于5.13~15.69 ms,T22峰位于31.23~449.57 ms。各品牌的LFNMR特点相符度较高,这是由于食用油的LF-NMR弛豫特点与其脂肪酸碳链长度和主要脂肪酸含量密切关联,这有助于后续与其他植物油及掺伪样品辞别。
1.2 氧化/通俗植物油的LF-NMR图谱
图3A标明,OxiCOO衰延缓率最快,源头衰减弥散;SUO的衰延缓率最小,衰减弥散所需时候最长;其余样品均介于SUO和OxiCOO之间,从上往下顺序是SOO、OxiSUO、COO、OxiSOO、CAO。图3B的单组分弛豫图谱也标明,SUO的T2W(143.14 ms)最大,而OxiCOO的T2W(104.26 ms)最小,其他油样的T2W介于SUO和OxiCOO之间。图3C则标明,CAO的多组分图谱与其他6 种油互异彰着,CAO只好T21和T22峰,而其余6 个油样均出现3 个弛豫峰,且与通俗油样比拟,氧化油样的弛豫峰彰着左移。以上恶果标明不同油样的弛豫特点具有一定别离。
1.3 油样LF-NMR弛豫特点的PCA
对7 种氧化/通俗植物油的LF-NMR弛豫特点进行PCA,PC1、PC2孝敬率分别为82.16%和12.94%,累计孝敬率为95.10%,标明这两个PC也曾涵盖了原始数据的绝大部分信息,PCA散播如图4所示。CAO集中散播在图的左下方,其他6 个油样则散播在图的右侧,且具有一定互异,举例OxiCOO散播在图右上侧位置、OxiSUO散播在图的最右侧。PCA恶果标明,基于样品的LF-NMR索取的特征值不错有用辞别CAO和其他植物油及氧化油脂。
2 二元掺兑油样的LF-NMR弛豫特点
2.1 LF-NMR图谱
本商议共对6 个二元掺兑体系进行LF-NMR分析,以CAO+SOO的弛豫特点为例对衰减弧线、单/多组分弛豫图谱进行分析(图5)。图5A标明,CAO的衰减弧线(红色)位于最下方,而SOO的T2衰减弧线位于最上方(蓝色),掺兑比例为10%~90%的CAO+SOO样品则介于二者之间。图5B的单组分图谱中,随二元体系中SOO比例的加多,样品的T2W增大,趋近于SOO。多组分弛豫图谱(图5C)中,掺兑比例为0%~20%时,样品仍推崇为与CAO雷同的双峰结构,当掺兑比例为30%~100%时,则推崇为三峰结构,出现新的T23峰。
图6为其余5 个掺兑体系的多组分弛豫图谱。不错发现,跟着其他油样掺兑比例的加多,样品均会出现T23峰,但这与各体系的掺兑比例密切关联。举例,当SUO比例在10%及以上时,CAO+SUO体系的多组分弛豫图谱推崇为三峰结构,而COO掺兑比例在40%及以上时呈现三峰结构;对氧化油样掺兑的样品而言,当OxiCOO掺兑比例在80%及以上时,CAO+OxiCOO体系的多组分弛豫图谱推崇为三峰结构,而OxiSOO、OxiSUO掺兑比例分别在50%、40%及以上时样品的多组分弛豫图谱呈三峰结构。此外,跟着掺兑比例的加多,3 个二元氧化掺兑体系的多组分弛豫图谱散播均相对左移。
2.2 二元掺兑油样LF-NMR弛豫特点的PCA
进一步对二元掺兑油样LF-NMR弛豫特点进行PCA,发现PC1、PC2的孝敬率分别为76.36%、11.77%,累计孝敬率为88.13%,以样品的PC1、PC2得分画图(图7)。图7A标明,样品散播可分为傍边两部分,左侧样本为CAO和仅有T21、T22两个峰的掺兑油样,右侧样本则为存在T23峰的掺兑油样,这标明T23峰的存在不错算作判别CAO掺假的信息之一。进一步分别对傍边两侧油样进行PCA,恶果如图7B、C所示。图7B中,CAO与掺兑氧化油样(OxiCOO、OxiSOO、OxiSUO)可彰着辞别,但当掺兑较低比例(10%~20%)的COO、SOO时,PCA散播仍有一定混合。图7C标明,掺兑SUO的油样主要散播在左上部分,而掺兑OxiSOO、OxiSUO的油样主要散播在右下部分。
3 SVM二叉树结构诡计
合理的结构诡计能有用镌汰SVM多分类流程中的“舛误累计”,普及模子的分类精度。基于对各油样的LF-NMR弛豫特点的比较及PCA的恶果诡计CAO掺兑识别的SVM二叉树结构分类器,图8中的SVM二叉树分类器由13 个二分类SVM构成,领先通过核函数K1(x1,x2)构建二分类器可收场CAO和掺兑样品的辞别。再基于是否存在T23峰这一显耀特征,以核函数K2(x1,x2)构建二分类器,初步收场低比例和高比例掺兑的辞别。随后,分别以核函数K3(x1,x2)~K13(x1,x2)构建多个二分类顺序收场不同掺兑类型、掺兑比例的辞别。最终形成的分类标签如图8的悉数叶子节点所示(灰色记号部分),认为14 个分类标签,涵盖CAO、掺兑油类型、掺兑比例信息。
4 ReliefF特征数采取
应用ReliefF去除不消要的特征有助于普及模子的分类准确率。以ReliefF算法策动覆按集中16 个LFNMR弛豫特征信息对最终分类标签的艰巨性比肩序,恶果如图9所示。权重不错响应特征与分类标签之间的关联性。图9标明,TS23权重最大(0.43),诠释其在油样的分类中阐扬艰巨作用,而TP21权重最小(0.02),诠释其对样本辞别的孝敬最小。此外,权重排序前3的特征信息(TS23、TE23、TP23)均与T23峰关联,且7 个分类标签(图8旅途a)中均存在T23峰,诠释T23峰弛豫特征的存在有助于CAO掺兑样本的辞别。而权重排序的后3 位(TP21、TS21、TE21)均与T21峰关联,诠释该弛豫峰在油样分类中的作用相对较小。
为了笃定SVM模子的最优特征数,依照特征权重从大到小的礼貌,渐渐加多特征个数并覆按SVM多分类模子,分别策动模子覆按集和考证集的分类准确率,恶果如图10所示。跟着特征数的加多,SVM模子在覆按集和考证集中的分类准确率有一定互异。在覆按集中,跟着特征数的加多,分类准确率渐渐普及,当特征数为10时,覆按集分类准确率最高(92.56%)。继续加多特征数时,分类准确率的变化不彰着。在考证集中,跟着特征数的加多,分类准确率亦呈高潮趋势,并在特征数为9时达到最大(90.77%)。但继续加多特征数时,分类准确率呈下落趋势,并在特征数为16时降至82.05%。诠释特征数从1渐渐加多到9时,涵盖的样本有用信息更为丰富,有助于不同油样的辞别,模子的分类准确率加多。但过多的特征数则会引入冗余特征,加多模子复杂度,导致模子的过拟合。综上,特征数为9时,考证集分类准确率最高,模子险些不存在过拟合。因此,最终保留前9 个LF-NMR弛豫特征进行SVM模子的构建。
5 最优SVM模子分类恶果
以考证集对SVM分类模子的性能进行测试,恶果如图11所示。在CAO的检测识别中,仅有2 个CAO样本被过错分类为低掺兑比例的CAO+SOO(10%~20%),180 个掺假样品均被准确识别,合座分类准确率达到了98.97%(193/195)。这是因为在低比例的掺兑下,含量较高的CAO对LF-NMR弛豫特点影响较大,从而形成了分类困难,在Shi Ting等基于核磁共振波谱进行CAO分析时相似也发现当掺兑比例低于20%时CAO+SOO与CAO辞别困难。
在掺兑类型和比例的识别中,模子分类准确率为90.77%(177/195),存在16 个样本被过错分类,举例3 个CAO+SUO(50%~100%)被过错识别成CAO+COO(40%~100%)。这与孙婷婷等基于脂肪酸和甘油三酯进行掺兑类型的检测时不雅察到的不同掺兑类型之间的过错分类相似。掺兑类型过错分类的样品的脂肪酸构成较为相似,这使其LF-NMR弛豫特点接近,故难以辞别。
6 模子检测精度分析
进一步就SVM模子对CAO及6 种二元掺兑体系的分类精度进行评估。分别将不同类别及掺兑比例油样视为阳性(正类)样本,其他油样视为阴性(负类)样本,策动调回率、精准率、F1分数,恶果如表2所示。
由表2可知,CAO的调回率为86.67%,精准率为100%,F1分数为0.93,各掺兑类型及掺兑比例样本的平均调回率为90.87%、平均精准率为90.83%、平均F1分数为0.90。但不同掺兑类型及比例的检出精度有一定互异。举例,当COO掺兑比例为10%~30%、OxiCOO掺兑比例为80%~100%、OxiSOO掺兑比例为50%~100%、OxiSUO掺兑比例为40%~100%时,SVM模子的检出精度最高,调回率和精准率均达到100%,F1分数均为1.00。而当OxiSUO掺兑比例在10%~30%时,调回率和F1分数最低,分别为66.67%和0.75,当OxiSOO掺兑比例在10%~40%时,精准率最低,为73.33%。总体而言,模子具有较高的检测精度。
比拟之下,本商议提倡的基于LF-NMR弛豫特征的SVM CAO检测智力,不需要复杂的样品解决、检测速率快、操作浅薄且检测精度较高,大概雕悍及时检测需求。
论断
本商议栽植了基于LF-NMR弛豫特点的CAO SVM掺伪鉴识模子,并对模子的性能进行了评价。在对通俗/氧化的CAO、其他种类的植物油及多种二元掺兑油样的LF-NMR弛豫特点比较及PCA的基础上,诡计了CAO掺兑识别的SVM二叉树结构分类器,并经受ReliefF算法进行特征筛选,发现当特征数为9时,SVM多分类模子的性能最好,准确率为90.77%,对CAO、掺兑类型及比例的平均调回率为90.87%、精准率为90.83%、F1分数为0.90,具有较高的分类性能。本商议可为应用LF-NMR弛豫特点进行CAO的保真果决和掺兑检测提供期间依据。
本文《基于低场核磁弛豫特点的油茶籽油撑握向量机掺伪鉴识模子的栽植与评价》开端于《食物科学》2023年45卷第10期19-27页,作家:林晓浪,傅利斌,王 欣。DOI:10.7506/spkx1002-6630-20240105-053。点击下方阅读原文即可稽察著作关联信息。
实习裁剪;云南师范大学生命科学学院 母朵银;职守裁剪:张睿梅。图片开端于著作原文及摄图网。