摘要
为消除水果自身尺寸差异对其糖度预测模型的不利影响,进一步提高水果分选模型精度,应用近红外光谱在线检测装置采集不同果径苹果的近红外光谱,对光谱进行多种预处理后,分别建立苹果可溶性固形物的偏最小二乘法模型,再用苹果果径75~85 mm组中的建模集预测苹果果径分别为65~75、85~95 mm组中的预测集样品,最后用果径组65~75、75~85、85~95 mm中的建模集和预测集,分别作为混合苹果尺寸糖度预测模型的建模集和预测集,并利用特征光谱选择算法对模型进行简化,建立苹果糖度通用预测模型。结果显示:与建模集和预测集果径不同时所建立的苹果糖度预测模型最优组相比,其相关系数Rp由0.805提高至0.943,预测集均方根误差值RMSEP由0.778减小至0.480,RPD由0.96增加至3.05,再对建立的通用模型进行简化,可以降低苹果尺寸对苹果糖度模型的影响,提高模型预测性能。
苹果富含膳食纤维及微量元素,是人们最常食用的水果之一,其糖度的高低主要取决于可溶性糖的含量,而可溶性糖含量与可溶性固形物密切相关。苹果果径大小存在的差异会影响所建立的糖度模型的性能,糖度模型的准确性直接影响水果分选模型的精度,因此研究苹果果径对其糖度模型的影响是非常有必要的。近年来,近红外光谱检测技术已大量运用在水果的采后分
本研究采集不同尺寸苹果的近红外光谱,建立各种光谱预处理后糖度含量预测模型,结合波段筛选算法,降低苹果尺寸差异对苹果糖度模型的影响,提高不同尺寸苹果糖度预测模型的性能,为进一步提高水果分选模型精度提供参考。
本研究采用的苹果品种为红富士,订购于山东某果园,苹果无外部机械损伤和缺陷,共计240个,其中果径为65~75 mm(即65 mm<果径≤75 mm)的苹果80个,75~85 mm(即75 mm<果径≤85 mm)的苹果80个,85~95 mm(即85 mm<果径≤95 mm)的苹果80个,到货后,放置于室温为24 ℃的密闭房间内保存24 h,并用湿巾将苹果外部的灰尘擦尽,风干后采集近红外光谱。
采用笔者所在实验室自主研发的近红外光谱在线检测装

图1 近红外漫透射在线检测装置
Fig.1 The device of NIR diffuse transmittance detection
1.光源系统 Near-infrared light;2.光照箱 Testing room;3.光纤探头Fiber optic probe;4.编码盘 Counters;5.霍尔传感器 Hall sensor;6.PLC控制器PLC controller;7.果盘 Pallets.
用水果刀在每个苹果样本赤道处的测量位置切下一块厚度约为20 mm的苹果块,再将切下的苹果块榨汁,用定量滤纸(颗粒截留水平低至 2.5 μm)过滤后,用折射式数字糖度仪(PR-101a,日本)测量苹果的可溶性固形物含量(soluble solids content,SSC),取苹果4个赤道面测量位置SSC的平均值,作为该苹果样本的SSC。使用数显游标卡尺(Mitutoyo-500,日本)测量苹果赤道位置的果径,每个苹果在赤道位置测量4次,取平均果径作为该果的果径。
在建立苹果糖度预测模型前,需对苹果样本进行分类,使用Kennard-Stone(K-S)算法,将不同果径组苹果分为建模集与预测集,建立苹果糖度PLS预测模型,采用预测集相关系数Rp、预测集均方根误差值(root mean square error of prediction,RMSEP)和相对分析误差(residual predictive deviation,RPD)对模型的预测性能进行评判,其Rp越大,RMSEP越小,RPD越大,其模型性能越
240个苹果试验样品采用K-S算法分成3种不同果径,并将不同果径苹果样本以3∶1的比例划分为建模集和预测集,其中,每个果径组下80个样本,其中建模集60个、预测集20个,苹果的SSC测量值如
样品 Samples | 数据集 Data | 最小值/% Minimum | 最大值/% Maximum | 平均值/% Average | 标准偏差/% Standard deviation | |
---|---|---|---|---|---|---|
65~75 mm | 全部All | 80 | 9.85 | 16.70 | 13.84 | 1.54 |
建模集Modeling | 60 | 9.85 | 16.70 | 13.73 | 1.60 | |
预测集Prediction | 20 | 11.55 | 16.70 | 14.15 | 1.32 | |
75~85 mm | 全部All | 80 | 8.75 | 16.85 | 13.44 | 1.74 |
建模集Modeling | 60 | 8.75 | 16.85 | 13.41 | 1.70 | |
预测集Prediction | 20 | 8.85 | 16.50 | 13.53 | 1.84 | |
85~95 mm | 全部All | 80 | 11.50 | 15.45 | 13.28 | 0.83 |
建模集Modeling | 60 | 11.50 | 15.45 | 13.32 | 0.85 | |
预测集Prediction | 20 | 11.60 | 14.80 | 13.16 | 0.75 |
取3种果径组苹果的平均光谱,比较3种不同果径的光谱(

图2 3种果径苹果近红外光谱图
Fig.2 Near-infrared spectra of three fruit sizes of apples
果径为65~75 mm苹果的能量光谱高于果径为75~85 mm和85~95 mm苹果的能量光谱,原因是近红外光在苹果内部随着光程的增加,其携带的能量会发生衰减,在给定的波长下,进入苹果内部的光消光率近似为对数函
使用偏最小二乘回归(PLS)建立苹果糖度预测模型,为防止模型过拟合或欠拟合,LVs的数量设定为1~20。分别采用MSC、SNV和S-G平滑对光谱进行预处理,3组果径苹果建立的糖度PLS模型结果如
果径/mm Fruit diameter | 预处理方法 Preprocessing method | LVs | Rc | RMSEC | Rp | RMSEP | RPD |
---|---|---|---|---|---|---|---|
65~75 | Raw | 11 | 0.968 | 0.398 | 0.866 | 0.698 | 1.89 |
MSC | 10 | 0.970 | 0.385 | 0.896 | 0.646 | 2.04 | |
SNV | 11 | 0.977 | 0.364 | 0.922 | 0.542 | 2.44 | |
S-G平滑 Savitzky- Golag smoothing algorithm | 12 | 0.969 | 0.389 | 0.871 | 0.652 | 2.02 | |
75~85 | Raw | 10 | 0.980 | 0.337 | 0.979 | 0.389 | 4.73 |
MSC | 11 | 0.986 | 0.277 | 0.983 | 0.346 | 3.82 | |
SNV | 13 | 0.994 | 0.186 | 0.986 | 0.323 | 5.70 | |
S-G平滑 Savitzky- Golag smoothing algorithm | 11 | 0.988 | 0.298 | 0.983 | 0.377 | 4.88 | |
85~95 | Raw | 9 | 0.910 | 0.351 | 0.904 | 0.337 | 2.23 |
MSC | 10 | 0.932 | 0.308 | 0.918 | 0.328 | 2.29 | |
SNV | 10 | 0.939 | 0.293 | 0.923 | 0.312 | 2.40 | |
S-G平滑Savitzky- Golag smoothing algorithm | 9 | 0.909 | 0.369 | 0.901 | 0.345 | 2.17 |
果径为65~75 mm的苹果近红外光谱经SNV处理后,其糖度模型预测效果最好,其Rp为0.922,RMSEP为0.542,RPD值为2.44,其散点图如

图3 果实直径65~75 mm (A)、75~85 mm(B)和85~95 mm(C)的糖度预测散点图
Fig.3 Predicted scatter diagram of apple brix for fruit diameter 65-75 mm(A),fruit diameter 75-85 mm(B),and fruit diameter 85-95 mm(C)
由

图4 75~85 mm果径预测65~75 mm(A)和85~95 mm(B)果径糖度散点图
Fig.4 Scatter diagram of fruit diameter 75-85 mm predicting fruit diameter 65-75 mm(A) and 85-95 mm(B)
由

图5 混合果径糖度预测模型散点图
Fig.5 Scatter diagram of brix mixed fruit diameter prediction model
为满足在线检测中对稳定和快速的需求,需对模型进行简化,使用连续投影算法(successive projection algorithm,SPA)和竞争性自适应重加权算法(competitive adaptive reweighting algorithm,CARS)对不同尺寸糖度通用预测模型光谱变量进行特征提取,2种算法挑选出的特征波长如

图6 SPA(A)和CARS(B)挑选出的光谱变量
Fig.6 Spectra variables selected by SPA(A) and CARS(B)
样本选择算法 Algorithm | 变量数 Number of variables | Rc | RMSEC | Rp | RMSEP | RPD |
---|---|---|---|---|---|---|
SPA | 23 | 0.939 | 0.495 | 0.915 | 0.581 | 2.58 |
CARS | 65 | 0.964 | 0.384 | 0.963 | 0.391 | 3.84 |
由
为消除水果自身尺寸差异对其糖度预测模型不利影响,进一步提高水果分选模型精度,本研究应用近红外光谱在线检测装置采集不同果径苹果的近红外光谱。对比各组果径苹果光谱发现,苹果尺寸差异会对其光谱产生影响,最终会对其苹果糖度模型的预测性能产生影响,为此,研究了不同尺寸差异的解决方法,分别建立了相同果径组不同预处理糖度预测模型,其光谱经SNV预处理后,建立的糖度模型预测效果最好,其Rp为0.922,RMSEP为0.542,RPD值为2.44。随后建立不同果径糖度预测模型,用果径组75~85 mm的建模集分别预测65~75 mm和85~95 mm预测集,其建立的糖度预测模型性能较差。
为解决苹果尺寸差异造成的苹果糖度预测模型预测性能差的问题,建立了混合果径模型,其相关系数Rp由0.805提高至0.943,RMSEP由0.778减小至0.480,RPD由0.96增加至3.05。为了满足在线检测对稳定和快速的需求,对模型进行简化,采用CARS挑选出65个特征光谱点,建立的糖度预测模型。预测集相关系数Rp为0.963,RMSEP为0.391,预测模型性能有所提升,模型所用光谱变量由1 044个下降至65个,模型稳定性明显提高,可以减小苹果尺寸差异对苹果糖度模型的影响,提高模型的预测性能。
本研究结果表明,不同果径苹果糖度通用预测模型与波段筛选算法结合的策略能够有效应用于无损检测中不同苹果果径糖度通用模型的建立,具有一定的可行性。后续研究可以将该策略应用于其他水果或其他内部品质预测通用模型的建立,并通过改进预处理、波段筛选和建模方法提升模型性能。
参考文献 References
TIAN X,LI J B,WANG Q Y,et al.A bi-layer model for nondestructive prediction of soluble solids content in apple based on reflectance spectra and peel pigments[J].Food chemistry,2018,239:1055-1063. [百度学术]
CUBERO S,ALEIXOS N,MOLTÓ E,et al.Advances in machine vision applications for automatic inspection and quality evaluation of fruits and vegetables[J].Food and bioprocess technology,2011,4(4):487-504. [百度学术]
NICOLAÏ B M,BEULLENS K,BOBELYN E,et al.Nondestructive measurement of fruit and vegetable quality by means of NIR spectroscopy:a review[J].Postharvest biology and technology,2007,46(2):99-118. [百度学术]
黎丽莎,刘燕德,胡军,等.近红外无损检测技术在水果成熟度判别中的应用研究[J].华东交通大学学报,2021,38(6):95-105.LI L S,LIU Y D,HU J,et al.Application of near infrared nondestructive testing technology in fruit maturity discrimination[J].Journal of East China Jiaotong University,2021,38(6):95-105(in Chinese with English abstract). [百度学术]
崔丰娟,闸建文.近红外透射苹果运动速度模型适用性的研究[J].农机化研究,2010,32(11):170-173.CUI F J,ZHA J W.Study of the applicability of the apple speed model by near-infrared transmission[J].Journal of agricultural mechanization research,2010,32(11):170-173(in Chinese with English abstract). [百度学术]
XU X,MO J C,XIE L J,et al.Influences of detection position and double detection regions on determining soluble solids content (SSC) for apples using on-line visible/near-infrared (vis/NIR) spectroscopy[J].Food analytical methods,2019,12(9):2078-2085. [百度学术]
曹松涛.样品相关因素对梨糖度可见/近红外光谱检测影响的研究[D].杭州:浙江大学,2017.CAO S T.Effects of sample related factors on detection of soluble solids content in pear by vis/NIR spectroscopy[D].Hangzhou:Zhejiang University,2017(in Chinese with English abstract). [百度学术]
刘燕德,饶宇,孙旭东,等.尺寸差异对脐橙糖度可见近红外光谱检测模型影响[J].光谱学与光谱分析,2020,40(10):3241-3246.LIU Y D,RAO Y, SUN X D, et al.Size effect on the near-infrared spectroscopy detection model of navel orange[J].Spectroscopy and spectral analysis,2020,40(10):3241-3246(in Chinese with English abstract). [百度学术]
TIAN S J,ZHANG J H,ZHANG Z X,et al.Effective modification through transmission vis/NIR spectra affected by fruit size to improve the prediction of moldy apple core[J].Infrared physics & technology,2019,100:117-124. [百度学术]
刘燕德,黎丽莎,李斌,等.多品种苹果可溶性固形物近红外无损检测通用模型研究[J].华中农业大学学报,2022,41(2):237‐244.LIU Y D, LI L S, LI B, et al.General near-infrared model of soluble solids contentin multi-variety apples[J].Journal of Huazhong Agricultural University,2022,41(2):237‐244(in Chinese with English abstract). [百度学术]
MCGLONE V A,MARTINSEN P J,CLARK C J,et al.On-line detection of brownheart in Braeburn apples using near infrared transmission measurements[J].Postharvest biology and technology,2005,37(2):142-151. [百度学术]
刘燕德,张雨,姜小刚,等.不同贮藏期水蜜桃硬度及糖度的检测研究[J].光谱学与光谱分析,2021,41(1):243-249.LIU Y D,ZHANG Y,JIANG X G,et al.Detection on firmness and soluble solid content of peach during different storage days[J].Spectroscopy and spectral analysis,2021,41(1):243-249(in Chinese with English abstract). [百度学术]
WU W,WALCZAK B,MASSART D L,et al.Artificial neural networks in classification of NIR spectral data:design of the training set[J].Chemometrics and intelligent laboratory systems,1996,33(1):35-46. [百度学术]
WILLIAMS P. Near-infrared technology in the agricultural and food industries[J].American association of cereal chemists, 1987,10(2):15-28. [百度学术]
MCDEVITT R M,GAVIN A J,ANDRÉS S,et al.The ability of visible and near infrared reflectance spectroscopy to predict the chemical composition of ground chicken carcasses and to discriminate between carcasses from different genotypes[J].Journal of near infrared spectroscopy,2005,13(3):109-117. [百度学术]
ZHOU L J,WU H,LI J T,et al.Determination of fatty acids in broiler breast meat by near-infrared reflectance spectroscopy[J].Meat science,2012,90(3):658-664. [百度学术]
PRIETO N,ROSS D W,NAVAJAS E A,et al.Online prediction of fatty acid profiles in crossbred Limousin and Aberdeen Angus beef cattle using near infrared reflectance spectroscopy[J].Animal,2011,5(1):155-165. [百度学术]
FRASER D G.Near infra-red (NIR) light penetration into an apple[J].Postharvest biology & technology,2001,2(3):8-19. [百度学术]
李杰,李尚科,蒋立文,等.基于近红外光谱技术与化学计量学的绿茶无损鉴别方法研究[J].分析测试学报,2020,39(11):1344-1350.LI J,LI S K,JIANG L W,et al.A nondestructive method identifying varieties of green tea based on near infrared spectroscopy and chemometrics[J].Journal of instrumental analysis,2020,39(11):1344-1350(in Chinese with English abstract). [百度学术]