为提高黄桃损伤程度无损检测识别的准确率,采集健康和不同损伤程度黄桃(Amygdalus persica)的反射光谱(R)、吸收光谱(A)、Kubelka-Munk光谱(K-M),并基于反射光谱、吸收光谱、Kubelka-Munk光谱等原始光谱和RAW、BOC、DT、SG、SNV等预处理方法后的光谱建立偏最小二乘判别分析(partial least squares discriminant analysis,PLS-DA)、极限梯度提升(extreme gradient boosting,XGBoost)和随机森林(random forest,RF)模型,比较3种模型检测效果,选出正确率较高模型并构建其特征波长下的模型,并对结果再次进行比较。结果显示,基于3种原始光谱和SG预处理后光谱的RF模型判别效果较优,整体准确率均达到了90.00%以上。利用竞争性自适应重加权(CARS)和无信息变量消除(UVE)算法对3种原始光谱和SG预处理后的光谱进行波长筛选,并再次建立RF模型。结果显示,A-RAW-CARS-RF模型和K-M-SG-CARS-RF模型相比于全光谱下的RF模型判别效果得到了改善,并且在基于特征波长建立的RF模型中,A-RAW-CARS-RF模型的判别效果最好,整体准确率达到了97.12%,对4个子类别的误判数分别为0、1、1、1。
试验所用的黄桃(Amygdalus persica)来自于山东省临沂市。试验前筛选出420个新鲜无损且成熟度、硬度和大小尺寸相近的黄桃样本,并逐个编号后分为对照组(104个)和试验组(316个)。试验前将编号的黄桃储存在室温25 ℃环境中12 h,使样品温度与室温保持一致。将直径30 mm、质量为100 g的铁球固定在落球冲击试验机上,分别从0.6、1.2、1.8 m 等3个高度释放,冲击黄桃造成其损伤,并定义从0.6、1.2、1.8 m释放造成的损伤分别为Ⅰ级、Ⅱ级和Ⅲ级损

图1 落球冲击试验机及碰伤样品
Fig.1 Falling ball impact tester and bruised sample

图2 高光谱系统示意图及三维数据立方体
Fig.2 Schematic diagram of the hyperspectral system and 3D data cube
在图像采集之前,为防止无关因素对试验结果造成干扰,需将高光谱系统打开预热0.5 h。设置的参数为:相机曝光时间6.0 ms;光谱分辨率3.5 nm,光谱范围397.5~1 014.0 nm;位移平台移动速度2.5 m/s。操作步骤:(1)将黄桃样品放在位移平台上;(2)打开位移平台,并点击保存按钮,采集高光谱图像;(3)通过计算机软件进行记录,最终形成1个包含了影像信息和光谱信息的三维数据立方体。
感兴趣区域为大小约为1 600个像素点的圆形区域,通过ENVI 4.5软件进行提取,碰伤黄桃样品选择正对镜头的碰伤区域,健康黄桃样品则选择位于赤道位置且正对着镜头的区域。由于CCD相机中存在暗电流,导致一些光强度较低的波段出现大量的噪声。因此,在进一步的数据处理和分析之前,高光谱图像需用白色和暗色的参照物进行校
(1) |
(2) |
(3) |

图3 健康黄桃和不同损伤程度黄桃的平均光谱曲线
Fig.3 Average spectral curve of healthy yellow peach and yellow peach with different damage degrees
A:反射光谱曲线Reflection spectral curve;B:吸收光谱曲线Absorption spectral curve;C:K-M光谱曲线Kubelka-Munk spectral curve.
光谱类型 Spectral type | 模型 Model | RAW | BOC | DT | SG | SNV |
反射光谱 Reflection spectrum | PLS-DA | 76.92 | 76.92 | 72.12 | 76.92 | 77.88 |
XGBoost | 84.62 | 77.88 | 81.73 | 84.62 | 85.58 | |
RF | 93.27 | 84.62 | 81.73 | 93.27 | 84.62 | |
吸收光谱 Absorption spectrum | PLS-DA | 68.27 | 71.15 | 66.35 | 69.23 | 74.04 |
XGBoost | 84.62 | 76.92 | 81.73 | 86.54 | 77.88 | |
RF | 95.19 | 85.58 | 84.62 | 93.27 | 84.62 | |
Kubelka-Munk光谱 Kubelka-Munk spectrum | PLS-DA | 61.54 | 56.73 | 57.69 | 66.35 | 62.50 |
XGBoost | 84.62 | 74.04 | 73.08 | 85.58 | 80.77 | |
RF | 92.31 | 76.92 | 78.85 | 92.31 | 84.62 |

图4 不同模型预测结果的混淆矩阵
Fig. 4 Confusion matrix for the prediction results of different models
Sound:健康样品Health sample;Ⅰ、Ⅱ和Ⅲ:Ⅰ、Ⅱ和Ⅲ级损伤Ⅰ, Ⅱ and Ⅲ level damage yellow peaches;A:反射光谱-原始光谱-随机森林R-RAW-RF;B:反射光谱-卷积平滑-随机森林R-SG-RF;C:吸收光谱-原始光谱-随机森林A-RAW-RF;D: 吸收光谱-卷积平滑-随机森林A-SG-RF;E:Kubelka-Munk光谱-原始光谱-随机森林K-M-RAW-RF;F: Kubelka-Munk光谱-卷积平滑-随机森林K-M-SG-RF.

图5 CARS算法筛选变量过程
Fig.5 The process of screening the variables of CARS algorithm

图6 CARS算法挑选波长结果
Fig.6 The results of CARS algorithm to select wavelength

图7 UVE算法筛选变量过程
Fig.7 The process of screening variables of UVE algorithm

图8 UVE算法挑选波长结果
Fig.8 The results of UVE algorithm to select wavelength
A:反射光谱-原始光谱 R-RAW;B:反射光谱-卷积平滑 R-SG;C:吸收光谱-原始光谱 A-RAW;D:吸收光谱-卷积平滑 A-SG;E: Kubelka-Munk光谱-原始光谱 K-M-RAW;F:Kubelka-Munk光谱-卷积平滑 K-M-SG.
波长筛选方法 Wavelength screening method | 反射光谱Reflection spectrum | 吸收光谱Absorption spectrum | Kubelka-Munk光谱Kubelka-Munk spectrum | |||
RAW | SG | RAW | SG | RAW | SG | |
CARS | 89.42 | 89.42 | 97.12 | 88.46 | 91.35 | 93.27 |
UVE | 91.35 | 93.27 | 91.35 | 93.27 | 89.42 | 92.31 |

图9 不同模型预测结果的混淆矩阵
Fig.9 Confusion matrix for different model prediction results
Sound:健康样品Health sample;Ⅰ、Ⅱ和Ⅲ:Ⅰ、Ⅱ和Ⅲ级损伤Ⅰ,Ⅱ and Ⅲ level damage yellow peaches;A:吸收光谱-原始光谱-竞争性自适应重加权-随机森林A-RAW-CARS-RF;B:Kubelka-Munk光谱-卷积平滑-竞争性自适应重加权-随机森林 K-M-SG-CARS-RF.
