摘要
为解决传统的种子活力检测方法存在耗时长、损伤种子等问题,实现种子活力的快速无损检测,分别利用机器学习和深度学习算法结合高光谱成像技术构建玉米种子3个活力梯度分类模型,通过人工老化方式将1 012粒玉米种子分为3个活力梯度样本,采集其高光谱数据后通过卷积平滑(SG)和多元散射校正(MSC)去除高光谱噪声,分别采用主成分分析(PCA)、连续投影算法(SPA)进行光谱特征降维,再从降维后的波段中抽取1 156、1 191和1 463 nm 3个波段合成假彩色图像,用局部二值模式(LBP)提取感兴趣区域的纹理特征,并与纯光谱特征融合。分别基于纯光谱特征构建决策树(DT)和支持向量机(SVM)模型和融合特征建立随机森林(RF)、SVM和极端梯度提升树(XGBoost)模型等机器学习模型。将假彩色图像输入ResNet18、MobileNetV2、DenseNet121、Efficientb0、Efficientb2等5个深度学习模型中进行玉米种子活力预测。结果显示,就机器学习方法而言,针对纯光谱特征表现最好的是PCA-SVM模型,其测试集准确率为92.5%;针对融合特征表现最好的是SVM模型,其测试集的分类准确率为 93.1%;就深度学习方法而言,轻量化的MobileNet取得最高的测试集分类准确率99.5%;基于可解释的梯度定位类别激活映射方法表明,分类网络会重点关注玉米种子的中部或基部区域。
甜玉米口感香甜且富含多种营养。目前,甜玉米种子活力低和田间出苗差成为其推广及发展的主要限制因
为充分利用高光谱图谱合一的特性,许多学者采用不同方法提取纹理特征与光谱特征融合。杨东
随着深度学习技术在不同领域的广泛应用,越来越多的学者将深度学习应用到农作物种子品种检测领域,且取得了较好的结果。王佳
目前,基于神经网络的种子活力检测模型大多停留在早期的经典网络架构上,如GoogleNet、VGGNet等,缺乏对较新网络架构的研究;对网络深层关注的种子区域进行视觉解释的相关研究也较少,且鲜有研究人员将上述提到的仅用光谱特征、图谱融合特征建立的机器学习模型与深度学习网络在种子活力预测方面进行对比分析。本研究构建自动学习特征的深度学习网络,并分别基于籽粒感兴趣区域的光谱特征、图谱融合的特征构建机器学习模型作为对比,对玉米籽粒的活力梯度进行识别,旨在为玉米种子活力的快速无损检测提供新的思路。
甜玉米种子来自华南农业大学甜玉米实验室育种试验田培育的64个玉米自交系,该玉米自交系经过实验室长期培育,在广州地区适应性较好,推广价值高,样本共收集1 012粒形状不一的甜玉米种子(

图1 试验用甜玉米种子
Fig.1 Sweet corn seeds for testing
采集甜玉米种子高光谱图像,以bmp格式保存(

图2 不同活力梯度玉米种子
Fig.2 Corn seeds at various vitality levels
A:老化0 d Aging for zero day; B:老化3 d Aging for three days; C:老化6 d Aging for six days.

图3 湿砂覆盖种子
Fig.3 Seeds covered with wet sand
(1) |
(2) |
式(
老化处理时间/dAging treatment time | 样本量Sample size | VI最小值/((g·粒)/(d·株)) Minimum VI | VI最大值/((g·粒)/(d·株))Maximum VI | VI平均值/((g·粒)/(d·株))AverageVI | 变异系数/%Coefficient of variation |
---|---|---|---|---|---|
0 | 347 | 0.20 | 127.85 | 38.14 | 17.74 |
3 | 320 | 0.00 | 42.37 | 9.05 | 26.15 |
6 | 345 | 0.00 | 3.81 | 0.58 | 33.71 |
种子样本使用近红外高光谱成像仪(Gaiafield Pro,China)拍摄扫描,该设备主要由高光谱相机、光源、电控载物台和计算机组成,光谱波长范围为886~1 703 nm,共包含256维光谱特征,获取的高光谱图像大小为333像素×320像素。为避免外部光线干扰,高光谱图像采集在暗箱内完成。为消除由系统造成的样本光谱误差,采集前需要对高光谱图像进行黑白校正,待图像校正完毕,调试系统参数以获取清晰稳定图像。最终将平台移动扫描速度设置为1.1 mm/s,高光谱相机曝光时间设置为15 ms。手动选取甜玉米种子靠近基部的质心附近20像素×20像素方形区域作为感兴趣区域,如

图4 感兴趣区域选取
Fig.4 Region of interest selection
1)光谱数据预处理。本研究结合卷积平滑(SG)和多元散射校正(MSC)进行光谱数据的预处理,后续使用的均是预处理后的数据。
2)光谱特征降维。本研究采用主成分分析(PCA)进行特征降维和连续投影算法(SPA)进行特征波长选取。
3)纹理特征提取。本研究通过局部二值模式(LBP
4)光谱特征与纹理特征融合。将提取的纹理特征与光谱特征进行串联之前,通过分析发现采用直接特征串联会造成纹理特征数据维度过大,产生大量冗余信息反而影响模型判别精度和检测效率。故采用PCA特征降维,保留累计方差贡献率为98%的特征变量。分别将PCA降维后的光谱特征和LBP纹理特征记作{S,L}特征,构建特征耦合方
由于光谱的特征变量与不同图像纹理特征的量纲单位不一致,将导致判别模型在建模过程中对数值更大的特征赋予更大权重。因此,在数据拼接前,需对特征矩阵进行归一化处理,保证各特征向量位于同一数量级并消除特征矩阵中各向量之间的量纲影响。选用标准差标准化方法将特征值映射到-1~1。转换函数为:
(3) |
(4) |
1)机器学习。选用单一算法模型中的决策树(DT)和支持向量机(SVM)模型,集成学习模型中的随机森林(RF)和极端梯度提升树(XGBoost)模型,均按4∶1的比例随机将样本数据划分成训练集和测试集,采用交叉验证。
2)深度学习。使用ResNet、MobileNet、DenseNet、EfficientNet等4种网络模型,都较为轻量化,若使用手机作为玉米种子活力检测的终端,更容易用于实际应用推广。此外,使用Grad-CAM算法对深度网络做出视觉解释。
(5) |
SPA算法选择最佳特征波长数以均方根误差(root mean square error,RMSE)作为评价指标,其计算公式如
(6) |
本研究中所使用算法的实现软件为Matlab 2016b(Matrix Laboratory,矩阵实验室)、PyCharm 2021.2.2(Professional Edition)、Python 3.8,主要进行光谱数据处理分析、建模优化以及结果可视化。硬件环境为Dell Precision 5820塔式工作站,CPU:Intel(R) Core(TM) i9-10900X 3.7 GHz;内存:32 GB;显卡:NVIDIA GeForce RTX 3090。
近红外高光谱成像仪采集到的3个活力梯度种子的平均光谱曲线如

图5 不同活力梯度平均光谱曲线
Fig.5 Average spectral curves of different activity gradients
1)PCA特征降维。该光谱数据的空间分布散点图如

图6 前3个主成分得分散点图
Fig.6 Scatter plots of the three principal components
2)SPA选取特征波长。由

图7 特征波长选取结果
Fig.7 Results of characteristic wavelengths selected
A:特征波长分布 Characteristic wavelength distribution; B:均方根误差 RMSE.
本研究综合考虑了PCA、SPA提取的特征波段与玉米种子中有机物吸收谱

图8 假彩色图像合成示意图
Fig.8 Schematic diagram of false color image synthesis
本研究基于机器视觉技术将单粒玉米种子从多粒图像中切割出来作为深度学习网络的输入。分割方法为:首先利用目标种子(

图9 假彩色图像合成过程
Fig.9 False color image synthesis process
将假彩色图像通过灰度变换进行预处理,然后采用LBP进行纹理特征提取(

图10 玉米种子的 LBP 特征图
Fig.10 LBP feature map of corn seeds
A:玉米种子原始图像 Original image of the corn seed;B:LBP特征 LBP characteristics.
1)基于光谱特征的机器学习模型。对采集到的光谱数据,基于全波段光谱和PCA、SPA特征变量分别建立SVM和DT模型,并根据模型准确率确定较佳模型。基于光谱特征的模型分类结果如
模型Model | 模型输入Input of model | SVM核函数/决策树类型Type of decision tree/SVM kernel function | 训练准确率 Trainingaccuracy | 测试准确率 Testing accuracy |
---|---|---|---|---|
DT | 全波段Full band | Gini | 83.7 | 75.4 |
Entropy | 84.2 | 76.8 | ||
PCA | Gini | 88.2 | 82.3 | |
Entropy | 86.7 | 79.8 | ||
SPA | Gini | 87.7 | 82.8 | |
Entropy | 83.3 | 78.8 | ||
SVM | 全波段Full band | Linear | 94.1 | 92.1 |
RBF | 86.9 | 83.6 | ||
PCA | Linear | 94.6 | 92.5 | |
RBF | 86.5 | 83.2 | ||
SPA | Linear | 88.4 | 85.8 | |
RBF | 88.6 | 85.7 |
2)基于降维光谱特征与图像纹理特征融合的机器学习模型。将高光谱数据用PCA降维后,与纹理特征融合,作为模型的输入数据,建立SVM、RF、XGBoost模型(
模型 Model | 训练准确率Training accuracy | 测试准确率Testing accuracy |
---|---|---|
SVM | 100.0 | 93.1 |
RF | 97.4 | 92.3 |
XGBoost | 97.4 | 92.3 |
选取ResNet、MobileNet、DenseNet、EfficientNet这4种网络对玉米种子图像进行识别检测,优化器(optimizer)使用 SGD算法,学习率(learning rate)为0.1,动量因子(momentum)为0.9,权重衰减因子(weight_decay)为0.000 1,损失函数使用crossentropy,迭代次数(epochs)为100。训练后识别准确率详情见
模型 Model | 参数量/M Params | 运算次数(GFLOPs) Computational operations | 训练准确率/% Training accuracy | 测试准确率/% Testing accuracy |
---|---|---|---|---|
ResNet18 | 11.18 | 1.82 | 99.77 | 99.50 |
MobileNetV2 | 2.23 | 0.32 | 100 | 99.50 |
DenseNet121 | 6.96 | 2.88 | 99.07 | 99.25 |
EfficientNetb0 | 5.29 | 0.02 | 90.70 | 87.28 |
EfficientNetb2 | 7.71 | 0.02 | 99.30 | 98.00 |

图11 训练准确率和损失值
Fig.11 Training accuracy and training loss
A:训练准确率 Training accuracy; B:训练损失值 Training loss.
本研究使用Grad-CAM对几种网络的深层做出基于梯度定位的视觉解释,通过计算最后1个卷积层中每个特征图对图片类别的权重,然后求每个特征图的加权和,以热力图的形式展现,最后将加权和的特征图映射到原始图片中,如

图12 网络深层感兴趣区域
Fig.12 Area of interest in the deep layer of networks
A:原图 Original diagram;B: ResNet18;C: MobileNetV2;
D: DenseNet121;E: EfficientNetb2.
考虑到光谱特征中存在可以表征种子活力的特征波段,本研究先设计了基于仅使用光谱特征建模的试验,过程分为先去噪、后降维、再建模。在挑选ROI区域时,由于与种子活力相关的营养物质聚集在基层区域(胚下端)会导致其反射光谱表现出一定的差异
机器学习过程中除了使用单一算法模型外,还可以使用集成学习模型。它通过构建多个学习器并将其结合,从而更好地完成预测任务,也常被称为模型融合。DT模型属于典型的白盒有监督算法,其建立的树结构可以被可视化,便于直观解释模型判别过程,且不需要大量的数据支持训练模型。SVM模型在非线性可分问题中引入了核函数将非线性样本向量映射至具有更高维度的特征空间内,并在高维度特征空间内构建一个最优决策超平面,因此,适用于在非线性和多变量特征输入条件下获取全局最优决策结果。RF模型属于集成学习模型中Bagging策略,其内部由多个决策树构成森林,按照投票原则输出决策结果。为保证模型的泛化能力,Bagging策略在训练迭代过程中遵循原始数据有放回地随机选择以及各样本特征的随机抽取2个随机原
本研究基于光谱特征建立的模型分类预测准确率都在75%以上,在上述模型中,预测效果最好的SVM模型准确率为92.5%,尚有一定的提升空间,故考虑给模型加入纹理特征。纹理是指在图像局部区域中统计存在的某些规律性变化的特征或者属性,这些呈现出周期性的特征或者属性就可称为纹
深度学习的几种网络中,ResNet提出了残差思想,缓解了随着网络深度增加,性能不升反降的问题,改善了梯度消失。MobileNet采用基于深度可分解的卷积,有效降低模型计算复杂度,使得模型轻量化。DenseNet具有网络更窄、参数更少的优势,可以减轻过拟合现象,使网络更容易训
本研究综合考虑了PCA、SPA提取的特征波段与玉米种子中有机物吸收谱
本研究在数据来源、深层网络视觉和机器学习与深度学习性能对比等方面为甜玉米种子活力无损检测提供了一定的参考。然而本研究的样本数量与品种有限,后续可以考虑增加更多品种的玉米种子,建立更为稳定以及适用范围更广的玉米种子活力判别模型。
参考文献 References
刘敏洁,许昍,王建华,等.基于人工神经网络和二元逻辑回归的甜玉米种子生活力检测模型研究[J].中国农业大学学报,2018,23(7):1-10.LIU M J,XU X,WANG J H,et al.Seed viability testing model of sweet corn based on artificial neural network and binary logistic regression[J].Journal of China Agricultural University,2018,23(7):1-10(in Chinese with English abstract). [百度学术]
HE X T,FENG X P,SUN D W,et al.Rapid and nondestructive measurement of rice seed vitality of different years using near-infrared hyperspectral imaging[J/OL].Molecules(Basel,Switzerland),2019,24(12):2227[2022-11-27].https://doi.org/10.3390/molecules24122227. [百度学术]
李文彬,于秀琪,刘春宇,等.农作物种子活力检测方法研究进展[J].农业灾害研究,2021,11(6):7-8,10.LI W B, YU X Q,LIU C Y,et al.Research progress of crop seed vigor testing methods[J].Journal of agricultural catastrophology,2021,11(6):7-8,10 (in Chinese with English abstract). [百度学术]
袁俊,郑雯,祁亨年,等.种子活力光学无损检测技术研究进展[J].作物杂志,2020(5):9-16.YUAN J,ZHENG W,QI H N,et al.Progress in research of optical non-destructive test technology for seed vigor[J].Crops,2020(5):9-16(in Chinese with English abstract). [百度学术]
王巧华,马逸霄,付丹丹.基于光谱技术的禽蛋内部品质无损检测研究进展[J].华中农业大学学报,2021,40(6):220-230.WANG Q H,MA Y X,FU D D.Progress of non-destructive detection of poultry egg internal quality based on spectroscopy[J].Journal of Huazhong Agricultural University,2021,40(6):220-230(in Chinese with English abstract). [百度学术]
王胜鹏,郑鹏程,桂安辉,等.基于近红外光谱技术的远安黄茶品质快速无损检测方法[J].华中农业大学学报,2022,41(1):238-245.WANG S P,ZHENG P C,GUI A H,et al.Fast and non-destructive quality evaluation of Yuan’an yellow tea based on near-infrared spectroscopy[J].Journal of Huazhong Agricultural University,2022,41(1):238-245(in Chinese with English abstract). [百度学术]
AL-AMERY M, GENEVE R L, SANCHES M F, et al. Near-infrared spectroscopy used to predict soybean seed germination and vigour[J].Seed science research,2018, 28(3): 245-252. [百度学术]
FENG L,ZHU S S,ZHANG C,et al.Identification of maize kernel vigor under different accelerated aging times using hyperspectral imaging[J/OL].Molecules (Basel,Switzerland),2018,23(12):3078[2022-11-27].https://doi.org/10.3390/molecules23123078. [百度学术]
杨东,王舒卉,吴建华,等.玉米籽粒霉变等级高光谱图像检测方法研究[J].中国粮油学报,2022,37(11):46-53.YANG D,WANG S H,WU J H,et al.Study on hyperspectral image detection method of maize grain mildew grade[J].Journal of the Chinese cereals and oils association,2022,37(11):46-53(in Chinese with English abstract). [百度学术]
王承琨,赵鹏,李祥华.采用特征融合的紫檀属内相似树种识别方法研究[J].光谱学与光谱分析,2022,42(7):2247-2254.WANG C K,ZHAO P,LI X H.Similar wood species classification within Pterocarpus genus using feature fusion[J].Spectroscopy and spectral analysis,2022,42(7):2247-2254(in Chinese with English abstract). [百度学术]
王佳, 马睿, 马德新.基于深度学习的登海605玉米品种真伪鉴别方法研究[J/OL].中国粮油学报:1-12[2022-11-27].http://kns.cnki.net/kcms/detail/11.2864.TS.20220609.1531.019.html.WANG J,MA R,MA D S.Identification method of Denghai 605 maize varieties based on deep learning[J/OL].Journal of the Chinese cereals and oils association,1-12[2022-11-27].http://kns.cnki.net/kcms/detail/11.2864.TS.20220609.1531.019.html(in Chinese with English abstract). [百度学术]
PANG L,XIAO J,MA J J,et al.Hyperspectral imaging technology to detect the vigor of thermal-damaged Quercus variabilis seeds[J].Journal of forestry research,2021,32(2):461-469. [百度学术]
张超,乔敏,刘哲,等.基于无人机和卫星遥感影像的制种玉米田识别纹理特征尺度优选[J].农业工程学报,2017,33(17):98-104.ZHANG C,QIAO M,LIU Z,et al.Texture scale analysis and identification of seed maize fields based on UAV and satellite remote sensing images[J].Transactions of the CSAE,2017,33(17):98-104(in Chinese with English abstract). [百度学术]
宋克臣,颜云辉,陈文辉,等.局部二值模式方法研究与展望[J].自动化学报,2013,39(6):730-744.SONG K C,YAN Y H,CHEN W H,et al.Research and perspective on local binary pattern[J].Acta automatica sinica,2013,39(6):730-744(in Chinese with English abstract). [百度学术]
DAI L Q,WU L,DONG Q S,et al.Genome-wide association study of field grain drying rate after physiological maturity based on a resequencing approach in elite maize germplasm[J/OL].Euphytica,2017,213(8):182[2022-11-27].https://doi.org/10.1007/s10681-017-1970-9. [百度学术]
褚小立.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011.CHU X L.Molecular spectroscopy analytical technology combined with chemometrics and its applications[M].Beijing:Chemical Industry Press,2011(in Chinese). [百度学术]
樊阳阳,裘正军,陈俭,等.基于近红外高光谱成像技术的干制红枣品种鉴别[J].光谱学与光谱分析,2017,37(3):836-840.FAN Y Y,QIU Z J,CHEN J,et al.Identification of varieties of dried red jujubes with near-infrared hyperspectral imaging[J].Spectroscopy and spectral analysis,2017,37(3):836-840(in Chinese with English abstract). [百度学术]
杨小玲,由昭红,成芳.高光谱成像技术检测玉米种子成熟度[J].光谱学与光谱分析,2016,36(12):4028-4033.YANG X L,YOU Z H,CHENG F.Study on identification of immature corn seed using hyperspectral imaging[J].Spectroscopy and spectral analysis,2016,36(12):4028-4033(in Chinese with English abstract). [百度学术]
王超鹏,黄文倩,樊书祥,等.基于高光谱成像技术与CARS算法的玉米种子含水率检测[J].激光与光电子学进展,2016,53(12):260-267.WANG C P,HUANG W Q,FAN S X,et al.Moisture content detection of maize kernels based on hyperspectral imaging technology and CARS[J].Laser & optoelectronics progress,2016,53(12):260-267(in Chinese with English abstract). [百度学术]
刘立新,何迪,李梦珠,等.基于高光谱技术与机器学习的新疆红枣品种鉴别[J].中国激光,2020,47(11):291-298.LIU L X,HE D,LI M Z,et al.Identification of Xinjiang jujube varieties based on hyperspectral technique and machine learning[J].Chinese journal of lasers,2020,47(11):291-298(in Chinese with English abstract). [百度学术]
DOS SANTOS PEREIRA E V,DE SOUSA FERNANDES D D,DE ARAÚJO M C U,et al.In-situ authentication of goat milk in terms of its adulteration with cow milk using a low-cost portable NIR spectrophotometer[J/OL].Microchemical journal,2021,163:105885[2022-11-27].https://doi.org/10.1016/j.microc.2020.105885. [百度学术]
邵园园,王永贤,玄冠涛,等.基于高光谱成像的肥城桃品质可视化分析与成熟度检测[J].农业机械学报,2020,51(8):344-350.SHAO Y Y,WANG Y X,XUAN G T,et al.Visual detection of SSC and firmness and maturity prediction for Feicheng peach by using hyperspectral imaging[J].Transactions of the CSAM,2020,51(8):344-350(in Chinese with English abstract). [百度学术]
王奕森,夏树涛.集成学习之随机森林算法综述[J].信息通信技术,2018,12(1):49-55.WANG Y S,XIA S T.A survey of random forests algorithms[J].Information and communications technologies,2018,12(1):49-55(in Chinese with English abstract). [百度学术]
李占山,刘兆赓.基于XGBoost的特征选择算法[J].通信学报,2019,40(10):101-108.LI Z S,LIU Z G.Feature selection algorithm based on XGBoost[J].Journal on communications,2019,40(10):101-108(in Chinese with English abstract). [百度学术]
王冬,王坤,吴静珠,等.基于光谱及成像技术的种子品质无损速测研究进展[J].光谱学与光谱分析,2021,41(1):52-59.WANG D,WANG K,WU J Z,et al.Progress in research on rapid and non-destructive detection of seed quality based on spectroscopy and imaging technology[J].Spectroscopy and spectral analysis,2021,41(1):52-59(in Chinese with English abstract). [百度学术]
XU P,TAN Q,ZHANG Y P,et al.Research on maize seed classification and recognition based on machine vision and deep learning[J/OL].Agriculture,2022,12(2),232[2022-11-27]. https://doi.org/10.3390/agriculture12020232. [百度学术]
ZHOU B L,KHOSLA A,LAPEDRIZA A,et al.Learning deep features for discriminative localization[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).June 27-30,2016,Las Vegas,NV,USA.Las Vegas:IEEE,2016:2921-2929. [百度学术]
SELVARAJU R R,COGSWELL M,DAS A,et al.Grad-CAM:visual explanations from deep networks via gradient-based localization[J].International journal of computer vision,2020,128(2):336-359. [百度学术]