摘要
为探究作物种子品质性状无损检测方法,以100份水稻核心种质资源为试验材料,基于近红外高光谱相机采集水稻种粒的透射、反射光谱数据并提取光谱参数,水稻种粒脱壳后使用近红外谷物分析仪测定米粒品质;以水稻种粒光谱参数为自变量、米粒品质指标为因变量,建立米粒品质预测模型。结果显示,使用单一光谱建模时,透射光谱建模效果优于反射光谱建模效果;结合透射-反射特征光谱集合建模可使粗蛋白预测模型
水稻作为我国主要的粮食作物之一,在保障粮食安全方面具有不可替代的作用,在国民经济发展和社会稳定中具有重要意义。随着生活品质的提升,国民对稻米的品质要求也逐渐提高。直链淀粉含量和蛋白质含量是衡量稻米品质的2个关键指
传统的稻米直链淀粉和蛋白质含量测定采用生化方法。常见的蛋白质含量测定方法有Folin-酚法、凯氏定氮法、双缩脲法、考马斯亮蓝法
目前,高光谱无损检测农产品品质性状技术已经得到广泛应用。Ma
本研究基于近红外波段高光谱相机采集100份水稻核心种质资源材料的谷粒光谱数据,分别以反射光谱、透射光谱以及结合反射-透射光谱作为模型自变量,以米粒品质指标作为因变量,通过相关性分析、逐步线性回归等方法筛选重要特征波段,建立米粒直链淀粉、粗蛋白和水分含量预测模型,旨在为作物种子品质性状无损检测提供科学依据。
从533份水稻核心种质资源材料中随机选取100份作为试验材料。每份材料随机取100粒水稻种粒进行试验,种粒光谱采集、米粒品质测定时间为2021年9月,试验地点为华中农业大学作物遗传改良全国重点实验室作物表型中心。
技术路线如

图 1 技术路线
Fig.1 Technical diagram
本研究光谱参数提取基于Labview2015(National Instruments,USA)实现,逐步线性回归分析基于SPSS.22(IBM,USA)软件实现,其他计算在Python3.8语言环境下通过编程实现。
1)光谱参数提取。本研究采用近红外-高光谱成像系统,该系统硬件主要包括近红外波段高光谱相机(Headwall Photonics,USA)、卤素灯光源以及平移台。高光谱相机成像范围为900~1 700 nm,光谱波段间隔为4.65 nm,总共172波段。卤素灯为系统提供稳定光源,水稻种粒放置在平移台上进行数据采集,平移台移动速度为2 mm/s。整个系统置于暗室中,工作时仅有卤素灯光源。
采集光谱数据前,需对系统进行黑白板校正。盖上镜头盖,采集1帧暗电流光谱数据。将标准白板置于高光谱相机镜头正下方,打开镜头盖,采集一帧白板光谱数据,根据公式对采集的图像进行校正,其中,R0为校正后的灰度值,R为原始光谱图像,Rd为暗电流校正图像,Rw为白板校正图像。试验过程中每隔1 h需对系统校正1次,以保证光谱数据的稳定性。
高光谱相机在光谱范围内共采集到172张图像,每张图像的灰度范围均不同。采用大津阈值分割算法(OTSU)进行图像分割,其核心思路是寻找一个阈值X把所有的像素点分成2类:一类的像素值≤X,则被置为背景区域;另一类的像素值>X,则被置为前景区域。当这2类的类间方差取得最大值时,则X为最佳分割阈值。设背景区域的像素点数为N0,其占图像总像素的比例为P0,平均像素值为M0;前景区域所有像素点数为N1,其占图像总像素的比例为P1,平均像素值为M1;图像所有像素点数为N,平均像素值为M。则满足以下关系:
(1) |
(2) |
(3) |
则类间方差X满足:
(4) |
提取全波段光谱图像,挑选1 365 nm波段下的图像,经OTSU算法分割得到水稻种粒的二值图。水稻种粒二值图与全波段光谱图像掩膜得到水稻种粒的全波段高光谱图像,进而计算光谱参数,包括总反射率T、平均反射率A、平均反射率的一阶导dA、平均反射率的二阶导ddA以及lgA。反射光谱参数获取流程如

图 2 光谱参数提取过程
Fig.2 Spectral parameter extraction process
2)米粒品质指标测定。采用砻谷机(新丰牌JLGJ4.5)对水稻种粒脱壳得到糙米粒,采用近红外谷物分析仪(Perten DA7250型)测得米粒粗蛋白、水分和直链淀粉含量相对值。
3)逐步线性回归及相关性分析。采用逐步线性回归法及相关性分析法去除冗余光谱参数,筛选出对米粒品质指标有预测效果的光谱特征。将米粒粗蛋白、水分以及直链淀粉含量作为因变量分别与光谱参数进行逐步线性回归分析,得到回归子集A。计算光谱参数的比例和归一化指数,由于光谱参数众多,比例指数和归一化指数两两间计算量大,因此,在计算前,对光谱参数和因变量做相关性分析,筛选出相关性绝对值大于0.3的光谱特征,得到高相关性光谱特征集合D。对集合D的光谱特征计算比例和归一化指数,比例和归一化指数分别与因变量进行逐步线性回归分析得到回归子集B和回归子集C。整合集合A、B、C、D与因变量再次进行逐步线性回归,最终筛选得到有预测效果的特征集合。本研究中的透射光谱数据与反射光谱数据处理方式相同。
4)模型评价。模型评价用来评估模型的准确性和稳定性。本研究采用5折交叉验证对模型进行评估。5折交叉验证即将数据集随机划分为5组,其中4组用于模型训练,1组用于模型测试,每组数据分别充当1次测试集,得到5个模型的结果,取平均值则为1次交叉验证结果。根据预测值和真实值可分别计算训练集、测试集的均方根误差(RMSE)、平均绝对百分比误差(MAPE)和决定系数(
(5) |
(6) |
(7) |

图 3 水稻种粒反射(A)、透射(B)光谱特征曲线
Fig.3 Characteristic curve of reflection(A) and transmission(B) spectrum of rice seed
粗蛋白、直链淀粉和水分含量与反射光谱、透射光谱的相关性关系见

图 4 基于光谱的米粒品质相关性分析
Fig.4 Correlation analysis of rice grain composition based on spectrum
A:透射光谱 Transmission spectrum; B:反射光谱 Reflection spectrum.
水分、粗蛋白和直链淀粉含量作为因变量分别与全波段反射、透射光谱参数进行逐步线性回归分析,得到回归子集A。

图 5 基于全波段光谱的米粒品质指标逐步线性回归
Fig.5 Stepwise linear regression of rice grain composition content based on all-band spectrum
为了更好地检验模型泛化能力,采用5折交叉验证对模型进行评估,结果如
方法 Methods | 因变量 Dependent variable | 训练集 Training sets | 测试集 Testing sets | ||||
---|---|---|---|---|---|---|---|
RMSE | MAPE/% | RMSE | MAPE/% | ||||
反射光谱 Reflection spectrum |
直链淀粉含量 Content of amylose | 0.431 | 1.525 | 8.00 | 0.400 | 1.655 | 8.80 |
粗蛋白含量 Content of crude protein | 0.714 | 0.673 | 10.40 | 0.683 | 0.741 | 11.70 | |
水分含量 Content of moisture | 0.538 | 0.223 | 1.40 | 0.476 | 0.244 | 1.60 | |
透射光谱 Transmission spectrum |
直链淀粉含量 Content of amylose | 0.609 | 0.037 | 2.50 | 0.532 | 0.043 | 2.90 |
粗蛋白含量 Content of crude protein | 0.848 | 0.041 | 4.90 | 0.794 | 0.050 | 6.00 | |
水分含量 Content of moisture | 0.546 | 0.007 | 0.57 | 0.506 | 0.008 | 0.60 |
直链淀粉、粗蛋白和水分含量作为因变量分别与透射、反射光谱数据进行相关性分析,筛选出相关性绝对值大于0.3的自变量集合D,计算集合D光谱参数间的比例和归一化指数。以比例和归一化指数集合为自变量进行逐步线性回归分析,筛选出对因变量有预测效果的回归子集B、C。整合回归子集A、高相关性光谱参数集合D,比例和归一化回归子集B、C作为最终的特征光谱集合与因变量进行逐步线性回归,结果如
反射光谱 Reflection spectrum | 透射光谱 Transmission spectrum | ||
---|---|---|---|
因变量 Dependent variable |
|
因变量 Dependent variable |
|
直链淀粉含量 Amylose | 0.40 |
直链淀粉含量 Amylose | 0.67 |
粗蛋白含量 Crude protein | 0.78 |
粗蛋白含量 Crude protein | 0.89 |
水分含量 Content of moisture | 0.58 |
水分含量 Content of moisture | 0.53 |
同时使用透射、反射光谱进行建模分析,以直链淀粉、粗蛋白以及水分含量分别作为因变量,本文“2.4”计算的特征光谱集合作为自变量进行逐步线性回归。

图 6 米粒品质真实值与预测值散点图
Fig.6 Scatter plot of true and predicted of indexes of rice quality
A:粗蛋白 Crude protein; B:水分 Moisture; C:直链淀粉 Amylose.
品质指标 Indexes of rice quality | 自由度 Degree of freedom | 平方和 Quadratic sum | 均方 Mean square | F值 F-value | P | |
---|---|---|---|---|---|---|
直链淀粉含量 Amylose | 组间 Groups | 1 | 9.3421E-11 | 9.3421E-11 | 2.6896E-8 | 0.999 869 |
组内 Interclass | 198 | 0.687 743 | 0.003 473 | |||
总计 Total | 199 | 0.687 743 | ||||
水分含量 Content of moisture | 组间 Groups | 1 | 1.5014E-12 | 1.5014E-12 | 1.2114E-8 | 0.999 912 |
组内 Interclass | 198 | 0.024 539 | 0.000 124 | |||
总计 Total | 199 | 0.024 539 | ||||
粗蛋白含量 Crude protein | 组间 Groups | 1 | 1.9354E-10 | 1.9354E-10 | 1.662E-8 | 0.999 897 |
组内 Interclass | 198 | 2.305 620 | 0.011 645 | |||
总计 Total | 199 | 2.305 620 |
因变量 Dependent variable | 训练集 Training sets | 测试集 Testing sets | ||||
---|---|---|---|---|---|---|
RMSE | MAPE/% | RMSE | MAPE/% | |||
直链淀粉含量 Amylose | 0.670 | 0.034 | 2.36 | 0.623 | 0.039 | 2.71 |
粗蛋白含量 Crude protein | 0.904 | 0.036 | 4.47 | 0.868 | 0.040 | 5.03 |
水分含量 Content of moisture | 0.650 | 0.007 | 0.51 | 0.595 | 0.007 | 0.59 |
本研究基于水稻种粒透射光谱、反射光谱以及结合透射-反射光谱分别对米粒品质指标进行建模预测。其中直链淀粉含量的
本研究使用全波段反射光谱进行建模,水分、粗蛋白和直链淀粉含量的
参考文献 References
余四斌,熊银,肖景华,等.杂交稻与绿色超级稻[J].科学通报,2016,61(35):3797-3803.YU S B,XIONG Y,XIAO J H,et al.Hybrid rice and green super rice[J].Chinese science bulletin,2016,61(35):3797-3803 (in Chinese with English abstract). [百度学术]
卢林,孙成效,朱智伟,等.我国稻米品质标准及检测技术创新概述[J].中国稻米,2022,28(1):1-6.LU L,SUN C X,ZHU Z W,et al.Overview of rice quality standard and innovative detection technology in China[J].China rice,2022,28(1):1-6 (in Chinese with English abstract). [百度学术]
夏朵,周浩,何予卿.稻米品质的遗传研究及分子育种进展[J].华中农业大学学报,2022,41(1):48-61.XIA D, ZHOU H, HE Y Q.Progress of genetics and molecular breeding of rice quality[J].Journal of Huazhong Agricultural University,2022,41(1):48-61(in Chinese with English abstract). [百度学术]
孙俊,唐凯,毛罕平,等.基于MEA-BP神经网络的大米水分含量高光谱技术检测[J].食品科学,2017,38(10):272-276.SUN J,TANG K,MAO H P,et al.Hyperspectral detection of moisture content in rice based on MEA-BP neural network[J].Food science,2017,38(10):272-276 (in Chinese with English abstract). [百度学术]
赵飞,刘建,曹高燚,等.水稻品质育种与优质化栽培问题的探讨[J].杂交水稻,2022,37(2):1-6.ZHAO F,LIU J,CAO G Y,et al.Discussion on grain quality in breeding and cultivation of rice[J].Hybrid rice,2022,37(2):1-6 (in Chinese with English abstract). [百度学术]
彭波,孙艳芳,韩秋,等.水稻种子蛋白质含量检测方法的比较分析[J].江苏农业科学,2018,46(4):22-28.PENG B,SUN Y F,HAN Q,et al.Comparative analysis of detection methods of protein content in rice seeds[J].Jiangsu agricultural sciences,2018,46(4):22-28 (in Chinese). [百度学术]
王仪春,张小明,石春海.稻米直链淀粉含量测定方法的探讨[J].中国农学通报,2001,17(5):30-32,51.WANG Y C,ZHANG X M,SHI C H.Studies on the analyzing method of amylose contents in rice[J].Chinese agricultural science bulletin,2001,17(5):30-32,51 (in Chinese with English abstract). [百度学术]
张小明, 石春海, 鲍根良, 等. 稻米直链淀粉含量测定方法研讨[J]. 植物遗传资源科学, 2002(1): 31-35.ZHANG X M, SHI C H, BAO G L, et al. Studies on the analyzing method of amylose contents in rice grain[J]. Journal of plant genetic resources, 2002(1):31-35(in Chinese with English abstract). [百度学术]
盛宏达,阎金生,张克朋.用烘干法测定大米水分时须注意的几个问题[J].中国稻米,2005,11(1):40.SHENG H D,YAN J S,ZHANG K P.Several problems needing attention in determining rice moisture by drying method[J].China rice,2005,11(1):40 (in Chinese). [百度学术]
王冬,王坤,吴静珠,等.基于光谱及成像技术的种子品质无损速测研究进展[J].光谱学与光谱分析,2021,41(1):52-59.WANG D,WANG K,WU J Z,et al.Progress in research on rapid and non-destructive detection of seed quality based on spectroscopy and imaging technology[J].Spectroscopy and spectral analysis,2021,41(1):52-59 (in Chinese with English abstract). [百度学术]
ZHU M,HUANG D,HU X J,et al.Application of hyperspectral technology in detection of agricultural products and food:a review[J].Food science & nutrition,2020,8(10):5206-5214. [百度学术]
MA C Y,REN Z S,ZHANG Z H,et al.Development of simplified models for nondestructive testing of rice (with husk) protein content using hyperspectral imaging technology[J/OL].Vibrational spectroscopy,2021,114:103230[2022-10-06].https://doi.org/10.1016/j.vibspec.2021.103230. [百度学术]
戴国新,陈国兴,杨万能,等.基于高光谱的水稻精米品质参数测量技术研究[J].农业大数据学报,2019,1(2):51-63.DAI G X,CHEN G X,YANG W N,et al.Measurement technology of quality parameters of rice grain based on hyperspectral imaging on the visible-near infrared[J].Journal of agricultural big data,2019,1(2):51-63 (in Chinese with English abstract). [百度学术]
SUN D W,CEN H Y,WENG H Y,et al.Using hyperspectral analysis as a potential high throughput phenotyping tool in GWAS for protein content of rice quality[J/OL].Plant methods,2019,15:54[2022-10-06]. https://doi.org/10.1186/s13007-019-0432-x. [百度学术]
张晶,郭军,张美莉,等.基于近红外建立荞麦营养成分快速检测模型[J].中国粮油学报,2020,35(6):151-158.ZHANG J,GUO J,ZHANG M L,et al.Establishment of rapid detection model of buckwheat nutritional components based on near infrared spectroscopy[J].Journal of the Chinese cereals and oils association,2020,35(6):151-158 (in Chinese with English abstract). [百度学术]
梁秀英,李小昱,杨万能.奇异数据筛选法在玉米籽粒蛋白质近红外光谱检测中的应用[J].激光生物学报,2015,24(1):38-45.LIANG X Y,LI X Y,YANG W N.Outlier detection for measurement of protein content in maize kernels based on near-infrared reflectance spectroscopy[J].Acta laser biology sinica,2015,24(1):38-45 (in Chinese with English abstract). [百度学术]
HEMAN A,HSIEH C L.Measurement of moisture content for rough rice by visible and near-infrared (NIR) spectroscopy[J].Engineering in agriculture,environment and food,2016,9(3):280-290. [百度学术]
于宏威,王强,石爱民,等.高光谱成像技术结合化学计量学可视化花生中蛋白质含量分布[J].光谱学与光谱分析,2017,37(3):853-858.YU H W,WANG Q,SHI A M,et al.Visualization of protein in peanut using hyperspectral image with chemometrics[J].Spectroscopy and spectral analysis,2017,37(3):853-858 (in Chinese with English abstract). [百度学术]
李栓明,郭银巧,王克如,等.小麦籽粒蛋白质光谱特征变量筛选方法研究[J].中国农业科学,2015,48(12):2317-2326.LI S M,GUO Y Q,WANG K R,et al.Research on variable selection of wheat kernel protein content with near-infrared spectroscopy[J].Scientia agricultura sinica,2015,48(12):2317-2326 (in Chinese with English abstract). [百度学术]
孟庆琰,何建国,刘贵珊,等.基于近红外光谱技术的马铃薯全粉蛋白质无损检测[J].食品科技,2015,40(3):287-291.MENG Q Y,HE J G,LIU G S,et al.Potato granules protein nondestructive testing based on NIR spectroscopy analysis technology[J].Food science and technology,2015,40(3):287-291 (in Chinese with English abstract). [百度学术]
曹志敏,张志肖,王彦,等.近红外光谱法非破坏性测定绿豆籽粒粗蛋白质含量的研究[J].河北农业科学,2016,20(5):104-108.CAO Z M,ZHANG Z X,WANG Y,et al.Non-destructive test of crude protein in mungbean grain by near infrared reflectance spectroscopy[J].Journal of Hebei agricultural sciences,2016,20(5):104-108 (in Chinese with English abstract). [百度学术]
曹晓宁,田翔,赵小娟,等.基于近红外光谱法快速检测藜麦淀粉含量[J].江苏农业科学,2017,45(4):147-149.CAO X N,TIAN X,ZHAO X J,et al.Rapid detection of starch content in quinoa based on near infrared spectroscopy[J].Jiangsu agricultural sciences,2017,45(4):147-149 (in Chinese). [百度学术]
刘红芸,吴雪梅,李德仑,等.基于高光谱技术的采摘期烟叶水分含量研究[J].中国农机化学报,2021,42(9):157-163.LIU H Y,WU X M,LI D L,et al.Study on the moisture content of tobacco leaves during the picking period based on hyperspectral technology[J].Journal of Chinese agricultural mechanization,2021,42(9):157-163 (in Chinese with English abstract). [百度学术]
许建东,张淑娟,郑小南,等.高光谱技术结合变量选择方法的甘薯冻害检测研究[J].食品与发酵工业,2021,47(8):197-203.XU J D,ZHANG S J,ZHENG X N,et al.Study on the detection of sweet potato freezing damage based on hyperspectral technology and variable selection method[J].Food and fermentation industries,2021,47(8):197-203 (in Chinese with English abstract). [百度学术]
TYBURCZY C,MOSSOBA M M,FARDIN-KIA A R,et al.Evaluation of low transfat edible oils by attenuated total reflection-Fourier transform infrared spectroscopy and gas chromatography:a comparison of analytical approaches[J].Analytical and bioanalytical chemistry,2012,404(3):809-819. [百度学术]
罗曦,吴方喜,谢鸿光,等.近红外光谱的水稻抗性淀粉含量测定研究[J].光谱学与光谱分析,2016,36(3):697-701.LUO X,WU F X,XIE H G,et al.Research on resistant starch content of rice grain based on NIR spectroscopy model[J].Spectroscopy and spectral analysis,2016,36(3):697-701 (in Chinese with English abstract). [百度学术]
路辉,彭彬倩,冯晓宇,等.大米直链淀粉、蛋白质、脂肪、水分含量的近红外光谱检测模型优化[J].中国稻米,2020,26(6):55-59,63.LU H,PENG B Q,FENG X Y,et al.Model optimization for determination of amylose,protein,fat and moisture content in rice by near-infrared spectroscopy[J].China rice,2020,26(6):55-59,63 (in Chinese with English abstract). [百度学术]
唐延林,黄敬峰,王人潮.利用高光谱法估测稻穗稻谷的粗蛋白质和粗淀粉含量[J].中国农业科学,2004,37(9):1282-1287.TANG Y L,HUANG J F,WANG R C.Study on estimating the contents of crude protein and crude starch in rice panicle and paddy by hyperspectra[J].Scientia agricultura sinica,2004,37(9):1282-1287 (in Chinese with English abstract). [百度学术]