摘要
为解决田间复杂环境下小样本黄瓜叶片病害识别中模型泛化能力差、识别准确率不高的问题,将自注意力机制模块引入激活重建生成对抗网络(activation reconstruction GAN,AR-GAN),采用Smooth L1正则化作为损失函数,设计改进激活重建生成对抗网络IAR-GAN(improved AR-GAN)增广黄瓜叶片病害图像。通过在Inception网络基础上加入空洞卷积和形变卷积,设计空洞和形变卷积神经网络(dilated and deformable convolutional neural network,DDCNN)用于黄瓜叶片病害识别。试验结果显示,提出的IAR-GAN有效缓解了过拟合现象,丰富了生成样本的多样性;所提出的DDCNN对黄瓜炭疽病、斑靶病和霜霉病的平均识别准确率均达到96%以上,比Inception-V3模型提高了9个百分点。以上结果表明,本研究提出的数据增广方法和病害识别模型可为复杂环境下小样本的作物叶部病害的准确识别提供新思路。
黄瓜在其生长周期中会受到多种病害的影响,其中炭疽病、斑靶病和霜霉病较为常见。我国的黄瓜种植趋于密集型和集约
深度神经网络在作物病害识别方面取得了良好的效果,但也存在以下问题:神经网络对病害识别需要成千上万张样本图像,小样本会导致模型泛化能力下降。对病害图像进行翻转、放缩等传统的几何变换类扩充方法,仅增加样本图像数量,并没有实质性丰富样本多样性,网络容易发生过拟合现象。生成对抗网络(generative adversarial networks,GAN
现有许多研究学者使用实验室环境下采集或者用背景单一的作物病害图像作为数据集训练识别模型。黄瓜种植生长环境复杂,受到不同光照强度等因素的影响,如何针对复杂背景图像有效地进行黄瓜叶片病害识别始终面临着挑战。现有研究表明采用分割后的叶片病斑图像训练深度卷积神经网络以及进行病害识别时仍可有效提高叶片病害识别的准确
针对黄瓜叶片病害识别问题,本研究先进行病斑区域分割获得黄瓜叶片病害图像,再通过改进激活重建生成对抗网络(activation reconstruction GAN,AR-GAN)的损失函数,引入自注意力机制模块,设计了改进的激活重建生成对抗网络对小样本的黄瓜叶片病害图像进行数据增广,并提出了空洞和形变卷积神经网络(dilated and deformable convolutional neural network,DDCNN),旨在提高田间复杂环境下黄瓜叶片病害识别效果。
本试验数据集采集于2019年6-9月份安徽农业大学农萃园,对田间黄瓜叶片进行多角度拍摄,黄瓜叶片图像背景为田间复杂环境,能真实反映黄瓜在自然环境下生长的情况。采集到的数据包含斑靶病、霜霉病和炭疽病黄瓜叶片病害,采集图像如

图1 黄瓜叶片病害类型
Fig.1 Types of cucumber leaf diseases
本研究采用基于GrabCut和SVM的两阶段分割方

图2 两阶段病斑图像分割过程
Fig.2 Two-stage image segmentation method
深度卷积神经网络在黄瓜叶片病害识别时面临样本数量有限,模型在训练过程中易出现过拟合问题。而缩放、翻转等传统扩充方法并不改变图像的特征,仍然存在数据样本多样性不足的问题。使用生成对抗网络GAN进行数据增广,可有效提高样本多样性。与许多现有GAN及其变体网络相比,Nazki
(1) |
网络中生成器GAB和GBA被定义在域A和域B 2个不同的域中,当用A中的样本“a”进行初始化时,重构的a’= GBA(GAB(a))仍然接近于原始的“a”,当网络使用L1正则化时,循环一致性的公式定义为:
(2) |
激活重建损失函数fARL的引入,目的是使生成图像与真实图像更加相似,加强模型的稳定性。激活重建损失函数fARL公式为:
(3) |
(4) |
其中,θ和λ为分别调节fcyc(GAB,GBA)和fARL项的超参数。
与其他生成对抗网络相比,使用AR-GAN生成的图像与真实图像更相似,但通过试验发现,当训练样本数量有限时,AR-GAN生成的图像病斑边缘模糊且生成图像不够真实。为提高生成图像的质量,有效提升病害识别模型训练效果,本研究在AR-GAN的基础上引入了自注意力机制模块,并将AR-GAN的目标检测回归损失函数L1 Loss替换为Smooth L1 Loss,设计了改进的激活重建生成对抗网络IAR-GAN(improved activation reconstruction GAN)。
1)自注意力机制。IAR-GAN中的自注意力机制(self-attention)能够引导模型中的重建损失函数对病害图像中的关键特征进行提取,生成的病斑图像更加真实。自注意力机制由Google提出并用于自然语言处理任
(5) |
其中,x=[x1,x2,…,xt]表示网络中输入的特征信息,自注意力机制会对t个输入特征进行加权计算,并且通过引入权重向量突出关键特征的提取。
2) Smooth L1正则化。IAR-GAN将AR-GAN结构中的L1正则化替换为Smooth L1正则化,缓解梯度消失或梯度爆炸等问题。AR-GAN中采用的L1 正则化的导数为常量,在0点处不可导,导致神经网络模型在损失值较小时梯度也很大,往往造成AR-GAN收敛困难。而Smooth L1正则化提高了神经网络的稳定性的同时也加快了模型训练的收敛速度。Smooth L1正则化采用分段表示的方法,能够解决L1正则化的不足。Smooth L1正则化及其导数如式(
(6) |
(7) |
3)IAR-GAN网络结构。IAR-GAN网络结构如
(8) |

图3 IAR-GAN网络架构
Fig.3 The framework IAR-GAN
其中,为调节fcyc (GA→B,GB→A)和hself-attention(fARL)项的超参数。
深度卷积神经网络在作物病害的识别中发挥着重要作用,设计一种有效的卷积神经网络是实现准确识别的关键。为实现在田间复杂环境下黄瓜叶片病害的识别,许多研究人员通过增加卷积神经网络的深度来提取病害图像特征,但增加网络的深度会导致模型出现过拟合或梯度消失等问题,影响病害识别的准确
尽管DICNN在黄瓜病害识别方面取得了优于VGG16等方法的效果,但在田间复杂环境下获取的黄瓜叶片病害图像病斑呈现的位置、尺度各异,导致黄瓜病害的识别精度下降。本研究在DICNN基础上设计引入形变卷积,提出空洞和形变卷积神经网络DDCNN(dilated and deformable convolutional neural network),通过将卷积核的采样位置引导到叶片上的病斑位置,充分提取病斑区域的特征,从而提高模型对黄瓜叶片病害的识别精度。
1)空洞卷积。采用小尺寸卷积核替换大尺寸卷积核能够减少网络中的参数数量,且增加了网络空间特征提取能

图4 标准卷积(A)与空洞卷积(B、C)采样位置
Fig.4 Sampling position of standard convolution (A)and dilated convolution(B,C)
2)形变卷积。受环境地形和黄瓜植株生长位置的影响,相机对黄瓜叶片进行拍摄时因位置角度不同,叶片病斑在图像中呈现出的位置、尺度各异。2017年微软亚洲研究院提出了形变卷积(deformable CNN),形变卷积在对输入的特征图进行下采样时,可以按照X轴方向和Y轴方向的偏移量变换卷积位置进行采

图5 标准卷积(A)和形变卷积(B~D)采样位置
Fig.5 Sampling position of standard convolution(A) and deformable convolution(B-D)
3)DDCNN网络结构。DDCNN结构如

图6 DDCNN结构
Fig.6 The structure of DDCNN
空洞卷积为32个3×3的卷积核,卷积1为32个3×3的卷积核,卷积2为64个3×3的卷积核,形变卷积1为80个1×1的卷积核,形变卷积2为192个3×3的卷积核,Inception结构中的卷积核大小为1×1,卷积3是1 000个1×1的卷积核,池化模块1~3均为最大池化。Dilated convolution has 32 kernels with 3×3 pixels; the convolution 1 has 32 kernels with 3×3 pixels; the convolution 2 has 64 kernels with 3×3 pixels; the deformable convolution 1 has 80 kernels with 1×1 pixels; the deformable convolution 2 has 192 kernels with 3×3 pixels; the Inception structure kernels with 1×1 pixels; the convolution 3 has 1 000 kernels with 1×1 pixels; the pooling 1-3 are max pooling.
为研究提出的基于GrabCut和SVM的两阶段病斑分割方法对于提高病斑识别准确率的影响,将包含霜霉病、炭疽病和斑靶病原始叶片图像各200张,按照8∶2的比例分为训练集和测试集。接着将上述600张原始叶片病害图像数据集进行两阶段分割后,最后采用C-DCGAN进行数据增广操作,为每类病斑生成4 000张新的病斑图像。
模型 Model | 原始图像数据集 Raw diseased leaf images | 两阶段分割数据集 Two-stage segmented lesion images |
---|---|---|
C-DCGAN+VGG16 | 72.66 | 84.67 |
SVM | 53.11 | 73.21 |
kNN | 46.82 | 77.81 |
Adaboost | 41.98 | 62.98 |
从
为提高黄瓜叶片病害图像处理效率,将包含炭疽病、斑靶病和霜霉病原始叶片图像各200张的病害数据集图像大小统一调整像素为1 024×682,并将上述600张原始叶片病害图像数据集进行病斑分割后按照8∶2的比例将每类病害图像划分为训练集和测试集。为研究不同数据增广方法对识别模型准确率的提升效果,共比较了5种数据增广方法(
数据增广 Dataset augmentation | 准确率Accuracy | 平均识别 准确率 Average accuracy | ||
---|---|---|---|---|
炭疽病 Anthracnose | 斑靶病 Spot target | 霜霉病 Downy mlidew | ||
原始数据集Raw dataset | 78.33 | 72.89 | 75.67 | 75.63 |
AB | 78.17 | 76.59 | 74.69 | 76.48 |
RT | 79.67 | 76.33 | 80.97 | 78.99 |
C-DCGAN | 82.67 | 81.13 | 83.67 | 82.49 |
AR-GAN | 84.98 | 85.31 | 84.67 | 84.99 |
IAR-GAN | 90.67 | 87.67 | 86.67 | 88.34 |
注: AB表示调节图像亮度(adjust brightness),RT表示旋转和平移(rotation and translation),C-DCGAN表示条件卷积生成对抗网络。Note:AB represents adjust brightness, RT represents rotation and translation, and C-DCGAN represents conditional convolution to generate confrontation network.
从试验结果可以看出,对样本图像进行亮度调节或旋转平移的数据扩充方式虽然操作简单,但并没有增加样本图像特征信息,对黄瓜病害识别的提升作用十分有限,与传统数据增广方法相比,生成对抗网络采用图像生成的方式得到与原始样本数据分布一致的图像数据集。使用生成对抗网络对样本数据集进行增广,丰富了样本数据的多样性,对提升病害识别模型性能有明显促进作用。IAR-GAN 生成对抗网络的数据增广方法比使用C-DCGAN在3种黄瓜叶片病害的识别精度上平均高出了6个百分点,比AR-GAN生成对抗网络的数据增广方法在3种黄瓜叶片病害的识别精度上平均高出了3个百分点,表明IAR-GAN网络模型通过引入了自注意力机制模块和Smooth L1正则化后,缓解了模型梯度消失或梯度爆炸等问题,提高了网络的稳定性。
如
数据增广 Dataset augmentation | 准确率Accuracy | 平均识别 准确率 Average accuracy | ||
---|---|---|---|---|
炭疽病 Anthracnose | 斑靶病 Spot target | 霜霉病 Downy mlidew | ||
AB+IAR-GAN | 93.59 | 89.95 | 90.31 | 91.28 |
RT+IAR-GAN | 95.66 | 92.21 | 92.57 | 93.48 |
为更全面分析所提出的DDCNN网络性能,选取在农业病害图像识别中效果较好的AlexNet、ResNet、VGG16、Inception-V3、DICNN等深度学习方法进行对比分析。在验证不同深度学习方法的病害识别试验中,利用RT+IAR-GAN方法对数据集进行增广,为每种病害生成6 000张新的病斑图像作为训练样本。
模型 Model | 准确率Accuracy | 平均识别 准确率 Average accuracy | ||
---|---|---|---|---|
炭疽病 Anthracnose | 斑靶病 Spot target | 霜霉病 Downy mlidew | ||
AlexNet | 85.17 | 82.68 | 81.93 | 83.26 |
ResNet | 85.88 | 83.02 | 82.14 | 83.68 |
VGG16 | 87.81 | 84.76 | 85.41 | 85.99 |
Inception-V3 | 88.82 | 85.68 | 88.24 | 87.58 |
DICNN | 91.97 | 90.64 | 90.57 | 91.05 |
DDCNN | 97.51 | 96.38 | 96.16 | 96.68 |
如
本研究对田间复杂环境下小样本的黄瓜叶片病害识别进行研究,在AR-GAN基础上引入自注意力机制和Smooth L1正则化,设计改进激活重建生成对抗网络IAR-GAN对分割后的病斑图像进行数据增广,并提出了空洞和形变卷积神经网络DDCNN进行复杂环境下黄瓜叶片病害识别。 在黄瓜叶片病害图像数据量较少的情况下,采用传统GAN网络进行数据增广,生成图像质量低,容易产生过拟合现象。IAR-GAN通过引入自注意力机制和 Smooth L1正则化,缓解梯度消失与梯度爆炸现象,提高了收敛能力。试验结果表明,使用IAR-GAN生成增广图像的质量提升明显、丰富了样本的多样性,有效提升了病害识别模型的训练效果。受田间地形和植株生长位置影响,自然环境下获取的黄瓜叶片病害图像存在病斑形状扭曲、大小尺度不一致的情况,导致黄瓜病害的识别精度下降。DDCNN通过集成Inception、空洞卷积、形变卷积能对病斑特征进行准确提取,提高了模型识别精度。试验结果表明,DDCNN网络模型对3种黄瓜叶片病害的平均识别精度达到96%以上,病害识别的准确率较AlexNet、ResNet、VGG16、Inception-V3等深度学习方法得到了较大提升。
本研究提出的数据增广方法和病害识别模型能够有效提高田间复杂环境下小样本的黄瓜叶片病害识别效果,为病害科学防治提供支撑。后续将在以下方面进一步完善和探索:(1)增加黄瓜叶片病害种类,提高更多类病害情况下黄瓜叶片病害的识别准确率;(2)探索轻量级的病害识别模型结构,减少对于计算资源的需求,便于移动端部署。
参考文献References
毋海梅,闫浩芳,张川,等.温室滴灌黄瓜产量和水分利用效率对水分胁迫的响应[J].农业工程学报,2020,36(9):84-93.WU H M,YAN H F,ZHANG C,et al.Responses of yield and water use efficiency of drip-irrigated cucumber in greenhouse to water stress[J].Transactions of the CSAE,2020,36(9):84-93 (in Chinese with English abstract). [百度学术]
贾建楠,吉海彦.基于病斑形状和神经网络的黄瓜病害识别[J].农业工程学报,2013,29(S1):115-121.JIA J N,JI H Y.Recognition for cucumber disease based on leaf spot shape and neural network[J].Transactions of the CSAE,2013,29(S1):115-121 (in Chinese with English abstract). [百度学术]
李颀,赵洁,杨柳,等.基于GA-BP神经网络和特征向量优化组合的黄瓜叶片病斑识别[J].浙江农业学报,2019,31(3):487-495.LI Q,ZHAO J,YANG L,et al.Cucumber leaf lesion identification based on GA-BP neural network and feature vector optimization combination[J].Acta agriculturae Zhejiangensis,2019,31(3):487-495 (in Chinese with English abstract). [百度学术]
马浚诚,杜克明,郑飞翔,等.基于卷积神经网络的温室黄瓜病害识别系统[J].农业工程学报,2018,34(12):186-192.MA J C,DU K M,ZHENG F X,et al.Disease recognition system for greenhouse cucumbers based on deep convolutional neural network[J].Transactions of the CSAE,2018,34(12):186-192 (in Chinese with English abstract). [百度学术]
张善文,谢泽奇,张晴晴.卷积神经网络在黄瓜叶部病害识别中的应用[J].江苏农业学报,2018,34(1):56-61.ZHANG S W,XIE Z Q,ZHANG Q Q.Application research on convolutional neural network for cucumber leaf disease recognition[J].Jiangsu journal of agricultural sciences,2018,34(1):56-61 (in Chinese with English abstract). [百度学术]
GOODFELLOW I J,POUGET-ABADIE J,MIRZA M,et al.Generative adversarial networks[DB/OL].arXiv,2014:1406.2661[2022-12-02].https://doi.org/10.48550/arXiv.1406.2661. [百度学术]
HU G S,WU H Y,ZHANG Y,et al.A low shot learning method for tea leaf’s disease identification[J/OL].Computers and electronics in agriculture,2019,163:104852 [2022-12-02].https://doi.org/10.1016/j.compag.2019.104852. [百度学术]
CAP Q H,UGA H,KAGIWADA S,et al.LeafGAN:an effective data augmentation method for practical plant disease diagnosis[J].IEEE transactions on automation science and engineering,2022,19(2):1258-1267. [百度学术]
MADSEN S L,DYRMANN M,JØRGENSEN R N,et al.Generating artificial images of plant seedlings using generative adversarial networks[J].Biosystems engineering,2019,187:147-159. [百度学术]
PURBAYA M E,SETIAWAN N A,ADJI T B.Leaves image synthesis using generative adversarial networks with regularization improvement[C]//Proceedings of 2018 International Conference on Information and Communications Technology (ICOIACT).Yogyakarta:IEEE,2018:360-365. [百度学术]
ZHANG M,LIU S H,YANG F Y,et al.Classification of canker on small datasets using improved deep convolutional generative adversarial networks[J].IEEE access,2019,7:49680-49690. [百度学术]
陈佛计,朱枫,吴清潇,等.生成对抗网络及其在图像生成中的应用研究综述[J].计算机学报,2021,44(2):347-369.CHEN F J,ZHU F,WU Q X,et al.A survey about image generation with generative adversarial nets[J].Chinese journal of computers,2021,44(2):347-369 (in Chinese with English abstract). [百度学术]
SHARMA P,BERWAL Y P S,GHAI W.Performance analysis of deep learning CNN models for disease detection in plants using image segmentation[J].Information processing in agriculture,2020,7(4):566-574. [百度学术]
MA J C,DU K M,ZHENG F X,et al.A recognition method for cucumber diseases using leaf symptom images based on deep convolutional neural network[J].Computers and electronics in agriculture,2018,154:18-24. [百度学术]
ZHANG J Y,RAO Y,MAN C,et al.Identification of cucumber leaf diseases using deep learning and small sample size for agricultural Internet of Things[J/OL].International journal of distributed sensor networks,2021,17(4):155014772110074[2022-12-02].https://doi.org/10.1177/15501477211007407. [百度学术]
NAZKI H,YOON S,FUENTES A,et al.Unsupervised image translation using adversarial networks for improved plant disease recognition [J/OL].Computers and electronics in agriculture,2020,168:105117 [2022-12-02].https://doi.org/10.1016/j.compag.2019.105117. [百度学术]
LI P,TANG C,XU X H.Video summarization with a graph convolutional attention network[J].Frontiers of information technology & electronic engineering,2021,22(6):902-913. [百度学术]
樊湘鹏,周建平,许燕,等.基于改进卷积神经网络的复杂背景下玉米病害识别[J].农业机械学报,2021,52(3):210-217.FAN X P,ZHOU J P,XU Y,et al.Corn disease recognition under complicated background based on improved convolutional neural network[J].Transactions of the CSAM,2021,52(3):210-217 (in Chinese with English abstract). [百度学术]
温德圣,许燕,周建平,等.自然光照影响下基于深度卷积神经网络和颜色迁移的杂草识别方法[J].中国科技论文,2020,15(3):287-292.WEN D S,XU Y,ZHOU J P,et al.Weed identification method based on deep convolutional neural network and color migration under the influence of natural illumination[J].China sciencepaper,2020,15(3):287-292 (in Chinese with English abstract). [百度学术]
王璨,武新慧,李志伟.基于卷积神经网络提取多尺度分层特征识别玉米杂草[J].农业工程学报,2018,34(5):144-151.WANG C,WU X H,LI Z W.Recognition of maize and weed based on multi-scale hierarchical features extracted by convolutional neural network[J].Transactions of the CSAE,2018,34(5):144-151 (in Chinese with English abstract). [百度学术]
王春山,周冀,吴华瑞,等.改进Multi-scale ResNet的蔬菜叶部病害识别[J].农业工程学报,2020,36(20):209-217.WANG C S,ZHOU J,WU H R,et al.Identification of vegetable leaf diseases based on improved Multi-scale ResNet[J].Transactions of the CSAE,2020,36(20):209-217 (in Chinese with English abstract). [百度学术]
ZHANG S W,ZHANG S B,ZHANG C L,et al.Cucumber leaf disease identification with global pooling dilated convolutional neural network[J].Computers and electronics in agriculture,2019,162:422-430. [百度学术]
鲍文霞,黄雪峰,胡根生,等.基于改进卷积神经网络模型的玉米叶部病害识别[J].农业工程学报,2021,37(6):160-167.BAO W X,HUANG X F,HU G S,et al.Identification of maize leaf diseases using improved convolutional neural network[J].Transactions of the CSAE,2021,37(6):160-167 (in Chinese with English abstract). [百度学术]
吉训生,王昊.基于优化可形变区域全卷积神经网络的人头检测方法[J].激光与光电子学进展,2019,56(14):129-139.JI X S,WANG H.Head detection method based on optimized deformable regional fully convolutional neutral networks[J].Laser & optoelectronics progress,2019,56(14):129-139 (in Chinese with English abstract). [百度学术]