摘要
图像分割作为智慧农业养殖中“视觉系统”的重要组成部分,被广泛应用于畜禽的智慧养殖中。近年来,深度学习算法飞速发展,基于深度学习的图像分割技术也取得了重大突破。这些方法赋予了分割区域更准确的语义信息,使得图像分割更加精准和智能,为畜禽智慧养殖提供了更强的技术支持。本文通过广泛收集和整理国内外研究的相关文献,重点阐述了图像分割技术在畜禽养殖中的畜禽计数、体尺体质量测量、姿态估计与行为识别、体况及疾病检测、精准饲养等方面的应用现状,给出了如何根据实际性能需求(精度、处理速度)、数据集、计算资源等方面选择合适图像分割方法的建议,总结分析了当前研究中与畜禽养殖相关且可用于图像分割训练的公开数据集;并指出了基于深度学习的图像分割技术在畜禽养殖中所面临的挑战与未来的发展趋势,希望能为畜禽养殖中图像分割技术的具体应用提供参考。
在当今市场需求和科技发展的双重推动下,畜禽养殖面临着养殖模式亟需改造升级、养殖品质有待提升等问题。传统畜禽养殖主要依赖人工监测,这种方式耗时、费力、主观性强,并且在连续、大规模的操作中难以实现。针对这些问题,以计算机视觉为主要技术的智慧养殖逐渐兴起。图像分割是计算机视觉中的核心技术之一,根据相关特征(如亮度、纹理等)将图像中感兴趣的目标提取出
Kirillov

图1 图像分割技术分类示例
Fig. 1 An example of image segmentation technology classification
A.猪场的实际图像 Actual image of piggery; B.语义分割 Semantic segmentation; C.实例分割 Instance segmentation; D.全景分割 Panoptic segmentation.
深度学
基于深度学习的图像分割技术在农业中的应用是目前的研究热点之一,但是大部分研究都是将该技术应用于作物种植,在畜禽养殖中的应用却很少涉及,其中也鲜有根据实际需求和应用场景来选择合适的图像分割方法的系统梳理。本文围绕基于深度学习的图像分割技术在畜禽养殖中的应用现状进行综述,给出了如何根据实际需求和应用场景选择合适图像分割方法的建议,总结了当前文献中与畜禽养殖相关的公开数据集,最后分析了当前所面临的挑战并提出展望,旨在为图像分割技术在我国畜禽养殖业升级转型中发挥更大作用提供参考。
近年来,基于深度学习的图像分割技术在猪、牛、羊、马、鸡等畜禽的养殖中都有应用,主要包括畜禽自动计数、体尺体质量测量、姿态估计与行为识别、体况及疾病检测、精准饲养等。
个体计数是畜禽养殖中的基本工作。应用自动计数可以极大减轻养殖管理人员的工作量。Xu
以上研究结果显示,语义分割方法(U-Net)和实例分割方法(Mask R-CNN)均可以实现自动计数的功能。计数功能对图像分割的精度要求不高,如Sarwar
使用基于深度学习的图像分割技术等人工智能算法,可以实现体尺体质量的自动测量。文
在上述研究中,为了降低算法的复杂度,确保采集到的图像更加标准且区分度高、无遮挡或有少量的遮挡(但不影响算法的执行效率),部分文献在采集图像时使用到了一些特定的装置设置,如限定
姿态估计与行为识别有助于实现养殖过程的无人监控,及时发现畜禽的状态变化,了解其行为信息,提高养殖管理效率。如Yang
刘生
做好畜禽体况及疾病检测可以帮助养殖场或企业及时监测畜禽的健康状况,及早发现疫病并遏制其进一步蔓延,降低损失。刘坤
Qiao
Lamping
基于深度学习的图像分割技术在畜禽体况及疾病检测中的应用也比较广泛,上述8篇文献中有6篇文献选取了Mask R-CNN方法作为其核心的辅助方法来实现对畜禽的体况和疾病进行检测,另外2篇则采用YOLO辅助的图像分割方法来进行处理。由上述文献可知Mask R-CNN方法处理速度一般(0.523 3~1.02 s/帧),但是相较于基于YOLO的方法,Mask R-CNN方法则更加侧重于准确性。
此外,在上述的研究中大部分算法在统计分割精度时使用的是IoU≥0.5的条件,但是很少有研究统计IoU≥0.75或IoU≥0.90(意味着图像分割要求更高)等条件下的图像分割精度。其中,刘坤
畜禽精准饲养是养殖场或企业实现降本增效的重要途径,这不仅要求精准满足畜禽的营养需求,更要以更高效的方式监测、管控和管理畜禽养殖过程。Yang
在上述研究中,所采集的数据均来自于各自合作的养殖场或企业,用于训练的数据集规模为420~128 062张图像(其中大部分文献中所使用的数据集规模为2 000~5 000张图像样本),且90%以上的文献均未正式标明公开数据集。在畜禽养殖中,基于Mask R-CNN的图像分割方法应用最多,主要原因有以下两点:一是受数据集大小的限制,二是对处理的精度要求高。
在数据集、图像分割方法、计算资源等要素中,与图像分割精度相关的要素有:数据集、图像分割方法;与预测结果处理速度相关的要素有:图像分割方法、计算资源。根据实际性能需求(精度、处理速度)、数据集、计算资源来选择合适的图像分割方法的具体建议如下:
当数据集不够大、对精度要求高、无实时性要求时,可以尝试使用Mask R-CNN及其相关的图像分割方法。虽然该类方法针对实时性的要求有了较大的提升,同时也尽可能地保证了分割结果的准确性,但是该类方法处理的速度仍然需要每秒传输5~20帧(frames per second,FPS),即每张图像处理时间50~200 ms,甚至还有相关方法为保障准确性从而进一步牺牲掉实时性要求,例如Xiao
当数据集不够大、但又对实时性要求高时,可将YOLO系列速度快的特性结合进来(YOLO-Fastest处理图像速度最高可达178 FP
当数据集足够大且有充沛的计算资源时,则可以尝试使用ViT及其相关的图像分割方法。如He
目前,公开数据集中涉及畜禽养殖的非常少。已经公开的数据集主要包括Microsoft COCO(common objects in context)数据
数据集 Dataset | 涉及物种 Poultry and livestock involved | 图像类型及大小、规模 Type, size and amount of the images | 文献 Literature |
---|---|---|---|
Microsoft COCO Dataset | 马、羊、牛 | 12.3万张RGB图像,图像尺寸不一,共80个实例目标,每个实例目标平均约1万张 |
[ |
PASCAL VOC | 马、羊、牛 | 11 540张JPEG图像,图像尺寸不一,主要包括20个类别、27 450个ROI标注对象和6 929个分割标注 |
[ |
Google Open Images Dataset | 牛、骆驼、山羊、马、猪、兔、鸡、鸭 | 190万张图像,图像尺寸不一,主要包括600个类别、270万个实例掩码 |
[ |
SA-1B | 牛、马等多种畜禽 | 1 100万张高分辨率的图像以及11亿个高质量的分割掩码,图片平均分辨率达1 500×2 250 |
[ |
在畜禽养殖应用中图像分割技术发展也面临着一些挑战,具体如下:
1)数据采集难,直接用于畜禽养殖领域的图像分割公开数据集非常少。在查阅的文献资料中,超过九成的畜禽养殖应用所使用的图像分割数据集均采集于和研究团队有深度合作的养殖场。与作物种植领域不同的是,畜禽养殖中所面临的研究对象都是动物,这些动物在数据采集过程中会运动。这就造成数据采集的困难,很难采集到比较好的数据。这也间接导致图像分割技术在畜禽养殖领域的应用程度没有作物种植领域的广泛。养殖场中严格的消杀防护制度也愈发增加了数据采集的难度,从而进一步导致畜禽养殖领域中的图像分割数据集减少。
2)数据集标注成本高、标注质量难保证。在图像分割中,人工手动标注一份数据,需要大量的时间和精力,而且还不能够完全保证标注数据的质量。特别是在基于深度学习的图像分割方法中,需要有大量的、高质量的标注数据用于训练、测试和验证,才能够得到更好的精确度。
3)真实生产环境对图像分割的要求越来越高。为了让视觉系统能够像人的视觉一样“看到并且分清”目标,需要算法能够实时、高标准、高精度地完成分割任务。在提高分割要求的前提下(如IoU≥0.75或IoU≥0.90),图像分割算法的处理速度与准确率难以同时保证。
4)部分技术的普适性不够。在很多的畜禽养殖应用中,为了保障图像分割的效果,使用了一些特殊的设备装置,如特殊的测量限定栏、深度摄像机、高性能服务器等,或者是对环境和品种都有要求。这使得部分图像分割技术成本高,一些小型养殖机构无法承担,导致实际推广难度大,从而使得畜禽养殖产业难以改革升级。
5)技术应用的扩展性不够、实用性不强、后续产业技术链条实现困难。目前很多技术仅处于理论研究阶段,难以运用到实际生产环节中。虽然有些技术可以运用到生产环节,但是操作复杂、运行成本高,实用性不强。对于畜禽智慧养殖来说,要想真正做到完全智慧化,当前的技术真正落地还有很多的工作需要去完成,例如动物个体身份精准识别问题。这是整个畜禽智慧养殖领域中最基础、最核心的问题。如果这个问题不能得到有效的解决,那么后续的行为分析、健康预测管理等各个环节将无法有效实施,从而导致无法完整地建立智慧养殖体系。这使得整个产业技术链条的实现落地难度很大。
结合当前畜禽养殖中图像分割数据集少、数据集标注人工成本高等问题,我们可以充分结合小样本学习(few-shot learning
针对在高标准下图像分割算法难以同时保证实时性与高精度的问题,我们可以对Mask R-CNN系列、YOLO系列和ViT系列算法模型进行改进。改进时可以尝试直接在其原有的结构上进行,也可以充分借鉴并整合以上3类算法模型各自的优势之处进行改进,此外也可以进一步借鉴SAM模型的优势进行改进。除了对算法模型进行改进外,我们也可以借助“外物”在确保算法精度的基础之上提升其处理的速度,比如:高清的深度摄像机等工具。
数据采集难主要原因是采集活物难度大、投入成本高而收益低,养殖企业不愿意做。而部分技术的普适性不够,技术应用的扩展性不够、实用性不强、后续产业技术链条实现困难。其主要原因是科技研发与养殖企业真实需求相分离,无法进行更贴合实际的应用开发。要解决这些问题则需要以政府为主导,积极促成养殖企业与科技公司或相关研究机构进行深度合作,并对合作给予一定的扶持或补助政策,促使养殖企业愿意配合数据采集、实际需求的深度挖掘,从而进一步促进技术的快速发展,并且可以让技术再促进养殖企业的转型升级(如智能采集、智能标注等),最终形成行业内部的良性循环,实现技术与产业的同步发展。
综上所述,目前全面实现畜禽的智慧养殖仍然有较长的一段路要走。要想扎实推进畜禽的智慧养殖,首要的工作是完善充实基础数据。因此,今后最核心的工作方向是要形成一套系统的、高质量的、海量的畜禽养殖图像分割数据集,并通过一定的方式进行共享。同时,政府、行业企业、科研机构三方要紧密合作,政府提供政策保障,科研机构紧跟行业企业的切实需求,三方协同发力,共同推进畜禽智慧养殖技术的应用落地,为我国畜禽养殖业的升级转型提供坚实基础。
参考文献References
梁新宇,罗晨,权冀川,等.基于深度学习的图像语义分割技术研究进展[J].计算机工程与应用,2020,56(2):18-28.LIANG X Y,LUO C,QUAN J C,et al.Research on progress of image semantic segmentation based on deep learning[J].Computer engineering and applications,2020,56(2):18-28 (in Chinese with English abstract). [百度学术]
XU B B,WANG W S,FALZON G,et al.Automated cattle counting using Mask R-CNN in quadcopter vision system[J/OL].Computers and electronics in agriculture,2020,171:105300[2022-10-10].http://dx.doi.org/10.1016/j.compag.2020.105300. [百度学术]
HUANG E D,MAO A X,GAN H M,et al.Center clustering network improves piglet counting under occlusion[J/OL].Computers and electronics in agriculture,2021,189:106417[2022-10-10].http://dx.doi.org/10.1016/j.compag.2021.106417. [百度学术]
SARWAR F,GRIFFIN A,REHMAN S U,et al.Detecting sheep in UAV images[J/OL].Computers and electronics in agriculture,2021,187:106219[2022-10-10].http://dx.doi.org/10.1016/j.compag.2021.106219. [百度学术]
HE H X,QIAO Y L,LI X M,et al.Optimization on multi-object tracking and segmentation in pigs’ weight measurement[J/OL].Computers and electronics in agriculture,2021,186:106190[2022-10-10].http://dx.doi.org/10.1016/j.compag.2021.106190. [百度学术]
文博.基于Mask R-CNN的牛体尺测量方法研究[D].包头:内蒙古科技大学,2020.WEN B.Research on measurement method of cattle body size based on Mask R-CNN[D].Baotou:Inner Mongolia University of Science & Technology,2020 (in Chinese with English abstract). [百度学术]
ZHENG H K,FANG C,ZHANG T M,et al.Shank length and circumference measurement algorithm of breeder chickens based on extraction of regional key points[J/OL].Computers and electronics in agriculture,2022,197:106989[2022-10-10].http://dx.doi.org/10.1016/j.compag.2022.106989. [百度学术]
CHEN C,ZHU W X,NORTON T.Behaviour recognition of pigs and cattle:journey from computer vision to deep learning[J/OL].Computers and electronics in agriculture,2021,187:106255[2022-10-10].http://dx.doi.org/10.1016/j.compag.2021.106255. [百度学术]
SHAO H M,PU J Y,MU J.Pig-posture recognition based on computer vision:dataset and exploration[J/OL].Animals,2021,11(5):1295[2022-10-10].https://doi.org/10.3390/ani11051295. [百度学术]
GAN H M,OU M Q,LI C P,et al.Automated detection and analysis of piglet suckling behaviour using high-accuracy amodal instance segmentation[J/OL].Computers and electronics in agriculture,2022,199:107162[2022-10-10].http://dx.doi.org/10.1016/j.compag.2022.107162. [百度学术]
孔商羽,陈春雨.基于多任务学习的猪只体重和体况评分预测[J].黑龙江大学工程学报,2022,13(2):70-77.KONG S Y,CHEN C Y.Multi-tasking learning on prediction of pig weight and body condition score[J].Journal of Engineering of Heilongjiang University,2022,13(2):70-77 (in Chinese with English abstract). [百度学术]
XIAO J X,LIU G,WANG K J,et al.Cow identification in free-stall barns based on an improved Mask R-CNN and an SVM[J/OL].Computers and electronics in agriculture,2022,194:106738[2022-10-10].http://dx.doi.org/10.1016/j.compag.2022.106738. [百度学术]
LAMPING C,DERKS M,GROOT KOERKAMP P,et al.ChickenNet-an end-to-end approach for plumage condition assessment of laying hens in commercial farms using computer vision[J/OL].Computers and electronics in agriculture,2022,194:106695[2022-10-10].http://dx.doi.org/10.1016/j.compag.2022.106695. [百度学术]
YANG A Q,HUANG H S,ZHENG C,et al.High-accuracy image segmentation for lactating sows using a fully convolutional network[J].Biosystems engineering,2018,176:36-47. [百度学术]
KIRILLOV A,HE K M,GIRSHICK R,et al.Panoptic segmentation[DB/OL].arXiv,2018:1801.00868[2022-10-10].https://doi.org/10.48550/arXiv.1801.00868. [百度学术]
赵霞,白雨,倪颖婷,等.基于深度学习的语义分割算法综述[J].上海航天,2019,36(5):71-82.ZHAO X,BAI Y,NI Y T,et al.A review of semantic segmentation algorithm based on deep learning[J].Aerospace Shanghai,2019,36(5):71-82(in Chinese with English abstract). [百度学术]
LONG J,SHELHAMER E,DARRELL T.Fully convolutional networks for semantic segmentation[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),June 7-12,2015.Boston,MA,USA:IEEE,2015:3431-3440. [百度学术]
CHEN L C,PAPANDREOU G,KOKKINOS I,et al.Semantic image segmentation with deep convolutional nets and fully connected CRFs[DB/OL].arXiv,2014:1412.7062[2022-10-10].https://doi.org/10.48550/arXiv.1412.7062. [百度学术]
RONNEBERGER O,FISCHER P,BROX T.U-net:convolutional networks for biomedical image segmentation[C]//International Conference on Medical Image Computing and Computer-Assisted Intervention.Cham:Springer,2015:234-241. [百度学术]
ZHAO H S,SHI J P,QI X J,et al.Pyramid scene parsing network[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),July 21-26,2017.Honolulu, HI, USA:IEEE,2017:6230-6239. [百度学术]
HE K M,GKIOXARI G,DOLLÁR P,et al.Mask R-CNN[J].IEEE transactions on pattern analysis and machine intelligence,2020,42(2):386-397. [百度学术]
黄鹏,郑淇,梁超.图像分割方法综述[J].武汉大学学报(理学版),2020,66(6):519-531.HUANG P,ZHENG Q,LIANG C.Overview of image segmentation methods[J].Journal of Wuhan University (natural science edition),2020,66(6):519-531 (in Chinese with English abstract). [百度学术]
梁新宇,林洗坤,权冀川,等.基于深度学习的图像实例分割技术研究进展[J].电子学报,2020,48(12):2476-2486.LIANG X Y,LIN X K,QUAN J C,et al.Research on the progress of image instance segmentation based on deep learning[J].Acta electronica sinica,2020,48(12):2476-2486 (in Chinese with English abstract). [百度学术]
YU Y,WANG C P,FU Q A,et al.Techniques and challenges of image segmentation:a review[J/OL].Electronics,2023,12(5):1199[2023-04-28].https://doi.org/10.3390/electronics12051199. [百度学术]
张泽宇,郭斌,张太红.基于DCNN的马匹图像分割算法研究[J].计算机技术与发展,2020,30(10):210-215.ZHANG Z Y,GUO B,ZHANG T H.Research on horse image segmentation algorithm based on DCNN[J].Computer technology and development,2020,30(10):210-215 (in Chinese with English abstract). [百度学术]
张婧婧,程芸涛.基于图像分割的马体尺测量系统设计[J].计算机技术与发展,2020,30(3):177-180.ZHANG J J,CHENG Y T.Design of horse size measurement system based on image segmentation[J].Computer technology and development,2020,30(3):177-180 (in Chinese with English abstract). [百度学术]
BOLYA D,ZHOU C,XIAO F Y,et al.YOLACT:YOLACT: real-time instance segmentation[DB/OL].arXiv,2019:1904.02689[2022-10-10].https://doi.org/10.48550/arXiv.1904.02689. [百度学术]
HE H X,QIAO Y L,LI X M,et al.Automatic weight measurement of pigs based on 3D images and regression network[J/OL].Computers and electronics in agriculture,2021,187:106299[2022-10-10].http://dx.doi.org/10.1016/j.compag.2021.106299. [百度学术]
YANG A Q,HUANG H S,YANG X F,et al.Automated video analysis of sow nursing behavior based on fully convolutional network and oriented optical flow[J/OL].Computers and electronics in agriculture,2019,167:105048[2022-10-10].http://dx.doi.org/10.1016/j.compag.2019.105048. [百度学术]
宋晨波.基于深度学习的母猪行为检测方法研究[D].杭州:浙江大学,2019.SONG C B.Research on sow behavior detection method based on deep learning[D].Hangzhou:Zhejiang University,2019 (in Chinese with English abstract). [百度学术]
CHEN C,ZHU W X,STEIBEL J,et al.Recognition of feeding behaviour of pigs and determination of feeding time of each pig by a video-based deep learning method[J/OL].Computers and electronics in agriculture,2020,176:105642[2022-10-10].http://dx.doi.org/10.1016/j.compag.2020.105642. [百度学术]
高云,廖慧敏,黎煊,等.基于双金字塔网络的RGB-D群猪图像分割方法[J].农业机械学报,2020,51(7):36-43.GAO Y,LIAO H M,LI X,et al.RGB-D segmentation method for group piglets images based on double-pyramid network[J].Transactions of the CSAM,2020,51(7):36-43 (in Chinese with English abstract). [百度学术]
张凯中,朱伟兴.基于改进Mask RCNN的俯视群养猪图像的分割[J].软件,2020,41(3):188-191.ZHANG K Z,ZHU W X.Segmentation of overlooking group pig images based on improved mask RCNN[J].Computer engineering & software,2020,41(3):188-191 (in Chinese with English abstract). [百度学术]
LI K,MALIK J.Amodal instance segmentation[C]//European Conference on Computer Vision.Cham:Springer,2016:677-693. [百度学术]
刘生智.基于深度学习的奶牛目标检测与身份识别研究[D].阿拉尔:塔里木大学,2020.LIU S Z.Research on object detection and identification of dairy cows based on deep learning[D].Ala'er:Tarim University,2020(in Chinese with English abstract). [百度学术]
JIANG B,WU Q,YIN X Q,et al.FLYOLOv3 deep learning for key parts of dairy cow body detection[J/OL].Computers and electronics in agriculture,2019,166:104982[2022-10-10].http://dx.doi.org/10.1016/j.compag.2019.104982. [百度学术]
刘坤,杨怀卿,杨华,等.基于循环残差注意力的群养生猪实例分割[J].华南农业大学学报,2020,41(6):169-178.LIU K,YANG H Q,YANG H,et al.Instance segmentation of group-housed pigs based on recurrent residual attention[J].Journal of South China Agricultural University,2020,41(6):169-178 (in Chinese with English abstract). [百度学术]
TU S Q,YUAN W J,LIANG Y,et al.Automatic detection and segmentation for group-housed pigs based on PigMS R-CNN[J/OL].Sensors,2021,21(9):3251[2022-10-10].https://doi.org/10.3390/s21093251. [百度学术]
JU M,CHOI Y,SEO J,et al.A kinect-based segmentation of touching-pigs for real-time monitoring[J/OL].Sensors,2018,18(6):1746[2022-10-10].https://doi.org/10.3390/s18061746. [百度学术]
SEO J,SA J,CHOI Y,et al.A YOLO-based separation of touching-pigs for smart pig farm applications[C]//2019 21st International Conference on Advanced Communication Technology (ICACT).February 17-20,2019,Pyeong Chang,Korea (South):IEEE,2019:395-401. [百度学术]
QIAO Y L,TRUMAN M,SUKKARIEH S.Cattle segmentation and contour extraction based on Mask R-CNN for precision livestock farming[J/OL].Computers and electronics in agriculture,2019,165:104958[2022-10-10].http://dx.doi.org/10.1016/j.compag.2019.104958. [百度学术]
FERREIRA R E P,BRESOLIN T,ROSA G J M,et al.Using dorsal surface for individual identification of dairy calves through 3D deep learning algorithms[J/OL].Computers and electronics in agriculture,2022,201:107272[2022-10-10].http://dx.doi.org/10.1016/j.compag.2022.107272. [百度学术]
dog-qiuqiu.dog-qiuqiu/YOLO-Fastest:YOLO-fastest-v1.1.0[Z/OL].Zenodo,2021.[2022-10-10].http://doi.org/10.5281/zenodo.5131532. [百度学术]
LIN T Y,MAIRE M,BELONGIE S,et al.Microsoft COCO:common objects in context[DB/OL].arXiv,2014:1405.0312[2022-10-10].https://doi.org/10.48550/arXiv.1405.0312. [百度学术]
EVERINGHAM M,VAN GOOL L,WILLIAMS C K I,et al.The pascal visual object classes (VOC) challenge[J].International journal of computer vision,2010,88(2):303-338. [百度学术]
RUSSAKOVSKY O,DENG J,SU H,et al.ImageNet large scale visual recognition challenge[J].International journal of computer vision,2015,115(3):211-252. [百度学术]
KRIZHEVSKY A.Learning multiple layers of features from tiny images[EB/OL].Semantic scholar,2009:18268744[2022-10-10].https://www.semanticscholar.org/paper/5d90f06bb70a0a3dced62413346235c02b1aa086. [百度学术]
KUZNETSOVA A,ROM H,ALLDRIN N,et al.The Open Images Dataset V4:unified image classification,object detection,and visual relationship detection at scale[J].International journal of computer vision volume, 2020,128:1956-1981. [百度学术]
KIRILLOV A,MINTUN E,RAVI N,et al.Segment anything[DB/OL].arXiv,2023:2304.02643[2023-04-28].https://doi.org/10.48550/arXiv.2304.02643. [百度学术]
AYYAD A,LI Y,NAVAB N,et al. Semi-Supervised Few-Shot Learning with Local and Global Consistency[DB/OL].arXiv,2019:1903.02164[2022-10-10].https://doi.org/10.48550/arXiv.1903.02164. [百度学术]
XIE B H,YUAN L H,LI S,et al.Towards fewer annotations:active learning via region impurity and prediction uncertainty for domain adaptive semantic segmentation[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR),June 18-24,2022.New Orleans,LA,USA:IEEE,2022:8058-8068. [百度学术]
BOTACH A,ZHELTONOZHSKII E,BASKIN C.End-to-end referring video object segmentation with multimodal transformers[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR).New Orleans,LA,USA:IEEE,2022:4975-4985. [百度学术]
JI W,LI J J,BI Q,et al.Segment anything is not always perfect:an investigation of SAM on different real-world applications[DB/OL].arXiv,2023:2304.05750[2023-04-28].https://doi.org/10.48550/arXiv.2304.05750. [百度学术]