数量预测是渔业资源评估和水产养殖的重要内容,随着水产养殖规模的不断扩大,淡水鱼数量预测的研究具有重要的现实意义[1]。渔业资源调查中常用大型渔具试捕[2-3]、主动声学探测[4-5]、被动声学监测[6-7]等方法评估渔业资源种类组成和数量分布,建立渔业资源评估模型和方法。渔具试捕对鱼类存在一定程度的损伤,主动声学探测成本较高,被动声学监测研究目前主要应用于海洋资源调查,该方法成本较低、无损、不受能见度的影响,将被动水声技术引入淡水鱼养殖领域具有极大的优势。
本研究在前期单品种淡水鱼种类识别和数量估计的基础上[8-9],进一步采用被动水声技术实现淡水鱼混合数量预测。以鳊(Parabramis pekinensis)和鲫(Carassius auratus)为研究对象,采集了在数量比1∶1混合比例下,15种混合数量的鳊和鲫的被动水声信号,提取平均Mel频率倒谱系数、一阶平均Mel频率倒谱系数、二阶平均Mel频率倒谱系数、基于功率谱的主峰频率和主峰值、小波包分解频段能量等特征参数,采用多元线性回归(multiple linear regression,MLR)建立淡水鱼混合数量预测模型,旨在为渔业资源调查和水产养殖中的数量监测提供新的手段。
选取鳊(Parabramis pekinensis)和鲫(Carassius auratus)作为试验材料,在华中农业大学农贸品市场购买鳊和鲫各30尾。鳊每尾600~700 g,鲫每尾300~350 g。淡水鱼被动水声信号采集装置如图1所示,其主要包括SM2+型声学记录仪、HTI-96-MIN型水听器和隔音鱼箱,其中HTI-96-MIN
1.试验鱼箱 Test fish box; 2.1号水听器 Hydrophone No. 1; 3.声学记录仪 Acoustic recorder; 4.2号水听器 Hydrophone No. 2; 5.对照鱼箱 Control fish box.
图1 淡水鱼被动水声信号采集装置
Fig.1 Freshwater fish passive acoustic
signal acquisition device
型的频率响应范围为2~30 000 Hz,动态响应范围为78~165 dB·SPL。鱼箱高为73 cm、直径为60 cm、壁厚为0.5 cm,容积约为200 L。鱼箱外表面覆盖隔音海绵,以减弱外界噪声对试验的干扰,其中试验鱼箱用于采集鱼声信号,对照鱼箱用于采集环境噪声,用于后续信号预处理。
1)信号采集。利用淡水鱼被动水声信号采集装置进行混养鳊和鲫的声音信号采集。首先往水箱中注入约180 L左右的水,将水听器置于水面以下10 cm处,测量试验环境参数,其中水温为10~15 ℃,pH值为7.2~7.5,溶氧量为7~8 mg/L,设置声学记录仪的采集时长为1 min,采样频率为4 000 Hz,静置10 min后开始信号采集。采集鳊和鲫在数量比为1∶1混合条件下,总数量依次从2、4、6条递增至30条情况下的声音信号,依次称之为数量梯度1、梯度2、梯度3、…、梯度15,每种数量梯度采集60个样本,共采集900个水声信号样本。
2)信号预处理。受外界环境因素的干扰,上述采集的淡水鱼水声信号样本中含有噪声。若直接运用采集的原始信号进行比例识别,准确性会极大地降低。因此,在提取水声信号特征之前需要进行滤波、消噪等预处理。本研究运用Cool Edit Pro数字音频编辑器对鱼声信号进行背景环境噪音消除,并采用butter函数进行滤波。考虑到常见淡水鱼的鱼声信号频率在1 000 Hz以内[10],因此设置低通滤波器截止频率为1 000 Hz,阶数取为4。
3)特征参数提取。声信号被动识别的关键是从采集的声音信号中提取有效的识别特征,找到有效的特征提取技术。Mel频率[11]是根据人耳听觉特性提出来的,能够有效提取用于目标分类识别的特征。功率谱[12]表示了信号随能量的变化关系,反映了随机信号中隐藏的周期性规律。小波包分解[13]可以依据鱼声信号特性和分析要求自适应地获取相匹配的时频局部特征,直观地反映鱼声信号的特征规律。因此,本研究提取了12维平均Mel频率倒谱系数、12维一阶平均Mel频率倒谱系数、12维二阶平均Mel频率倒谱系数、基于功率谱的主峰频率和主峰值、4层小波包分解频段能量作为鱼声信号的特征参数。将上述所提取的特征参数进行归一化[14-15],并建立鱼声信号特征向量X=[x1 x2 ... x54],其中x1~x16为小波包分解频段能量,x17~x28为平均Mel频率倒谱系数,x29~x40为一阶平均Mel频率倒谱系数,x41~x52为二阶平均Mel频率倒谱系数,x53为功率谱主峰频率,x54为功率谱主峰值。
4)相关性分析。利用SPSS 23.0 软件对所提取的54个特征参数和数量梯度进行相关分析,使用皮尔逊(Pearson)双侧检验法分析其显著性,挑选出与淡水鱼混合数量极显著相关的特征来进行建模。
5)样本集划分。将经过上述数据处理后的900个水声信号样本运用Rank-RS法进行样本集划分,其基本过程为先将所有样本按因变量升序排列并均匀划分为若干份,在每份中按训练集与测试集数量比为4∶1的比例随机挑选。将900个样本均分为15组,每组中随机挑出48个样本作为训练集,剩下的12个样本作为测试集,最终训练集样本数为720个,测试集样本数为180个。
6)模型的建立。主要采用多元线性回归[16-18]来建立模型,并将其与偏最小二乘法(partial least squares regression,PLSR)的模型预测效果进行比较,以寻求一种较好的鳊和鲫混合数量预测方法。多元线性回归用于揭示被解释变量与多个解释变量之间的线性关系,其数学模型为:
y=β0+β1x1+β2x2+…+βixi+ε
(1)
式(1)中,y为鳊和鲫的混合数量梯度,i为特征序号(i=1,2,…,54),xi为鱼声信号样本特征值,β0为回归常数,βi为偏回归系数,ε为随机误差,且满足如下条件:
(2)
估计回归常数和偏回归系数是多元线性回归分析最关键的任务,常用的估计方法是普通最小二乘法,其基本思想是使每个样本点与回归直线上对应的点在垂直方向上的偏差距离的平方和最小,即:
(yj-β0-β1xj1-β2xj2-…-βixji)2
(3)
式(3)中,j为训练鱼声信号样本序号,N为训练集鱼声信号样本数,N=720。解出β0,β1,β2,…,βi的估计值记为由此得到估计的多元线性回归方程为:
(4)
7) 模型评价标准。选用决定系数R2、调整的决定系数定标均方误差RMSEC、验证均方误差RMSEP和相对分析误差RPD来评价模型性能,其表达式依次为:
(5)
(6)
(7)
(8)
(9)
式(5)~(9)中,M为测试集鱼声信号样本数,n为变量个数,为鳊鱼和鲫鱼数量梯度均值,为数量梯度估计值, yj为数量梯度实际值,本研究中M=180。
鳊和鲫混合数量与提取的54个水声信号特征参数之间的相关分析结果见表1。由表1可知,所提取的特征中有28个特征与鳊、鲫混合数量的相关系数较大,显著性值低于0.05。因此,这些特征与鳊、鲫混合数量显著相关(P<0.05),可以通过这些特征来建立线性模型,估算鳊和鲫的混合数量。同时由表1可知,一阶平均Mel频率倒谱系数与鳊、鲫混合数量相关性均不显著,二阶平均Mel频率倒谱系数中只有x43、x44、x46与鳊、鲫混合数量存在显著相关性,平均Mel频率倒谱系数与鳊、鲫混合数量的相关系数整体上较大,相关性最显著。
将上述相关分析得到的28个特征作为自变量,采用多元线性回归分析建立鳊和鲫混合数量预测模型,并利用t检验来判断各特征值对数量梯度影响的显著性。同时由于不同自变量的单位和数量级不一致,引入了标准化偏回归系数,依据其绝对值大小来判断某个自变量对数量梯度y的重要性,所建数量预测模型参数如表2所示。由表2可知,建立的回归模型中有15个特征对数量梯度y有显著影响(P<0.05),其中x22、x23、x20这3个特征的标准化偏回归系数和t值的绝对值较大,P值均为零,说明其对数量梯度y影响较显著,依次代表了第6、7和3个平均Mel频率倒谱系数,从一定程度上说明平均Mel频率倒谱系数对混合淡水鱼数量预测有重要作用,与上述相关分析的结果相符合。
表1 鳊和鲫混合数量与水声信号特征的相关分析
Table 1 Correlation analysis between the mixed quantities of bream and crucian carp and the characteristics of underwater acoustic signals
xi相关系数RCorrelation coefficient显著性(P)Significancexi相关系数Correlation coefficient显著性(P)Significancex10.2170.000x280.8700.000x20.0230.544x29-0.0590.114x3-0.0020.956x30-0.0170.647x40.2970.000x31-0.0450.230x5-0.0100.782x320.0410.277x60.2610.000x330.0050.897x70.4030.000x340.0530.155x80.6770.000x35-0.0070.850x9-0.0220.519x360.0160.675x100.2320.000x37-0.0380.305x110.3520.000x38-0.0330.370x120.6800.000x390.0130.732x130.4800.000x40-0.0080.822x140.5960.000x410.0300.423x150.5020.000x42-0.0040.912x160.5540.000x430.0880.019x170.5250.000x44-0.1070.004x180.0340.364x450.0170.646x19-0.7520.000x46-0.0750.044x20-0.6880.000x470.0150.678x21-0.7780.000x48-0.0020.958x22-0.6210.000x49-0.0230.532x23-0.4490.000x500.0640.087x240.2710.000x510.0490.189x250.7080.000x520.0310.401x260.7180.000x53-0.0870.020x270.8910.000x540.6090.000
表2 鳊和鲫混合数量预测模型参数
Table 2 Parameters of bream and crucian carp
mixed quantity prediction model
xi偏回归系数Partialregressioncoefficient标准化偏回归系数StandardizedpartialregressioncoefficienttPx2215.857 0.872 16.078 0.000x23-11.746 -0.640 -16.875 0.000x20-9.953 -0.581 -10.984 0.000x4-7.254 -0.415 -5.254 0.000x257.224 0.410 8.287 0.000x19-6.599-0.405 -9.935 0.000x15.1320.335 6.865 0.000x274.0240.218 5.509 0.000x12-8.930 -0.208 -3.803 0.000 x174.034 0.199 8.2200.000x117.375 0.167 2.969 0.003 x24-3.262-0.158 -3.009 0.003 x134.7270.1112.5400.000x541.1060.0574.5040.011x53-0.933-0.041-2.2300.026常量Constant7.69110.3260.000
将鳊和鲫水声信号的180个测试样本特征参数代入所建立的回归方程,得到对应数量梯度的预测值考虑到回归方程计算得到的预测值不是整数,利用Matlab中自带的round函数对预测值进行四舍五入处理,测试样本的实测梯度与预测梯度关系如图2所示。由图2可知,测试样本的实测梯度与预测梯度构成的散点均匀分布在直线y=x上下两侧,说明所建模型预测效果较好。
不同模型结果比较如表3所示。从表3可知,MLR和PLSR模型的均比对应的R2小,这是由于当多元线性回归方程的样本数增多,或者加入了对数量梯度有显著影响的特征时,R2增大,无限趋近于同时考虑了建立回归方程的样本量和自变量的个数产生的影响,更能够准确地反映回归方程对样本数据的拟合程度。因此,本研究选用对模型的预测效果进行评价。同时由表3可得,MLR模型的训练集和测试集分别为0.953和0.950,RMSEC和RMSEP分别为0.921和0.965,PLSR模型的训练集和测试集分别为0.895和0.837,RMSEC和RMSEP分别为1.478和1.692,因此,MLR模型的拟合效果较好,且模型的预测能力和泛化能力较强,同时该模型的相对分析误差RPD为4.492,较PLSR模型偏大,说明该模型较为可靠,适用于淡水鱼混合数量预测。
图2 实测梯度与预测梯度回归分析
Fig.2 Regression analysis of measured
gradient and predictive gradient
表3 不同建模方法比较
Table 3 Comparison of different modeling methods
模型Model训练集 TrainR2R—2RMSEC测试集 TestR—2RMSEPRPDMLR0.954 0.9530.9210.9500.965 4.492 PLSR0.899 0.8951.478 0.837 1.692 2.561
本研究考察了鳊和鲫在数量比为1∶1混合条件下,不同数量的水声信号样本,提取了平均Mel频率倒谱系数、一阶平均Mel频率倒谱系数、二阶平均Mel频率倒谱系数、基于功率谱的主峰频率和主峰值、小波包分解频段能量等54个特征参数,建立鳊、鲫混合数量预测模型。对提取的特征参数进行相关性分析,结果表明,所提取的特征参数中有28个特征参数与淡水鱼混合数量梯度存在相关性,其中平均Mel频率倒谱系数与淡水鱼混合数量的相关性整体上最显著,而二阶平均Mel频率倒谱系数均不显著。分别建立MLR和PLSR预测模型,结果表明MLR法建立的模型性能较好,鳊和鲫混合数量预测模型为0.950,RMSEP为0.965,RPD为4.492。
实际生产中,鱼的声音信号非常微弱,且养殖池的大小及形状、养殖池中的水量变化、水温变化及水的成分变化、室外环境噪音等因素会影响淡水鱼的声音特征,后续将进一步研究鱼声信号与环境噪声的关系以及环境因素对采集声音信号特征的影响,提高该研究方法的适用性。
[1] 巩沐歌,孟菲良,黄一心,等.中国智能水产养殖发展现状与对策研究[J].渔业现代化,2018,45(6):60-66.GONG M G,MENG F L,HUANG Y X,et al.Research on the status quo and countermeasures of intelligent aquaculture development in China[J].Fishery modernization,2018,45(6):60-66(in Chinese with English abstract).
[2] 于鑫,单秀娟,李忠义,等.渤海底拖网主要渔业生物类别时空分布的初步研究[J].南方水产科学,2017,13(2):9-17. YU X,SHAN X J,LI Z Y,et al.Preliminary study on the spatial and temporal distribution of major fishery species in the bottom of the trawling network[J].South China fisheries science,2017,13(2):9-17(in Chinese with English abstract).
[3] KOTWICKI S,RESSLER P H,IANELLI J N,et al. Combining data from bottom-trawl and acoustic trawl surveys to estimate an index of abundance for semipelagic species[J]. Canadian journal of fisheries and aquatic sciences,2018,75(1):60- 71.
[4] 王欢欢,毕福洋,曹敏,等.獐子岛海洋牧场秋季渔业资源声学调查与评估[J].大连海洋大学学报,2018,33(6):802-807.WANG H H,BI F Y,CAO M,et al.Acoustic survey and evaluation of fishery resources in the marine pastures of Zhangzidao[J].Journal of Dalian Ocean University,2018,33(6):802-807(in Chinese with English abstract).
[5] BOLLINGER M A,KLINE R J. Validating sidescan sonar as a fish survey tool over artificial reefs[J].Journal of coastal research,2017,33(6):1397-1407.
[6] PICCIULIN M,BOLGAN M,CORO A B,et al.Sound production by the Shi drum Umbrina cirrosa and comparison with the brown meagre Sciaena umbra:a passive acoustic monitoring perspective[J].Journal of fish biology,2016,88(4):1655-1660.
[7] TU Q Z,HUANG H Y,LI L,et al.Feature extraction and analysis of passive underwater acoustic signals for different species and quantities of freshwater fish[J].Transactions of the ASABE,2018,61(5):1505-1513.
[8] 李路,涂群资,黄汉英,等.基于被动水声信号的淡水鱼种类识别[J].农业机械学报,2017,48(8):166-171. LI L,TU Q Z,HUANG H Y,et al.Freshwater fish identification based on passive underwater acoustic signals[J].Transactions of the Chinese society for agricultural machinery,2017,48(8):166-171(in Chinese with English abstract).
[9] 李路,黄汉英,涂群资,等.单品种淡水活鱼数量的被动声学估计[J].农业机械学报,2018,49(3):328-333.LI L,HUANG H Y,TU Q Z,et al.Passive acoustic estimation of the number of freshwater live fish in single varieties[J].Transactions of the Chinese society for agricultural machinery,2018,49(3):328-333(in Chinese with English abstract).
[10] 任新敏,高大治,姚玉玲,等.大黄鱼的发声及信号特性研究[J].大连水产学院学报,2007,22(2):123-128. REN X M,GAO D Z,YAO Y L,et al.Sound and signal characteristics of big yellow croaker[J].Journal of Dalian Fisheries University,2007,22(2):123-128(in Chinese with English abstract).
[11] 陈振锋,吴蔚澜,刘加,等.基于Mel倒谱特征顺序统计滤波的语音端点检测算法[J].中国科学院大学学报,2014,31(4):524-529.CHEN Z F,WU W L,LIU J,et al.Speech endpoint detection algorithm based on Mel cepstrum feature sequential statistical filtering[J].Journal of the Chinese Academy of Sciences,2014,31(4):524-529(in Chinese with English abstract).
[12] 曹晏飞,陈红茜,滕光辉,等.基于功率谱密度的蛋鸡声音检测方法[J].农业机械学报,2015,46(2):276-280.CAO Y F,CHEN H Q,TENG G H,et al.Detection of laying hens vocalization based on power spectral density[J].Transactions of the Chinese society for agricultural machinery,2015,46(2):276-280 (in Chinese with English abstract).
[13] 张耀平,曹平,高赛红.爆破振动信号的小波包分解及各频段的能量分布特征[J].金属矿山,2007(11):42-47. ZHANG Y P,CAO P,GAO S H.Wavelet packet decomposition of blasting vibration signal and energy distribution characteristics of each frequency band[J].Metal mine,2007(11):42-47(in Chinese with English abstract).
[14] 刘舒,姜琦刚,马玥,等.基于多目标遗传随机森林特征选择的面向对象湿地分类[J].农业机械学报,2017,48(1):119-127.LIU S,JIANG Q G,MA Y,et al.Object-oriented wetland classification based on hybrid feature selection method combining with relief,multi-objective genetic algorithm and random forest[J].Transactions of the Chinese society for agricultural machinery,2017,48(1):119-127(in Chinese with English abstract).
[15] 李培,谭鹤群,张伟健,等.基于传感器阵列多特征优化融合的鱼粉品质检测[J].华中农业大学学报,2019,38(6):163-170. LI P,TAN H Q,ZHANG W J,et al.Detecting fishmeal quality based on multi-feature optimization fusion of sensor array[J].Journal of Huazhong Agricultural University,2019,38(6):163-170(in Chinese with English abstract).
[16] 王胜鹏,郑鹏程,龚自明,等.基于近红外光谱技术的茶鲜叶海拔高度判别模型建立[J].华中农业大学学报,2018,37(1):89-94.WANG S P,ZHENG P C,GONG Z M,et al.Establishment of discrimination model for different elevation fresh tea leaves based on near infrared spectroscopy [J].Journal of Huazhong Agricultural University,2018,37(1):89-94(in Chinese with English abstract).
[17] 仇瑞承,苗艳龙,张漫,等.基于线性回归的玉米生物量预测模型及验证[J].农业工程学报,2018,34(10):131-137.QIU R C,MIAO Y L,ZHANG M,et al.Modeling and verification of maize biomass based on linear regression[J].Transactions of the Chinese society of agricultural engineering,2018,34(10):131-137(in Chinese with English abstract).
[18] 段丽君,张海涛,郭龙,等.典型柑橘种植区土壤有机质空间分布与含量预测[J].华中农业大学学报,2019,38(1):73-81.DUAN L J,ZHANG H T,GUO L,et al.Spatial distribution and content prediction of soil organic matter in typical citrus growing areas[J].Journal of Huazhong Agricultural University,2019,38(1):73-81(in Chinese with English abstract).