深度学习技术在动物目标检测识别的研究现状

本文引用格式

郭阳阳, 杜书增, 乔永亮, 梁栋. 深度学习在家畜智慧养殖中研究应用进展[J]. 智慧农业（中英文）, 2023, 5(1): 52-65. doi:10.12133/j.smartag.SA202205009

GUO Yangyang, DU Shuzeng, QIAO Yongliang, LIANG Dong. Advances in the Applications of Deep Learning Technology for Livestock Smart Farming[J]. Smart Agriculture, 2023, 5(1): 52-65. doi:10.12133/j.smartag.SA202205009

知网阅读全文

官网免费阅读全文

深度学习技术在动物目标检测识别的研究现状

动物目标检测识别已成为畜牧业的组成部分，是实现现代精细化科学畜牧业的必由之路。在智慧畜牧中，可做到及时检测动物目标，确定动物个体身份并获取相关信息，建立动物个体档案，为数字化管理和畜牧产品溯源提供信息支撑。

目前通常通过给动物赋予一个独特的标识符或标志来检测识别动物个体。其中，最常见的方法是采用塑料耳标或射频识别设备来标识动物个体，但该方法存在设备损坏或丢失以及碰撞等外界的干扰问题。近年来，随着信息技术的发展，基于计算机视觉技术的目标检测识别方法由于具有非接触性和实用性等优点而被广泛应用于牲畜识别研究中，通常基于目标样本的视觉特征（如形状、纹理、颜色等），结合智能算法实现目标检测识别。动物个体检测识别的常用样本图像包括口鼻、面部、躯干等区域，并基于区域特征信息来实现个体检测识别（图1）。

图1 家畜常用的目标检测区域

Fig. 1 Common target detection area for livestock

1 脸部检测识别

基于深度学习的非接触式动物检测识别能够有效减轻畜牧场压力并推动精细化科学养殖业的发展。近期研究人员利用深度学习算法实现了猪、羊、牛等动物脸部的无接触高效检测识别。

李向宇和李慧盈利用相似度较高的猪脸匹配数据集训练形变卷积神经网络（Deformable Convolution Networks，DCN），得到形变后的猪脸数据集，并使用形变猪脸数据集对脸部特征点检测神经网络模型（Tweaked Convolutional Neural Network，TCNN）进行微调，得到猪脸特征点检测模型，用该方法进行猪脸特征点检测，错误率仅为5.60%。何屿彤等在YOLOv3模型引入密连块和SPP（Spatial Pyramid Pooling）模块，提出YOLOv3DBSPP（YOLOv3-DenseBlock-SPP）模型来检测识别猪只，实现了90.18%的平均精度，并且当感兴趣区域阈值为0.5、分类概率阈值为0.1时，模型的平均精度均值比YOLOv3模型高9.87%。魏斌等将YOLOv3算法检测到的羊脸作为个体识别的数据，利用VGGFace模型训练后取得了64%左右的识别准确率；选取正面羊脸作为输入数据训练VGGFace模型时，得到了91%以上的识别准确率。Xue等提出了一种基于欧式空间度量的绵羊脸部检测识别方法（SheepFaceNet），利用自然环境下的羊脸图像样本对网络进行训练，以实现非接触式绵羊身份识别。此外，其针对羊脸图像中无效信息多、羊脸姿势和角度差的问题，提出羊脸检测与校正（SheepFaceRepair）方法，使绵羊面部区域对齐，最后利用SheepFaceNet实现羊脸的识别。Li等将Mobilenetv2与Vision Transformer结合，提出了一种名为MobileViTFace的羊脸检测识别模型。该模型增强了模型提取细粒度特征的能力，并通过Transformer抑制背景信息的干扰，从而更有效地区分不同的羊脸。Kumar等开发了一种基于奶牛口鼻图像样本的个体识别深度学习网络模型，采用CNN和深度信念网络（Deep Belief Nets，DBN）提取一组纹理特征并表示牛的口鼻图像，通过堆叠降噪自动编码器技术（Stacked Denoising Auto Encoder，SDAE）对提取的图像特征进行编码，优于基于口鼻图像数据库识别牛的最先进方法。

2 整体及关键区域检测识别

在智慧畜牧领域中，进一步对动物整体以及关键区域的检测识别将有利于更深层次的挖掘动物信息，比如腿部与躯干间的位置关系，腿部间的相对关系等，可以反映出动物健康信息，而基于深度学习在这一方面的信息挖掘研究仍需进一步探索。Qiao等提出了一种基于图像序列的肉牛个体识别的深度学习模型。通过CNN网络从图像序列中提取视觉特征，然后将这些提取的特征用于训练LSTM以捕获时空信息并识别牛只个体，在15帧和20帧视频长度上分别达到了88%和91%的准确率。何东健等提出了一种改进的YOLOv3模型用于奶牛个体识别，在奶牛背部图像数据集中改进的YOLOv3模型的奶牛个体识别准确率为95.91%，平均帧率为32 f/s，可快速识别奶牛个体。Hu等采用YOLO模型从原始图像中检测并分割出奶牛区域，并将检测到的奶牛对象分割成三个部分，即头部、躯干和腿部，通过训练三个独立的CNN网络从这三个部分中提取深层特征，并设计了特征融合模型获取最终特征，最后通过支持向量机（Support Vector Machines，SVM）分类器来识别每一头奶牛，实现了98.36%的奶牛识别准确率。Jiang等提出了一种FLYOLOv3（FilterLayer YOLOv3）深度学习框架，实现了复杂场景下奶牛个体关键区域的检测（如躯干、腿和头部），并在白天和夜间数据集上进行了验证，均取得了较好的检测结果。

3 无人机图像目标检测

放牧养殖的畜牧场地由于活动范围较大，往往使用无人机（Unmanned Aerial Vehicle，UAV）航拍并监测牲畜活动信息。而基于UAV的动物监测，虽然目前UAV硬件处理速度得到很大的改善，但算法性能仍会影响基于UAV实时检测的效果，而深度学习可以满足这一需求。Andrew等首先在无人机航拍视频数据基础上，通过区域卷积神经网络R-CNN和核相关滤波算法（Kernel Correlation Filter，KCF）实现荷斯坦奶牛的个体检测和跟踪，再通过Inception V3-LSTM网络结构实现奶牛的个体识别，最终识别准确率为98.1%。Shao等和Barbedo等通过CNN网络模型在UAV图像上实现了奶牛的目标检测和个数统计。

以上研究表明，深度学习技术应用于UAV图像的目标检测识别是可行的，且将深度学习技术应用于其他硬件设备（机器人、地面车辆等）构建智能化监测系统也是未来发展的主要趋势之一。

4 小结

尽管深度学习技术已经在动物检测识别领域取得进展，但仍存在一些问题，比如缺乏基准数据集和评估标准。由于研究使用的数据集、预处理技术、指标和模型不同，因此对现有方法进行比较得到的结果并不完全合理。具体来说，目标检测的结果好坏与样本有直接关系，对于样本中只包含单个个体或目标相对比较突出时，目标检测以及个体识别准确率高，但目标区域检测和特征提取方法的选择也会直接影响最终的检测结果，且外界环境（光照强度、遮挡等）以及拍摄角度和图像质量都会影响检测结果。故通过多角度构建样本集来实现目标检测与个体识别仍需要进一步探索。例如基于脸部的个体识别研究，大多数数据集是脸正面拍摄的图像，然而头部也会呈现多角度的情况，且实际需求中更希望在现场或远程监控视频时，随机抓取一幅图像即可检测并识别牛只个体，以及个体其他的相关信息。因此，需要构建更为复杂的样本集（多角度、昼夜）等来模拟实际饲养中的场景，构建可应用于不同场景的智能算法，并进一步开发高效精准及方便操作的检测与识别系统。

智慧农业微信交流服务群

为方便农业科学领域读者、作者和审稿专家学术交流，促进智慧农业发展，为更好地服务广大读者、作者和审稿人，编辑部建立了微信交流服务群，有关专业领域内的问题讨论、投稿相关的问题均可在群里咨询。入群方法：加小编微信331760296，备注：姓名、单位、研究方向，小编拉您进群，机构营销广告人员勿扰。

深度学习技术在动物目标检测识别的研究现状

发布征集

欢迎在我公众号发布科研团队介绍、创新科研成果及相关活动等信息。

深度学习技术在动物目标检测识别的研究现状

继续阅读

联调联试！检测列车最高时速达385公里！

留学生被“控制” 40 多天，吃饭学习全程“直播”

国家级中医药继续教育项目“中医药保髋诊疗股骨头坏死新进展学习班”在郑举办

兴奋剂检测阳性！19岁花滑天才少女遇麻烦，新葱桶组合提前陨落

【党纪学习教育】为官公罪、私罪都不可有

学习贯彻党的二十届三中全会精神丨健全宏观经济治理体系

父母想让初高中孩子主动去学习，记住这个沟通和应对原则，很好用

男子称花346.8万买兰博基尼仅两个月就出故障，送修超30日要求退车！厂家：是检测而非维修

田静发了两孩子学习的作品！结果一切都是为了卖货

武城县学习贯彻党的二十届三中全会精神宣讲进基层走进武城经济开发区

学习行政处罚法第十七条

主打一个学习陪伴！多亲C23防沉迷学生手机体验

可爱的猫咪手绘线稿，供临摹学习

精准“算病”！AI检测癌症准确率高达94%，未来人类不再谈癌色变？

动物界的“造粪冠军”：河马粪便的生态影响之谜。

这两天一个大学生朋友和我私下聊天，讲述他和大学辅导员老师的故事[捂脸]他大三，女辅导员33岁已婚，两地分居状态。他和她因