YOLO算法改进Backbone系列之:Fcaformer

作者：Nuist目标检测 2024-04-13 14:50:00

目前，设计更高效视觉Transformer的一个主要研究方向是通过采用稀疏注意力或使用局部注意力窗口来降低自我注意力模块的计算成本。相比之下，我们提出了一种不同的方法，旨在通过密集注意力模式来提高基于变换器的架构的性能。具体来说，我们为混合视觉转换器（FcaFormer）提出了前向交叉注意，即在同一阶段二次使用前一个区块的标记。为了实现这一目标，FcaFormer 利用了两个创新组件：可学习比例因子（LSFs）和标记合并与增强模块（TME）。LSFs 可以高效处理交叉令牌，而 TME 可以生成有代表性的交叉令牌。通过整合这些组件，拟议的 FcaFormer 增强了具有潜在不同语义的标记块之间的交互，并鼓励更多信息流向下层。

基于前向交叉注意力（Fca），我们设计了一系列 FcaFormer 模型，在模型大小、计算成本、内存成本和准确性之间实现了最佳权衡。例如，无需通过知识蒸馏来加强训练，我们的FcaFormer就能在Imagenet上实现83.1%的top-1准确率，而且只需1630万个参数和约36亿个MAC。与经过提炼的 EfficientFormer 相比，这节省了近一半的参数和少量计算成本，同时还提高了 0.7% 的准确率。

FcaFormer模型的整体结构如下图：

在YOLOv5项目中添加模型作为Backbone使用的教程：

（1）将YOLOv5项目的models/yolo.py修改parse_model函数以及BaseModel的_forward_once函数

（2）在models/backbone（新建）文件下新建fcaformer.py，添加如下的代码：

（3）在models/yolo.py导入模型并在parse_model函数中修改如下（先导入文件）：

（4）在model下面新建配置文件：yolov5_fcaformer.yaml

（5）运行验证：在models/yolo.py文件指定--cfg参数为新建的yolov5_fcaformer.yaml

YOLO算法改进Backbone系列之:Fcaformer

继续阅读

“深色适配系列”手机壁纸

高县罗场镇幼儿园开展“安全生产月”系列活动

华为Mate 60 Pro系列价格松动，512GB低至6498元，依旧值得买

iPhone 16 系列尺寸曝光，全系 A18 处理器，NPU 性能或超 M4

自2024年7月1日起加州将实施一系列新法案

草根春秋系列走进故宫（六）参观皇极殿珍宝馆

意大利Columbus首艘Atlantique 43系列游艇交付

手机壁纸锁屏｜夏日沙滩系列（3）

华为7月将发布至少4款新品，久未更新的Sound X系列音箱也将亮相

传Redmi Note 14系列有三款机型全系OLED LCD党哭了

TCL 50系列四款机型价格与配置公布最低不到600元

华为不要太离谱，友商要怎么办！！！听说接下来的华为nova13系列非常强，潜望长焦、纯血鸿蒙都安排上了，中端机估计要变天

#头条创作挑战赛##如何抓住卒中“黄金抢救4.5小时”？#脑卒中的最佳救治时间为4.5小时以内，如果延误就诊超过4.5小

把不忙不闲的工作做得出色，把不咸不淡的生活过得精彩｜山峰系列#手机壁纸##壁纸##图片##头条##壁纸|头像|背景图##

专治熊孩子系列，评论区分享看完太解气了！网友：上梁不正下梁歪

肯爷爷又又又发券啦❗9.9实现气泡咖啡自由肯爷爷这周又发券啦❗冰橙橙气泡咖啡系列凭🏷️全部只要💰9.9😍我和小伙伴一人点