YOLO26最新创新改进系列引入 CVPR2026 FAAFusion普通目标检测获得方向鲁棒性傅里叶主方向估计与特征对齐机制用于特征增强创新性强YOLO26 改进 | 引入 CVPR2026 FAAFusionFourier Angle Alignment到 Backbone、Neck、Head 三类网络改进本文基于ultralytics26-main8将 CVPR2026Fourier Angle Alignment for Oriented Object Detection in Remote Sensing中的 FAAFusion / Fourier Angle Alignment 改进思路迁移到 YOLO26 目标检测任务。1. 论文与代码出处类型链接arXiv 原文https://arxiv.org/abs/2602.23790论文核心思想旋转目标检测中角度预测容易受周期性、边界不连续等问题影响。FAA 使用傅里叶频域特征估计主方向使特征在方向维度上更加一致。本文适配策略保留 YOLO26Detect输出为水平框。将傅里叶主方向估计与特征对齐机制用于特征增强。让普通目标检测获得方向鲁棒性而不改变数据标注格式和损失格式。2. 网络结构图2.1 总览图2.2 Neck 对比图2.3 Backbone 对比图2.4 Head 对比图3. FAAFusion 原理说明3.1 傅里叶主方向估计对于输入特征x ∈ R(B,C,H,W)先计算特征能量图energy_mapx.pow(2).mean(1)对能量图做二维 FFTspectrumabs(fftshift(fft2(energy_map)))在频域中使用极坐标角度θ和频率半径ρ计算主方向cos2Σ spectrum*ρ*cos(2θ)sin2Σ spectrum*ρ*sin(2θ)angle0.5*atan2(sin2,cos2)这里使用2θ是因为方向是轴向的θ和θ π表示同一方向。3.2 特征方向对齐得到当前特征角度θ_x和参考特征角度θ_ref后deltawrap_pi(theta_ref-theta_x)然后通过affine_grid grid_sample对特征进行轻量旋转对齐。为了避免训练初期扰动过大加入可学习残差缩放outxgamma*local_conv(aligned-x)其中gamma初始值为1e-3。4. 三个模块的具体改进4.1 Neck 改进FAAFusionConcat改动位置文件ultralytics/cfg/models/26/yolo26-FFAFusion-Neck.yaml原 YOLO26 Neck 中的四个 PAN 融合节点[[-1,6],1,Concat,[1]][[-1,4],1,Concat,[1]][[-1,13],1,Concat,[1]][[-1,10],1,Concat,[1]]替换为[[-1,6],1,FFAFusionConcat,[1,7,32,0.001]][[-1,4],1,FFAFusionConcat,[1,7,32,0.001]][[-1,13],1,FFAFusionConcat,[1,7,32,0.001]][[-1,10],1,FFAFusionConcat,[1,7,32,0.001]]参数含义参数含义1channel 维拼接7FAA 局部对齐卷积核大小32中间通道数0.001残差层缩放初始值Neck 融合前后对比对比项原 YOLO26 NeckFAAFusion Neck融合方式直接 Concat先傅里叶角度对齐再 Concat多尺度方向一致性无显式处理显式对齐不同尺度方向输出通道数sum(ch)保持sum(ch)对下游结构影响原生下游C3k2不需要修改优点简单快速更适合方向变化明显、斜向目标、纹理方向强的数据为什么会涨点Neck 是 YOLO26 多尺度特征融合最核心的位置。普通Concat会把不同尺度特征直接堆叠如果不同尺度对同一目标的方向响应不一致后续卷积需要额外学习对齐。FAAFusionConcat 在拼接前先做傅里叶角度对齐可以减少方向错配提高多尺度特征的一致性。4.2 Backbone 改进FFAFusionBlock改动位置文件ultralytics/cfg/models/26/yolo26-FFAFusion-Backbone.yaml新增三处 Backbone 特征增强-[-1,1,FFAFusionBlock,[512,7,32,0.001,0.5]]# P3 FAA refinement-[-1,1,FFAFusionBlock,[512,7,32,0.001,0.5]]# P4 FAA refinement-[-1,1,FFAFusionBlock,[1024,7,32,0.001,0.5]]# P5 FAA refinementBackbone 融合前后对比对比项原 YOLO26 BackboneFAA BackboneP3/P4/P5 输出直接送入 Neck先做 Fourier Angle Alignment方向鲁棒性依赖普通卷积学习显式估计主方向并对齐训练稳定性原始结构稳定使用gamma1e-3残差缩放优点轻量简单提前增强方向一致性降低 Neck 融合压力为什么可能涨点Backbone 决定特征金字塔的基础质量。P3 偏细节P4 偏中尺度结构P5 偏语义。对这些关键输出做 FAA refinement可以让送入 Neck 的特征已经具备更好的方向一致性尤其适合道路、车辆、船舶、遥感建筑等存在明显方向变化的目标。4.3 Head 改进FFAFusionDetect改动位置文件ultralytics/cfg/models/26/yolo26-FFAFusion-Head.yaml原检测头-[[16,19,22],1,Detect,[nc]]替换为-[[16,19,22],1,FFAFusionDetect,[nc,7,32,0.001]]Head 融合前后对比对比项原 DetectFFAFusionDetect检测输出水平框水平框保持不变预测前特征直接进入 box/cls tower先做 FAA refinement损失函数原 YOLO26 Detect不改变数据格式普通检测数据不改变优点稳定局部改动小预测前增强方向感知为什么可能涨点Head 直接决定分类置信度和边界框回归质量。FFAFusionDetect 在预测前对 P3/P4/P5 分别做傅里叶角度对齐增强不改变 YOLO26 的检测输出和损失函数因此是三种改法里最局部、最容易做消融的一种。5. 写在最后学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通关注UPAi学术叫叫兽在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑本up主获得过国奖发表多篇SCI擅长目标检测领域拥有多项竞赛经历拥有软件著作权核心期刊等经历。因为经历过所以更懂小白的痛苦因为经历过所以更具有指向性的指导祝所有科研工作者都能够在自己的领域上更上一层楼6. 绘图代码资源以下为给大家庭小伙伴们免费更新的绘图代码均配有详细教程超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注UPAi学术叫叫兽