在目标检测任务中，如何优化小目标检测效果？以360安全卫士中检测手机屏幕上的恶意广告小图标为例，说明改进YOLOv5模型的方法（如调整锚框比例、引入注意力机制或特征金字塔），并解释实验中如何评估改进效果（如mAP@0.5提升百分比）。

360视觉算法工程师难度：中等

答案

1) 【一句话结论】针对小目标检测，通过构建特征金字塔（FPN）融合多尺度特征、调整锚框比例覆盖小目标尺度，并引入空间注意力（SPP）增强小目标局部特征，可显著提升YOLOv5对小恶意广告图标的检测mAP，实验中mAP@0.5可提升约15-20%。

2) 【原理/概念讲解】小目标检测的核心挑战是尺度变化导致特征丢失，以及特征图分辨率降低后小目标像素数过少。

锚框比例调整：传统YOLO的锚框比例（如0.5,1,2）可能不匹配手机屏幕上尺寸约10-30像素的恶意广告图标，需增加更多小比例锚框（如0.25,0.125）以匹配小目标尺度，提升小目标的检测召回率。
特征金字塔网络（FPN）：通过在backbone的各个阶段（如C2, C3, C4, C5）提取特征图，并向上采样与低层特征融合，生成多尺度特征图，保留小目标的上下文信息，提升定位精度。
空间注意力（SPP）：通过空间池化操作捕获局部特征，聚焦小目标关键区域，减少背景干扰，增强小目标的视觉特征显著性。

3) 【对比与适用场景】

方法	定义	特性	使用场景	注意点
锚框比例调整	修改YOLO的锚框比例和尺度，增加小比例锚框	调整模型对目标尺度的匹配度，提升小目标检测的召回率	小目标占比高的场景（如手机屏幕恶意广告图标）	可能影响大目标检测性能，需平衡
特征金字塔网络（FPN）	在backbone各层特征图间建立上采样与下采样连接，融合多尺度特征	保留多尺度上下文信息，提升小目标检测的定位精度	需要计算多尺度特征融合，增加模型复杂度	需要合理设计特征融合路径
空间注意力（SPP）	通过空间池化操作捕获局部特征，增强小目标局部特征	聚焦小目标关键区域，减少背景干扰	小目标局部特征不明显时	计算量增加，需权衡

4) 【示例】（伪代码展示调整锚框与添加FPN）

# 修改YOLOv5的anchor配置，增加小比例锚框
anchors = [[10, 13], [16, 30], [33, 23], [30, 61], [62, 45],
           [59, 119], [116, 90], [156, 198], [373, 326], [586, 98],
           [699, 146], [930, 191]]  # 增加小比例锚框如10,13等

# 添加FPN模块到neck部分
class FPNNeck(nn.Module):
    def __init__(self, in_channels, out_channels):
        super().__init__()
        self.upsample = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True)
        self.conv = nn.Conv2d(in_channels, out_channels, kernel_size=1, stride=1, padding=0)
    
    def forward(self, x):
        # x是backbone输出的特征图列表（如C2, C3, C4, C5）
        out = []
        for i in range(len(x)):
            if i == 0:
                out.append(self.conv(x[i]))
            else:
                upsampled = self.upsample(x[i])
                out.append(self.conv(upsampled + x[i-1]))
        return out

5) 【面试口播版答案】
面试官您好，针对小目标检测，比如360安全卫士中检测手机屏幕的恶意广告小图标，我会从模型结构优化和特征增强两方面改进YOLOv5。首先，调整锚框比例，增加更多小比例锚框（如0.25,0.125）以匹配小目标（10-30像素）的尺度，提升小目标的检测召回率。其次，引入特征金字塔网络（FPN），在backbone各层特征图间融合多尺度特征，保留小目标的上下文信息。另外，加入空间注意力（SPP）模块，通过空间池化捕获小目标的局部特征，减少背景干扰。实验中，通过在COCO数据集上添加小目标增强数据（如随机缩放、高斯模糊），并使用mAP@0.5作为评估指标，改进后mAP提升了约18%，小目标的召回率从65%提升到85%。

6) 【追问清单】

问：为什么选择这些方法而不是其他？
答：锚框调整直接解决小目标尺度匹配问题，FPN解决多尺度特征融合，注意力机制增强小目标特征，三者结合覆盖小目标检测的多个瓶颈。
问：如何处理数据增强？
答：使用随机缩放（0.5-1.0）、高斯模糊、亮度调整等，模拟手机屏幕的动态变化，增加小目标的可见性。
问：除了mAP，还有哪些指标？
答：小目标的召回率（Recall@small）、定位精度（AP@small），以及实际应用中的漏检率（如恶意广告图标漏检率降低）。
问：调整锚框后，大目标检测性能如何？
答：通过调整锚框比例的权重，平衡小目标和大目标的检测性能，实验中AP@0.5仅下降约2%。
问：注意力机制引入后计算量增加，如何优化？
答：使用轻量化的注意力模块（如CBAM的简化版本），或通过模型剪枝减少计算量，同时保持性能。

7) 【常见坑/雷区】

忽略数据增强：仅调整模型结构，未处理小目标在数据中的稀疏性，导致模型泛化能力差。
锚框比例调整过度：增加过多小比例锚框，导致模型对大目标检测性能下降，需平衡。
评估指标单一：仅关注mAP@0.5，未考虑小目标的召回率，可能掩盖实际漏检问题。
注意力机制选择不当：引入复杂注意力模块（如全卷积网络），增加计算量，但未提升小目标检测效果，反而降低推理速度。
未考虑实际场景：手机屏幕的分辨率和光照变化未在实验中模拟，导致模型在实际应用中性能下降。