如何通过网站点击率在短视频平台上推广牙科服务?
摘要:网站点击排名,能下短视频网站做牙,怎么自己购买域名 建设网站,一份完整的网站策划书标题:GraphFPN: Graph Feature Pyramid Network for Object Detection
网站点击排名,能下短视频网站做牙,怎么自己购买域名 建设网站,一份完整的网站策划书标题#xff1a;GraphFPN: Graph Feature Pyramid Network for Object Detection 会议#xff1a;ICCV2021 论文地址#xff1a;https://ieeexplore.ieee.org/document/9710561/
Abstract
特征金字塔已经被证明在需要多尺度特征的图像理解任务中是强大的。SOTA的多尺度特征…标题GraphFPN: Graph Feature Pyramid Network for Object Detection 会议ICCV2021 论文地址https://ieeexplore.ieee.org/document/9710561/
Abstract
特征金字塔已经被证明在需要多尺度特征的图像理解任务中是强大的。SOTA的多尺度特征学习方法侧重于使用具有固定拓扑结构的神经网络进行跨空间和跨尺度的特征交互。在本文中我们提出了图特征金字塔网络它能够调整其拓扑结构以适应不同的内在图像结构并支持在所有尺度上同时进行特征交互。我们首先为每个输入图像定义一个特定于图像的超像素层次结构来表示其内在的图像结构。图特征金字塔网络的结构继承了这个超像素层次结构。上下文层和层次层旨在实现同一尺度内和不同尺度间的特征交互。contextual层和hierarchical层旨在实现同一尺度内和不同尺度间的特征交互。为了使这些层更加powerful我们通过推广卷积神经网络的全局通道注意力为图神经网络引入了两种类型的局部通道注意力。提出的图特征金字塔网络可以增强来自卷积特征金字塔网络中的多尺度特征。我们通过将图特征金字塔网络集成到Faster R-CNN算法中来在目标检测任务中进行评估。在MS-COCO 2017验证和测试数据集上改进的算法不仅优于SOTA的基于特征金字塔的方法而且优于其他流行的检测方法。
1. Introduction
深度卷积神经网络利用局部连通性和权重共享在计算机视觉任务中取得了一系列突破性进展包括图像识别、目标检测、语义分割等。由于图像中的目标可能具有不同的尺度因此需要在每个不同的尺度上获得具有足够空间分辨率的高层和低层特征融合后的多尺度特征图。这启发了特征金字塔网络FPN及其改进版本如路径聚合网络PANet和特征金字塔转换器FPT等。 每幅图像都具有多尺度的内在结构包括将像素分组为目标部分、将部分进一步分组为目标以及图像空间中目标的空间布局。这种多尺度内在结构因图像而异可以为图像理解和目标识别提供重要线索。但是FPN及其相关方法总是使用与图像内在结构无关的固定的多尺度网络拓扑结构即神经元的2D网格。这种固定的网络拓扑结构对于多尺度特征学习可能不是最优的。根据心理学的证明人类将视觉场景解析为部分-整体的层次结构对不同图像中的部分-整体关系进行动态建模。受此启发研究人员开发了一系列“胶囊”模型用于描述图像特定区域中特定类型的出现。层次结构的分割可以根据超像素的位置和相似度递归地对超像素进行分组生成超像素层次结构。这样一个部分-整体的层次结构可以通过弥补像素和目标之间的语义差距来辅助目标检测和语义分割。 众所周知特征金字塔中的多尺度特征可以通过跨尺度交互以及同一尺度内的交互来增强。现有特征金字塔网络相关方法的另一个局限性是只有来自相邻尺度的特征是直接交互的而来自非相邻尺度的特征则是通过其它的中间尺度间接交互。这一方面是因为匹配相邻两个尺度的分辨率最为方便另一方面是因为现有的交互机制一次处理两个尺度最为方便。相邻尺度之间的交互通常遵循自顶向下或自底向上的顺序。在现有的方案中位于金字塔顶端的最高层特征需要经过多个中间尺度传播并与这些尺度下的特征交互后才能到达金字塔底端的特征。在这种传播和交互过程中精髓的特征信息可能丢失或减弱。 在本文中我们提出了图特征金字塔网络来克服上述限制因为图网络能够适应输入图像的不同内在结构并且支持跨所有尺度同时的特征交互。我们首先为输入图像定义一个超像素层次结构。这个超像素层次结构有多个层次每个层次由一组不重叠的超像素组成定义了输入图像的一个分割。从输入图像的同一层次结构分割中提取层次结构的各层分割。因此层次结构中相邻两个层次的超像素是密切相关的。粗粒度上的每个超像素是细粒度上超像素的并集。超像素在两个层次上的这种一对多的对应关系定义了上述部分-整体关系也可以称为祖先-后代关系。层次结构分割及其派生的超像素层次结构揭示了图像的内在结构。虽然超像素对图像进行了过度分割但同一超像素中的像素通常属于同一语义目标/部分并不会跨越语义目标/部分的边界。
