如何找到专业的番禺网站建设公司来定制适合山东企业的网站方案?

摘要:山东网站建设方案制作,番禺做网站企业,菏泽网站建设菏泽,抖音创作者服务平台1. 解决了什么问题? 单帧数据包含的信息很有限,制约了目前基于视觉的多相机 3D 目标检测方法的性能&a
山东网站建设方案制作,番禺做网站企业,菏泽网站建设菏泽,抖音创作者服务平台1. 解决了什么问题#xff1f; 单帧数据包含的信息很有限#xff0c;制约了目前基于视觉的多相机 3D 目标检测方法的性能#xff0c;尤其是关于速度预测任务#xff0c;要远落后于基于 LiDAR 和 radar 的方法。 2. 提出了什么方法#xff1f; BEVDet4D 将 BEVDet 方法从…1. 解决了什么问题 单帧数据包含的信息很有限制约了目前基于视觉的多相机 3D 目标检测方法的性能尤其是关于速度预测任务要远落后于基于 LiDAR 和 radar 的方法。 2. 提出了什么方法 BEVDet4D 将 BEVDet 方法从 3D 扩展到时间空间的 4D 范畴。作者改进了 BEVDet 框架在当前帧的特征中融合了之前帧的特征只增加了少量的计算成本。BEVDet4D 简化了速度预测问题将其看作为相邻帧特征之间的位置偏移预测问题。如下图它保留了之前帧的 BEV 特征将其与当前帧的特征通过空间对齐与 concat 操作融合。 2.1 网络结构 BEVDet 包括 4 个模块image-view encoder、view transformer、BEV encder、task-specific head。为了融入时间信息BEVDet4D 保留了 view transformer 对之前帧生成的特征。然后进行对齐和当前帧的特征完成融合。View transformer 生成的特征对于后续模块来说过于稀疏、粗糙。因此在时域融合操作前有一个调整候选特征的 BEV 编码器包括 2 个残差单元通道数和输入特征数一致。 2.2 Simplify the Velocity Learning Task 符号定义 全局坐标系为 O g − X Y Z O_g - XYZ Og​−XYZ自身坐标系为 O e ( T ) − X Y Z O_{e(T)}-XYZ Oe(T)​−XYZ目标坐标系为 O t ( T ) − X Y Z O_{t(T)}-XYZ Ot(T)​−XYZ。如上图作者构建了一个虚拟场景包括一辆运动中的 ego 车辆和两个目标车辆。在世界坐标系内一个目标车辆是静止的即 O s − X Y Z O_s-XYZ Os​−XYZ绿色框一个目标车辆是运动状态的即 O m − X Y Z O_m-XYZ Om​−XYZ蓝色框。两个相邻帧第 T − 1 T-1 T−1帧和第 T T T帧的物体通过透明度区分。物体的位置表示为 P x ( t ) \text{P}^x(t) Px(t) x ∈ { g , e ( T ) , e ( T − 1 ) } x\in\lbrace g,e(T),e(T-1)\rbrace x∈{g,e(T),e(T−1)}表示坐标系。 t ∈ { T , T − 1 } t\in\lbrace T,T-1\rbrace t∈{T,T−1}表示时间戳。 T s r c d s t \text{T}^{dst}_{src} Tsrcdst​表示从源坐标系到目标坐标系的变换。 本文方法不是直接预测目标的速度而是预测相邻帧之间目标物体的平移量。排除了时间因素任务就简化了根据两个 BEV 特征间的差异就可计算出位置的移动。此外该方法学习的位置移动与 ego 车辆自身的运动是没有关系的因为 ego 的运动会让目标物体位置移动的分布变得很复杂。 如上图所示由于 ego 的运动原本在世界坐标系是静止的物体在 ego 坐标系就成了运动的了。View transformer 对两个相邻帧生成特征由于 ego 运动它们在世界坐标系的感受野是不同的。一个静止物体在前后两帧的世界坐标系位置是 P s g ( T ) \text{P}_s^g(T) Psg​(T)和 P s g ( T − 1 ) P_s^g(T-1) Psg​(T−1)。
阅读全文