天长街道两学一做网站,成都疫情最新情况,微信做模板下载网站有哪些内容,网站开发导向图Lift, Splat, Shoot
这是一个端到端架构#xff0c;直接从任意数量的摄像头数据提取给定图像场景的鸟瞰图表示。将每个图像分别“提升#xff08;lift#xff09;”到每个摄像头的视锥#xff08;frustum#xff09;#xff0c;然后将所有视锥“投放#xff08;splat直接从任意数量的摄像头数据提取给定图像场景的鸟瞰图表示。将每个图像分别“提升lift”到每个摄像头的视锥frustum然后将所有视锥“投放splat”到光栅化的鸟瞰图网格中。这里要学习的是如何表示图像以及如何将所有摄像机的预测融合到场景的单个拼接表示同时又能抵抗标定误差。为学习运动规划的密集表示这里模型推断的表示“捕捉shoot”模板轨迹到网络输出的鸟瞰损失图从而实现可解释的端到端运动规划。
本文采用像素级深度分布将图像特征映射到BEV上。输入图像HW3 D代表离散深度维度对于每个像素都有 (h,w,d) 这样我们模型预测结果 HWD 。同时对每个像素都会提取出长度为c的向量和一个深度分布 的向量 为归一化的c维度的特征在D维度上进行重复并乘上对应的 值得到下图。 每个像素深度值得到一个 (x,y,z) 点再像pointpillar一样处理每个点落在最近的pillar上在高程上求sum pooling。整个过程可以通过像OFT中的积分表来进行加速。不同相机之间通过外参depth来对齐。
lift是提升即像pointpillar中特征通过pointnet来提升维度splat为投放即将特征放在BEV上。